$ loading_
抓取并清洗网站内容,分块索引到 Azure AI Search 供全文检索。
复制安装指令,让 AI 自动完成配置 · 推荐新手
"Website Scraper MCP Server" 暂无可直接复制的安装信息,请查看页面文档或源码仓库。
请抓取 https://example-docs.com 的全部公开文档页面,清洗导航与页脚内容,按语义分块后建立可检索索引,并返回抓取统计、失败链接和索引摘要。
得到文档站的清洗文本索引、抓取结果统计、失败页面列表与可用于检索的结构化数据。
抓取这三个竞品官网的博客和功能介绍页,去重并清洗正文,按主题分块后写入 Azure AI Search,方便后续按关键词和语义检索对比。
生成可检索的竞品内容索引,便于后续分析功能定位、话术差异与内容覆盖情况。
爬取公司帮助中心和 FAQ 页面,移除重复与无关模块,按问答和段落切分内容,建立 Azure AI Search 索引,并输出适合 RAG 使用的字段结构建议。
得到适合 AI 检索增强生成使用的网站知识库索引,以及推荐的字段和分块方案。
抓取网页并提取为 Markdown,支持分段读取长页面内容