$ loading_
帮助用户礼貌抓取网页并提取链接、表格与结构化内容,支持受限异步爬取
复制安装指令,让 AI 自动完成配置 · 推荐新手
"scrapy-mcp" 暂无可直接复制的安装信息,请查看页面文档或源码仓库。
抓取这个电商分类页,使用 CSS 选择器提取每个商品的名称、价格、评分和详情页链接,并输出为结构化 JSON。
返回包含商品字段的 JSON 数组,便于后续分析或入库。
读取目标网站的 sitemap.xml 和 robots.txt,总结可抓取区域、禁止抓取路径,并列出 sitemap 中的主要 URL 分类。
输出抓取规则摘要和按类别整理的网址清单。
从博客首页开始,限制最多抓取 50 个页面、深度不超过 2 层,提取每篇文章的标题、发布时间、作者和正文摘要。
返回受限爬取结果及文章信息汇总,避免无限抓取。
提供网页抓取与多页爬取能力,帮助 AI 自动采集并整理站点内容。