抓取网页资源并提取正文内容,支持绕过反爬限制获取可用信息。
该 MCP 工具的功能与其描述基本一致:用于抓取网页资源、内容提取,并可能借助第三方抓取/代理与 LLM 服务完成处理。基于其官方 Registry 来源、开源且近期维护,整体更偏低到中等风险,但因需要多类 API 密钥、存在网络外发与本地执行/存储能力,使用时仍需做好最小权限配置。
需要多项敏感配置与密钥,包括 FIRECRAWL_API_KEY、BRIGHTDATA_API_KEY、LLM_API_KEY 等;这些凭证一旦泄露,可能被用于第三方抓取、代理或模型服务调用并产生费用或数据暴露。材料未显示存在异常索权,但应视为敏感凭证管理场景。
描述表明其会抓取网页资源,并结合 Firecrawl、Bright Data、LLM 提供方等外部服务工作;虽然未列出固定远程 host,但用户提供的 URL、页面内容或提取结果很可能被发送到相关服务或目标网站。该外发与声明功能一致,属常规网络能力,需留意数据边界。
系统已标记为 executes-code,说明该 MCP 具备在本机运行服务端逻辑/进程的能力。当前材料未见超出网页抓取用途的高危系统权限申请,因此更符合 MCP 工具的常规执行面,需要在受限环境中运行。
从 MCP_RESOURCE_STORAGE 与 MCP_RESOURCE_FILESYSTEM_ROOT 可见其支持资源存储,且可能访问指定根目录下的本地文件/缓存数据。材料未表明可无界读取整机文件系统,但仍应将文件系统根目录限制在最小必要范围,避免抓取内容、缓存或结果落到敏感路径。
来源为官方 Registry,且有可审计的开源仓库,近一年内有更新,这些都是明显的降风险因素。虽然 README 缺失、许可证未声明且社区 star 较少会降低透明度与成熟度判断,但目前未见闭源外发、可疑注入或失维等高风险红旗。
复制安装指令,让 AI 自动完成配置 · 推荐新手
请帮我安装 askskill 上的 "com.pulsemcp/pulse-fetch" MCP 服务: 执行:claude mcp add com-pulsemcp-pulse-fetch -- npx -y @pulsemcp/pulse-fetch
请用 pulse-fetch 抓取这个网页并提取正文内容,去掉导航、广告和页脚:https://example.com/article
返回清洗后的文章正文文本,适合阅读、总结或进一步分析。
请用 pulse-fetch 获取这个有反爬限制的页面内容,并提取其中的主要文本与链接:https://example.com/protected
返回页面核心内容及关键链接,尽量避免被反爬机制阻断。
请用 pulse-fetch 依次抓取以下网页,提取每页正文,并整理成结构化摘要: 1. https://example.com/page1 2. https://example.com/page2 3. https://example.com/page3
返回每个网页的正文提取结果与简要摘要,便于后续比较和研究。
连接 Gmail 账户,便捷读取、搜索与处理邮件自动化任务。
帮助用户浏览与发现 PulseMCP 子注册表中的 MCP 服务器资源。