$ loading_
从网页链接或 HTML 中提取干净正文,并按多种格式结构化输出。
复制安装指令,让 AI 自动完成配置 · 推荐新手
"mcp-trafilatura-server" 暂无可直接复制的安装信息,请查看页面文档或源码仓库。
请用 trafilatura 从这个网页链接提取正文内容,去掉导航、广告和页脚,并输出为 Markdown:https://example.com/article
返回清洗后的文章正文,保留标题与段落结构,格式为 Markdown。
请从下面这段 HTML 中提取主要文本内容,忽略模板噪音,并输出纯文本结果:[粘贴 HTML 内容]
返回去除样式与无关区块后的纯文本正文,适合进一步分析。
请依次处理这组网页链接,提取每个页面的正文、标题和发布日期,并输出为结构化 JSON 数组:[链接1, 链接2, 链接3]
返回包含多个页面提取结果的 JSON,便于后续数据分析或入库。
抓取指定网址的原始HTML内容,为大模型提供网页上下文