$ loading_
将原始 HTML 清洗为适合大模型处理的纯净文本,节省上下文与成本。
复制安装指令,让 AI 自动完成配置 · 推荐新手
请帮我安装 askskill 上的 "Refinery MCP" MCP 服务: 执行:claude mcp add 'io-github-larelabs-refinery-mcp' -- npx -y @larelabs/refinery-mcp
请将这段网页原始 HTML 清洗为适合大模型阅读的正文文本,去除脚本、样式、导航、页脚和广告,仅保留标题、段落与列表,并按原有结构输出。
一份结构清晰、噪声较少的网页正文文本,可直接用于总结、问答或分析。
我准备把一批网页内容送入知识库,请先把每个页面的原始 HTML 清洗成统一的纯文本格式,尽量保留章节层级,删除无关模板内容。
统一格式的清洗文本,便于后续向量化、索引与知识库导入。
在 AI 代理分析这个网页前,先清洗原始 HTML,只保留对理解页面内容有帮助的文本,减少 token 消耗,并输出清洗后的结果。
更精简的页面文本输入,帮助代理更快处理并降低上下文开销。
搜索热门库官方文档并提取适合大模型使用的整洁文本内容