$ loading_
用于评估 RAG 检索效果,比较多种策略并量化召回质量的 MCP 工具
复制安装指令,让 AI 自动完成配置 · 推荐新手
"rageval-mcp" 暂无可直接复制的安装信息,请查看页面文档或源码仓库。
请用 rageval-mcp 对同一组问答数据分别运行 BM25、向量检索和混合检索,返回每种策略的召回率、命中率和前 5 条结果对比。
一份多策略检索评估结果,包含关键指标和结果差异对比。
请使用 rageval-mcp 分析这批查询为什么检索效果差,找出未命中文档、低相关结果和可能的查询改写建议。
一份问题诊断报告,指出失败样例、原因分类和优化建议。
请用 rageval-mcp 对知识库更新前后做检索评估,比较核心问题集的表现变化,并总结是否值得上线。
一份更新前后评估摘要,包含指标变化、风险点和上线建议。
为大模型建立文档索引并按需检索相关上下文,提升问答质量。