$ loading_
帮助团队管理版本化黄金数据集并开展 RAG 评估,无需 API Key。
复制安装指令,让 AI 自动完成配置 · 推荐新手
请帮我安装 askskill 上的 "io.github.nipunkhanderia/golden-dataset-mcp" MCP 服务: 执行:claude mcp add io-github-nipunkhanderia-golden-dataset-mcp -- npx -y golden-dataset-mcp
请基于当前知识库问答系统,使用 golden-dataset-mcp 建立一套版本化黄金数据集,并对 RAG 的召回与回答质量进行评估,输出每条样本的得分、失败案例和改进建议。
一份 RAG 评估结果,包含样本级评分、整体表现汇总与优化建议。
请用 golden-dataset-mcp 为我们的评测样本集建立版本管理流程,记录每次新增、修改和删除的样本,并生成可对比的版本变更摘要。
一个可追踪的数据集版本记录,以及清晰的版本差异摘要。
请使用 golden-dataset-mcp 对比两种 RAG 检索方案在同一黄金数据集上的表现,重点分析召回率、答案准确性和失败样本差异。
一份对比报告,展示两种方案的关键指标、优劣势和典型失败案例。
提供黄金XAUUSD行情、技术分析、回测与风控交易辅助。