$ loading_
用于构建、评估并优化 AI 系统,覆盖 RAG、智能体、微调与数据集管理。
复制安装指令,让 AI 自动完成配置 · 推荐新手
"Kiln" 暂无可直接复制的安装信息,请查看页面文档或源码仓库。
请用 Kiln 为我的 RAG 问答系统设计一套评测流程,包含测试集构建、准确性指标、引用质量检查和失败案例分析。
一套可执行的 RAG 评测方案,包含指标定义、数据组织方式与优化建议。
请用 Kiln 帮我为客服助手生成一批高质量合成训练数据,覆盖常见咨询、复杂追问、拒答场景,并按 JSONL 格式组织。
结构化的合成数据集方案或样例,可直接用于微调准备与质量审核。
请用 Kiln 分析我的 AI 智能体流程,找出工具调用、提示词设计和任务分解中的薄弱环节,并给出优化实验方案。
针对智能体系统的诊断结果、评估思路与可迭代的优化路线。
用于提示词与 RAG 流程评测,支持在 MCP 客户端发起并托管执行评估任务