$ loading_
通过标准化 MCP 接口运行大模型评测、实验与自定义评估器。
复制安装指令,让 AI 自动完成配置 · 推荐新手
"Patronus MCP Server" 暂无可直接复制的安装信息,请查看页面文档或源码仓库。
请通过 Patronus MCP Server 对两个客服提示词版本做大模型评测,比较回答准确性、幻觉率和语气一致性,并输出评分表与结论。
返回对比评测结果,包括各项指标分数、优劣分析和推荐版本。
请通过 Patronus MCP Server 对这组 RAG 问答样本运行批量实验,测试不同检索参数对答案质量的影响,并汇总结果。
输出实验配置、各方案表现对比,以及适合采用的参数建议。
请通过 Patronus MCP Server 创建一个自定义评估器,用来检查招聘助手回复是否存在歧视性表达,并说明评估规则与示例结果。
返回自定义评估器定义、判定标准,以及示例输入的评测结果。
通过标准化 MCP 接口集成 OpenAI 工具与服务,便于应用快速调用与扩展。