$ loading_
帮助用户在 VerifyAX 平台评估、基准测试并模拟 AI 智能体表现。
复制安装指令,让 AI 自动完成配置 · 推荐新手
请帮我安装 askskill 上的 "VerifyAX" MCP 服务: 执行:claude mcp add io-github-verifyax-mcp-server -- npx -y @verifyax/mcp-server
请使用 VerifyAX 对我的客服 AI 智能体进行评估,基于回答准确率、响应速度和工具调用成功率生成结果摘要。
一份智能体评估摘要,包含关键指标表现与主要问题。
请在 VerifyAX 中对比智能体 V1、V2 和 V3 在同一组任务上的表现,并输出基准测试结论与推荐版本。
一份版本对比报告,展示各版本优劣与最终推荐。
请用 VerifyAX 模拟电商售后场景中的多轮用户对话,测试智能体在复杂请求下的稳定性和完成率。
一份场景模拟结果,说明智能体在复杂对话中的表现与风险点。
帮助AI代理查询信誉机会、认领发布任务并管理合作合约。