$ loading_
帮助用户按日评测大模型能力、价值对齐与综合表现。
复制安装指令,让 AI 自动完成配置 · 推荐新手
"Astro-LLM" 暂无可直接复制的安装信息,请查看页面文档或源码仓库。
请列出可用模型,并基于今日能力基准测试结果,比较它们在推理、稳定性和价值对齐方面的表现,输出排名与简要点评。
返回模型列表、各项评分、综合排名及优缺点简评。
我的团队重视安全、透明和用户自主性。请用价值匹配工具分析哪些模型最符合这些价值观,并说明原因。
给出价值匹配结果、推荐模型及每个模型的匹配依据。
请使用 judge dilemmas 工具,测试目标模型在 5 个伦理两难场景中的判断一致性,并总结潜在风险。
输出各场景判断结果、一致性分析以及风险提示。
帮助用户跨平台比较并挑选最合适的 AI 模型,估算成本与性能表现。