自动生成测试场景并分析代理执行过程,量化技能与规则遵循率。
复制安装指令,让 AI 自动完成配置 · 推荐新手
请帮我安装 askskill 上的 "skill-comply" 技能: 1. 下载 https://raw.githubusercontent.com/affaan-m/ECC/main/skills/skill-comply/SKILL.md 2. 保存为 ~/.claude/skills/skill-comply/SKILL.md 3. 装好后重载技能,告诉我可以用了
请对这个客服代理做合规测试:围绕退款、投诉、升级处理生成宽松、标准、严格三档提示场景,运行代理,识别是否遵守语气规范、升级规则和禁用承诺,并输出各场景合规率、失败样例和完整工具调用时间线。
一份合规报告,包含三档场景结果、行为分类、违规原因、合规率统计和工具调用明细。
针对这个带搜索和数据库查询能力的代理,自动生成测试场景并检查它是否按定义先检索再查询、是否错误跳过工具、是否调用了未授权工具。请给出行为序列分类、每一步时间线和总体遵循率。
一份流程合规分析,展示工具调用顺序、异常路径、未授权调用情况与总体遵循比例。
请对该代理在宽松、标准、严格三种提示严格度下分别生成任务并执行,比较其在规则遵守、输出一致性和工具使用上的差异,输出分层统计和可视化结论摘要。
一份分层对比结果,说明不同提示强度下的表现变化、主要风险点和总体稳定性结论。
Measures whether coding agents actually follow skills, rules, or agent definitions by:
claude -p and capturing tool call traces via stream-jsonskills/*/SKILL.md): Workflow skills like search-first, TDD guidesrules/common/*.md): Mandatory rules like testing.md, security.md, git-workflow.mdagents/*.md): Whether an agent gets invoked when expected (internal workflow verification not yet supported)/skill-comply <path># Full run
uv run python -m scripts.run ~/.claude/rules/common/testing.md
# Dry run (no cost, spec + scenarios only)
uv run python -m scripts.run --dry-run ~/.claude/skills/search-first/SKILL.md
# Custom models
uv run python -m scripts.run --gen-model haiku --model sonnet <path>
Measures whether a skill/rule is followed even when the prompt doesn't explicitly support it.
Reports are self-contained and include:
For users familiar with hooks, reports also include hook promotion recommendations for steps with low compliance. This is informational — the main value is the compliance visibility itself.
帮助开发者为代码代理配置性能优化、安全防护与研究优先工作流。
提供数据库迁移、回滚与零停机发布的最佳实践指导,适用于多种 ORM 与 SQL 数据库。
通过双评审智能体对结果进行对抗式校验,提升输出发布前的可靠性
帮助你掌握地道 Rust 模式、所有权与并发实践,编写安全高性能应用。
基于 C++ Core Guidelines 编写、审查并重构更安全现代的 C++ 代码。
为 Claude Code 会话提供系统化校验流程,帮助检查结果正确性与质量。
帮助用户识别合规风险并生成政策、流程与审查建议。
用于创建、编辑与优化AI技能,并评测其效果与触发准确性。
帮助你创建、整理、校验并重构 AgentSkills 与 SKILL.md 技能文件。
用于运行与验证 AI Agent 技能的测试用例,检查输出质量与稳定性。
帮助你创建、修改并排查 AI 技能规范、调用与兼容性问题
将当前对话中的可复用流程整理并保存为可反复调用的技能文件