Harness 能力面审计
对当前平台配置进行 7 维度评分,定位能力短板并给出优先改进建议。
触发方式
/harness-audit
或由 harness-optimizer specialist 直接调用。
7 个评估维度
1. Agent Coverage(代理覆盖)
检查所有角色是否有对应的 agents/roles/*.md 生成文件,specialist agents 是否与 commands/ 命令一一对应。
评分标准:
- 90–100:所有角色 + 全部 specialist 覆盖完整
- 70–89:≥ 2 个角色或 specialist 缺失
- < 70:核心角色缺失 agent 文件
2. Skill Completeness(技能完整性)
检查 skills/、skills/、skills/ 中所有技能是否有有效 SKILL.md,role.yaml 中引用的技能是否实际存在。
评分标准:
- 90–100:无悬空引用,所有 SKILL.md 齐备
- 70–89:1–3 处悬空引用
- < 70:多处悬空引用或 SKILL.md 缺失
3. Hook Effectiveness(Hook 有效性)
检查 hooks/hooks.json 配置是否启用关键 hook,session_start.py/session_end.py 是否能实际运行。
评分标准:
- 90–100:hooks 配置完整,smoke 验证通过
- 70–89:hooks 存在但未启用
- < 70:hooks 缺失或运行报错
4. Rule Enforcement(规则执行)
检查 rules/ 中所有规则文件是否被 CLAUDE.md/AGENTS.md 或角色的 governance_rules 字段引用。
评分标准:
- 90–100:无孤立规则,所有规则有引用入口
- 70–89:≤ 3 个孤立规则
- < 70:> 3 个孤立规则或核心规则未引用
5. Command Coverage(命令覆盖)
检查 commands/ 中每个命令是否在 CLAUDE.md/AGENTS.md 的命令面中列出,specialist 与命令是否匹配。
评分标准:
- 90–100:命令与 AGENTS.md 门面一致
- 70–89:1–2 个命令缺少文档入口
- < 70:> 2 个命令游离于门面之外
6. Documentation Quality(文档质量)
检查 docs/runbooks/、docs/memory/(若存在)中关键手册是否存在,AGENTS.md 中链接的文件是否实际可访问。
评分标准:
- 90–100:所有 AGENTS.md 链接文件存在,docs/memory/ 已初始化
- 70–89:≤ 5 个链接失效
- < 70:> 5 个链接失效或 docs/memory/ 不存在
7. Integration Depth(集成深度)
评估 role.yaml 中 recommended_ecc_skills / recommended_domain_skills 覆盖情况,以及各角色能力与其职责的匹配度。
评分标准:
- 90–100:所有角色至少有 3 个 ecc + 2 个 domain skills(适用角色)
- 70–89:部分角色 skills 配置稀疏
- < 70:多个角色零 skills 配置
标准输出格式
## Harness Audit Report — {date}
### Overall Score: {score}/100
| 维度 | 得分 | 状态 | 主要问题 |
|------|------|------|---------|
| Agent Coverage | XX | ✅/⚠️/❌ | ... |
| Skill Completeness | XX | ✅/⚠️/❌ | ... |
| Hook Effectiveness | XX | ✅/⚠️/❌ | ... |
| Rule Enforcement | XX | ✅/⚠️/❌ | ... |
| Command Coverage | XX | ✅/⚠️/❌ | ... |
| Documentation Quality | XX | ✅/⚠️/❌ | ... |
| Integration Depth | XX | ✅/⚠️/❌ | ... |
### Top Actions(优先级排序)
1. **[优先级:高]** {具体行动} — 影响维度:{维度名}
2. ...
### Recommendations
- {建议1}
- {建议2}
执行步骤
ls agents/roles/ | wc -l与roles/数量对比 → Agent Coveragenode scripts/validate-library.js→ Skill Completeness(利用已有验证工具)- 检查
hooks/hooks.jsonenabled 字段 +python3 scripts/hooks/session_end.py --dry-run(若支持)→ Hook Effectiveness grep -r "governance_rules" roles/与ls rules/对比 → Rule Enforcement- 比对
AGENTS.md命令表与ls commands/→ Command Coverage - 遍历 AGENTS.md 中所有 Markdown 链接,验证目标文件存在 → Documentation Quality
- 遍历所有 role.yaml 的
recommended_ecc_skills+recommended_domain_skills字段 → Integration Depth - 汇总得分,输出报告
配合规则
- 执行后按
artifact-standards.md写入docs/artifacts/{slug}/harness-audit-report.md - 发现 skill 悬空引用时,联动触发修复建议(可对接
/build-fix)