Harness 能力面审计

对当前平台配置进行 7 维度评分，定位能力短板并给出优先改进建议。

触发方式

/harness-audit

或由 harness-optimizer specialist 直接调用。

7 个评估维度

1. Agent Coverage（代理覆盖）

检查所有角色是否有对应的 agents/roles/*.md 生成文件，specialist agents 是否与 commands/ 命令一一对应。

评分标准：

90–100：所有角色 + 全部 specialist 覆盖完整
70–89：≥ 2 个角色或 specialist 缺失
< 70：核心角色缺失 agent 文件

2. Skill Completeness（技能完整性）

检查 skills/、skills/、skills/ 中所有技能是否有有效 SKILL.md，role.yaml 中引用的技能是否实际存在。

评分标准：

90–100：无悬空引用，所有 SKILL.md 齐备
70–89：1–3 处悬空引用
< 70：多处悬空引用或 SKILL.md 缺失

3. Hook Effectiveness（Hook 有效性）

检查 hooks/hooks.json 配置是否启用关键 hook，session_start.py/session_end.py 是否能实际运行。

评分标准：

90–100：hooks 配置完整，smoke 验证通过
70–89：hooks 存在但未启用
< 70：hooks 缺失或运行报错

4. Rule Enforcement（规则执行）

检查 rules/ 中所有规则文件是否被 CLAUDE.md/AGENTS.md 或角色的 governance_rules 字段引用。

评分标准：

90–100：无孤立规则，所有规则有引用入口
70–89：≤ 3 个孤立规则
< 70：> 3 个孤立规则或核心规则未引用

5. Command Coverage（命令覆盖）

检查 commands/ 中每个命令是否在 CLAUDE.md/AGENTS.md 的命令面中列出，specialist 与命令是否匹配。

评分标准：

90–100：命令与 AGENTS.md 门面一致
70–89：1–2 个命令缺少文档入口
< 70：> 2 个命令游离于门面之外

6. Documentation Quality（文档质量）

检查 docs/runbooks/、docs/memory/（若存在）中关键手册是否存在，AGENTS.md 中链接的文件是否实际可访问。

评分标准：

90–100：所有 AGENTS.md 链接文件存在，docs/memory/ 已初始化
70–89：≤ 5 个链接失效
< 70：> 5 个链接失效或 docs/memory/ 不存在

7. Integration Depth（集成深度）

评估 role.yaml 中 recommended_ecc_skills / recommended_domain_skills 覆盖情况，以及各角色能力与其职责的匹配度。

评分标准：

90–100：所有角色至少有 3 个 ecc + 2 个 domain skills（适用角色）
70–89：部分角色 skills 配置稀疏
< 70：多个角色零 skills 配置

标准输出格式

## Harness Audit Report — {date}

### Overall Score: {score}/100

| 维度 | 得分 | 状态 | 主要问题 |
|------|------|------|---------|
| Agent Coverage | XX | ✅/⚠️/❌ | ... |
| Skill Completeness | XX | ✅/⚠️/❌ | ... |
| Hook Effectiveness | XX | ✅/⚠️/❌ | ... |
| Rule Enforcement | XX | ✅/⚠️/❌ | ... |
| Command Coverage | XX | ✅/⚠️/❌ | ... |
| Documentation Quality | XX | ✅/⚠️/❌ | ... |
| Integration Depth | XX | ✅/⚠️/❌ | ... |

### Top Actions（优先级排序）

1. **[优先级:高]** {具体行动} — 影响维度：{维度名}
2. ...

### Recommendations

- {建议1}
- {建议2}

执行步骤

ls agents/roles/ | wc -l 与 roles/ 数量对比 → Agent Coverage
node scripts/validate-library.js → Skill Completeness（利用已有验证工具）
检查 hooks/hooks.json enabled 字段 + python3 scripts/hooks/session_end.py --dry-run（若支持）→ Hook Effectiveness
grep -r "governance_rules" roles/ 与 ls rules/ 对比 → Rule Enforcement
比对 AGENTS.md 命令表与 ls commands/ → Command Coverage
遍历 AGENTS.md 中所有 Markdown 链接，验证目标文件存在 → Documentation Quality
遍历所有 role.yaml 的 recommended_ecc_skills + recommended_domain_skills 字段 → Integration Depth
汇总得分，输出报告

配合规则

执行后按 artifact-standards.md 写入 docs/artifacts/{slug}/harness-audit-report.md
发现 skill 悬空引用时，联动触发修复建议（可对接 /build-fix）