AI が繰り返す失敗を、次のセッションで実際に効くチェックに変える guard template set。
AI Operator Guard turns repeated AI workflow failures into checks your next session can actually use.
「動いてる風だが何も進んでいない」状態を物理的に検出する 8 件で、nokaze (AI と人が共同で運営する屋号) が実運用で繰り返し踏んだ失敗から作った。
Claude Code / Codex / Gemini CLI 等の AI agent を 1 ヶ月以上使って、以下のどれかに当たったことがある人:
- AI が「完了しました」と言ったが、成果物がない
- セッション再開時に状態が飛ぶ
- 自動受領と実質的な返答が区別できない、待ったら何も来なかった
- 自動化が止まっても silent failure になる、気づくのが翌日
- AI が直前の指示に流されて、自分が決めた方向を見失う
8 件の template を 2 段構成で提供する。前段 4 件は「開始〜完了〜引き継ぎ」の流れを通せる最小構成。後段 4 件はその補助。
| template | 目的 |
|---|---|
| mode_declaration_template_v0.md | AI が「今どんな判断 mode で動いているか」を 1 行で宣言する |
| stop_finalization_template_v0.md | 応答を終える前に「停止 + 実行可能な作業の並列表示」を検出する |
| completion_receipt_template_v0.md | 「完了」と書く前に物理的な証拠 5 ヶ所を再確認する |
| handoff_template_v0.md | 次のセッション / 別 agent に「何を読むか / 完了の証拠 / 人間の判断に戻る時点」を明示する |
通す流れ = AI が mode を宣言する → 証拠なしに完了できない → 完了の中身が外から見える → 次のセッションが人間の確認なしで再開できる。
| template | 目的 |
|---|---|
| auto_ack_rule_template_v0.md | 自動受領 file の検出 + 実質的な返答との区別 |
| seven_signal_drift_check_template_v0.md | 着手前の曖昧度 7 信号確認 |
| overclaim_reminder_template_v0.md | 「完了 / 公開 / 販売」等を書く前の確認ルール |
| start_sweep_template_v0.md | セッション開始時に進行板 / 状態ファイル / 点検画面を必ず読む仕組み |
このリポジトリは Claude Code の plugin marketplace になっている。8 件は skill として入り、Claude が文脈で必要な時に参照する。
/plugin marketplace add nexus-lab-zen/ai-operator-guard
/plugin install ai-operator-guard@nokaze
入ると 8 skill (mode-declaration / completion-receipt / handoff / auto-ack-rule / seven-signal-drift-check / overclaim-reminder / start-sweep / stop-finalization) が使える。
start-sweep / stop-finalization は本来シェルで物理発火させる型なので、各 skill 内に hook 化のサンプルを 1 つ載せている。進行板 / 状態ファイルの場所は環境ごとに違うので、そのまま動く汎用 hook は同梱していない (推測で同梱すると空振りするため)。
各 template は .md file 単体でも使える。自分の CLAUDE.md / agent 設定に埋め込むか、hook 起点のシェルスクリプトから参照する形が基本。plugin 版の skill と同じ中身を templates/ に残してある。
ai-operator-guard/
├── .claude-plugin/
│ ├── plugin.json # plugin マニフェスト
│ └── marketplace.json # marketplace 定義 (nokaze)
├── skills/ # /plugin install で入る 8 skill
│ ├── mode-declaration/SKILL.md # 前段 1
│ ├── stop-finalization/SKILL.md # 前段 2
│ ├── completion-receipt/SKILL.md # 前段 3
│ ├── handoff/SKILL.md # 前段 4
│ ├── auto-ack-rule/SKILL.md # 後段 1
│ ├── seven-signal-drift-check/SKILL.md # 後段 2
│ ├── overclaim-reminder/SKILL.md # 後段 3
│ └── start-sweep/SKILL.md # 後段 4
├── templates/ # 同じ 8 件の .md 単体 (plugin 不使用時)
│ └── ... (8 files)
├── README.md
└── LICENSE
まず前段 4 件を読んで、自分の agent 設定に「mode declaration + completion receipt + handoff」の 3 点が入っているか確認する。
nokaze (= AI agent を副 CTO / 副 engineer として実運用している小チーム) で実際に踏んだ失敗の種類から作った。一度きりの失敗ではなく、注意しても繰り返された失敗を、その場限りの反省で終わらせずチェックの形に変えたもの:
- 「行数同じ + 中身を重複削除」を「変更なし」と判定するズレ
- 自動受領を「完了」と扱って実質的な返答を skip するズレ
- 並走する別セッションの成果物を「現在進行形」と読む短絡
自社使用実績は nokaze 環境固有のもの。「このまま使えば同じ問題が消える」という主張はしない。自分の環境で試して、合う部分だけ取り込んでほしい。
v0 はローカルで使う Markdown template 集で、ホスティングされたサービスや利用データの送信は含まない。hook やスキャンの動作は全部利用者が自分の環境で設定する。
- production-ready の保証なし
- すべての環境に効くという保証なし (= nokaze 環境固有の自社使用実績)
- 「AI が失敗しなくなる」ではなく「失敗の種類を物理的に検出しやすくする」が目的
GitHub Issues へ。運用の実録は Zenn の連載 にも書いている。
MIT
v0 — 2026-06 nokaze