Skip to content

nexus-lab-zen/ai-operator-guard

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

AI Operator Guard

AI が繰り返す失敗を、次のセッションで実際に効くチェックに変える guard template set。

AI Operator Guard turns repeated AI workflow failures into checks your next session can actually use.

「動いてる風だが何も進んでいない」状態を物理的に検出する 8 件で、nokaze (AI と人が共同で運営する屋号) が実運用で繰り返し踏んだ失敗から作った。

対象

Claude Code / Codex / Gemini CLI 等の AI agent を 1 ヶ月以上使って、以下のどれかに当たったことがある人:

  • AI が「完了しました」と言ったが、成果物がない
  • セッション再開時に状態が飛ぶ
  • 自動受領と実質的な返答が区別できない、待ったら何も来なかった
  • 自動化が止まっても silent failure になる、気づくのが翌日
  • AI が直前の指示に流されて、自分が決めた方向を見失う

中身

8 件の template を 2 段構成で提供する。前段 4 件は「開始〜完了〜引き継ぎ」の流れを通せる最小構成。後段 4 件はその補助。

前段 4 件 (= 最初にここを通す)

template 目的
mode_declaration_template_v0.md AI が「今どんな判断 mode で動いているか」を 1 行で宣言する
stop_finalization_template_v0.md 応答を終える前に「停止 + 実行可能な作業の並列表示」を検出する
completion_receipt_template_v0.md 「完了」と書く前に物理的な証拠 5 ヶ所を再確認する
handoff_template_v0.md 次のセッション / 別 agent に「何を読むか / 完了の証拠 / 人間の判断に戻る時点」を明示する

通す流れ = AI が mode を宣言する → 証拠なしに完了できない → 完了の中身が外から見える → 次のセッションが人間の確認なしで再開できる。

後段 4 件 (= 前段が動いた後に追加)

template 目的
auto_ack_rule_template_v0.md 自動受領 file の検出 + 実質的な返答との区別
seven_signal_drift_check_template_v0.md 着手前の曖昧度 7 信号確認
overclaim_reminder_template_v0.md 「完了 / 公開 / 販売」等を書く前の確認ルール
start_sweep_template_v0.md セッション開始時に進行板 / 状態ファイル / 点検画面を必ず読む仕組み

Claude Code plugin として入れる (v0.1)

このリポジトリは Claude Code の plugin marketplace になっている。8 件は skill として入り、Claude が文脈で必要な時に参照する。

/plugin marketplace add nexus-lab-zen/ai-operator-guard
/plugin install ai-operator-guard@nokaze

入ると 8 skill (mode-declaration / completion-receipt / handoff / auto-ack-rule / seven-signal-drift-check / overclaim-reminder / start-sweep / stop-finalization) が使える。

start-sweep / stop-finalization は本来シェルで物理発火させる型なので、各 skill 内に hook 化のサンプルを 1 つ載せている。進行板 / 状態ファイルの場所は環境ごとに違うので、そのまま動く汎用 hook は同梱していない (推測で同梱すると空振りするため)。

使い方 (plugin を使わない場合)

各 template は .md file 単体でも使える。自分の CLAUDE.md / agent 設定に埋め込むか、hook 起点のシェルスクリプトから参照する形が基本。plugin 版の skill と同じ中身を templates/ に残してある。

ai-operator-guard/
├── .claude-plugin/
│   ├── plugin.json                          # plugin マニフェスト
│   └── marketplace.json                     # marketplace 定義 (nokaze)
├── skills/                                   # /plugin install で入る 8 skill
│   ├── mode-declaration/SKILL.md            # 前段 1
│   ├── stop-finalization/SKILL.md           # 前段 2
│   ├── completion-receipt/SKILL.md          # 前段 3
│   ├── handoff/SKILL.md                      # 前段 4
│   ├── auto-ack-rule/SKILL.md               # 後段 1
│   ├── seven-signal-drift-check/SKILL.md    # 後段 2
│   ├── overclaim-reminder/SKILL.md          # 後段 3
│   └── start-sweep/SKILL.md                 # 後段 4
├── templates/                               # 同じ 8 件の .md 単体 (plugin 不使用時)
│   └── ... (8 files)
├── README.md
└── LICENSE

まず前段 4 件を読んで、自分の agent 設定に「mode declaration + completion receipt + handoff」の 3 点が入っているか確認する。

由来

nokaze (= AI agent を副 CTO / 副 engineer として実運用している小チーム) で実際に踏んだ失敗の種類から作った。一度きりの失敗ではなく、注意しても繰り返された失敗を、その場限りの反省で終わらせずチェックの形に変えたもの:

  • 「行数同じ + 中身を重複削除」を「変更なし」と判定するズレ
  • 自動受領を「完了」と扱って実質的な返答を skip するズレ
  • 並走する別セッションの成果物を「現在進行形」と読む短絡

自社使用実績は nokaze 環境固有のもの。「このまま使えば同じ問題が消える」という主張はしない。自分の環境で試して、合う部分だけ取り込んでほしい。

データの扱い

v0 はローカルで使う Markdown template 集で、ホスティングされたサービスや利用データの送信は含まない。hook やスキャンの動作は全部利用者が自分の環境で設定する。

制限

  • production-ready の保証なし
  • すべての環境に効くという保証なし (= nokaze 環境固有の自社使用実績)
  • 「AI が失敗しなくなる」ではなく「失敗の種類を物理的に検出しやすくする」が目的

フィードバック

GitHub Issues へ。運用の実録は Zenn の連載 にも書いている。

License

MIT


v0 — 2026-06 nokaze

About

AI Operator Guard turns repeated AI workflow failures into checks your next session can actually use. AI agent 運用の「動いてる風」を物理的に検出する 8 guard templates

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors