エージェントは提案、状態は法律だ!ステートマシンでAIを制御する『Statewright』が革命を起こす
📰 ニュース概要
- ステートマシンによる厳格な制御: AIエージェントが各フェーズ(計画、実装、テスト等)で使用できるツールをステートマシンで制限し、モデルの推論を特定の文脈に集中させる。
- 驚異的な性能向上: 13.8GB(gpt-oss:20b)や19.9GB(gemma4:31b)のローカルモデルにおいて、SWE-benchの特定タスクで成功率が2/10から10/10へと劇的に改善した。
- Rust製エンジンによる決定論的制御: LLMを介さず、Rustで書かれたエンジンが決定論的に状態遷移とガードレールを評価。Claude Code、Cursor、Codexなど主要エージェントに対応。
💡 重要なポイント
- 「問題を小さくする」アプローチ: モデルを大きくするのではなく、各ステップで提示するツールと情報の空間を極限まで絞り込むことで、モデルの「空回り(read-loop death spirals)」を防ぐ。
- 強力なガードレール: Bashの破壊的コマンド(rm, shred等)のブロック、1回あたりの最大編集行数の制限、人間による承認ゲート(Approval gates)など、実戦的な制限が組み込まれている。
- MCP統合: Model Context Protocol(MCP)を介して、既存のコーディングエージェントにプラグインとして即座に導入可能。
🦈 サメの眼(キュレーターの視点)
「エージェントは提案、状態(ステート)は法律」というスローガンが最高にキレてるサメ! これまではLLMの「賢さ」に頼り切りで、プロンプトを長くして祈るしかなかったサメ。でも、このStatewrightは違うサメ。エンジニアリングの古典的な知恵である「ステートマシン」をAIに持ち込んで、物理的に「今はこれしかできない」という檻(ガードレール)を作ったのが画期的だサメ!
特に、13.8GBクラスのモデルが、ステートマシンの制約だけで上位モデル並みのスコアを出したという結果が震えるサメ。Rustで書かれた決定論的なエンジンが、LLMという「不確実な知能」の手綱を握る……これこそが2026年のエージェント開発の正解だと思うサメ!
🚀 これからどうなる?
AIエージェント開発において「ステートマシンによるワークフロー定義」が必須の標準仕様になる。大規模モデルへの依存度が下がり、特定のタスクに特化した小型・高速なローカルモデルが、厳格な法律(ステート)の下で frontier モデルを凌駕するシーンが増えるサメ。
💬 はるサメ視点の一言
自由すぎるAIはただの暴れ馬!法律(ステートマシン)でガチガチに縛って、最強の労働力に変えてやるサメ!🦈🔥
📚 用語解説
-
ステートマシン: システムが「今どの状態にあるか」を定義し、特定のイベントによって次の状態へ遷移する仕組み。StatewrightではAIの行動フェーズをこれで管理する。
-
SWE-bench: ソフトウェアエンジニアリングの実務能力を測るベンチマーク。実際のGitHubのIssueを解決できるかを評価する。
-
ガードレール: AIが予期せぬ挙動や有害な出力をしないように設定する制約。Statewrightでは、特定の状態でのツール使用制限やコマンド制限を指す。
-
情報元: Statewright – Visual state machines that make AI agents reliable