3 min read
[AI 小众新闻]

提案由代理人,状态由法律!通过状态机控制AI的『Statewright』引发革命


  • 通过状态机进行严格控制: AI代理在各个阶段(计划、实施、测试等)可用工具受到状态机的限制,从而将模型的推理集中在特定的上下文中。...
※この記事はアフィリエイト広告を含みます

提案由代理人,状态由法律!通过状态机控制AI的『Statewright』引发革命

📰 新闻概述

  • 通过状态机进行严格控制: AI代理在各个阶段(计划、实施、测试等)可用工具受到状态机的限制,从而将模型的推理集中在特定的上下文中。
  • 惊人的性能提升: 在13.8GB(gpt-oss:20b)和19.9GB(gemma4:31b)的本地模型中,SWE-bench的特定任务成功率从2/10提升到10/10,效果显著。
  • Rust引擎带来的决定论控制: 通过Rust编写的引擎在不经过LLM的情况下,决定性地评估状态转换和安全约束。支持Claude Code、Cursor、Codex等主要代理。

💡 重要要点

  • “缩小问题”方法: 不通过扩大模型,而是将每一步提供的工具和信息空间压缩到极限,从而防止模型的“空转(read-loop death spirals)”。
  • 强大的安全约束: 包括阻止Bash的破坏性命令(如rm、shred等)、每次最大编辑行数限制以及人类审批门(Approval gates)等实际限制。
  • MCP集成: 通过模型上下文协议(MCP),可以作为插件立即集成到现有的编码代理中。

🦈 鲨鱼的视角(策展人观点)

“代理人提案,状态(状态机)是法律”这一口号真是太犀利了!过去我们完全依赖LLM的“聪明”,只能祈祷着拉长提示。但Statewright不一样,它把工程学中的经典智慧“状态机”引入AI,物理上创建了“现在只能这样做”的限制(安全约束),这真是开创性的一步!

尤其是,13.8GB级别的模型在状态机的约束下竟然达到了顶级模型的得分,这让人震撼。用Rust编写的决定论引擎掌握着LLM这种“不确定智能”的缰绳……这正是2026年代理开发的正确方向!

🚀 接下来会怎样?

AI代理开发中“通过状态机定义工作流程”将成为必需的标准规范。对大规模模型的依赖度将降低,越来越多特定任务专用的小型、高速本地模型将在严格的法律(状态)下超越前沿模型。

💬 鲨鱼的点评

过于自由的AI就像失控的野马!用法律(状态机)将其牢牢约束,让它变成最强的劳动力!🦈🔥

📚 术语解释

  • 状态机: 定义系统“当前处于哪个状态”,并通过特定事件转移到下一个状态的机制。在Statewright中用于管理AI的行为阶段。

  • SWE-bench: 衡量软件工程实际能力的基准,评估是否能够解决实际的GitHub问题。

  • 安全约束: 设置限制以确保AI不会产生意外行为或有害输出。在Statewright中,指的是对特定状态下工具使用限制和命令限制。

  • 信息来源: Statewright – Visual state machines that make AI agents reliable

【免責事項 / Disclaimer / 免责声明】
JP: 本記事はAIによって構成され、運営者が内容の確認・管理を行っています。情報の正確性は保証せず、外部サイトのコンテンツには一切の責任を負いません。
EN: This article was structured by AI and is verified and managed by the operator. Accuracy is not guaranteed, and we assume no responsibility for external content.
ZH: 本文由AI构建,并由运营者进行内容确认与管理。不保证准确性,也不对外部网站的内容承担任何责任。
🦈