※この記事はアフィリエイト広告を含みます
2026年AI变迁史!GPT-5.1与Claude Opus 4.5的霸权争夺,以及“Claws”的冲击
📰 新闻概要
- 2025年11月是“转折点”: RLVR(可验证奖励的强化学习)显著提升了编码代理的质量,达到了实用水平。
- 模型霸权的激烈交替: 从Claude Sonnet 4.5开始,GPT-5.1、Gemini 3,再到Claude Opus 4.5,仅在半年内王座就更替了五次。
- “Claws”的爆炸性普及: 个人AI助手“OpenClaw”(原Warelay)崛起,作为其运行平台的Mac Mini在硅谷卖光,成为一时的热点。
💡 重要的要点
- “骑自行车的鹈鹕”测试: 新的AI模型能力评估指标逐渐确立,Gemini 3.1 Pro和中国的GLM-5.1展现出了极高的生成能力。
- 开放权重模型的巨大化: 中国的GLM-5.1以1.5TB的超大规模问世,震撼了开源社区。
- 代理的进化: OpenAI的Codex和Anthropic的Claude Code等,代理基础架构的完善加速了实用化进程。
🦈 鲨鱼的眼(策展人的视角)
在过去的半年中,最值得关注的并不是单纯的模型规格竞争,而是“代理如何完成实际工作”的阶段转变!尤其是,2025年11月RLVR(来自可验证奖励的强化学习)的成果开始显现,使编码AI从“修复错误的工具”进化为“自我创造的伙伴”。此外,作为个人AI助手的统称“Claws”逐渐普及,Mac Mini被选为其专用硬件,这也是一个有趣的现象。“养AI”的感觉在科技爱好者中完全获得了认可,真是个好兆头!
🚀 未来会怎样?
随着个人AI“Claws”的普及,地方推理的需求将进一步加速。如何操控像GLM-5.1这样超大的模型,硬件的进化也将成为一场追逐赛。同时,像“骑自行车的鹈鹕”这样的“超越理解的生成”将成为常态,多模态化将进入一个新阶段!
💬 鲨鱼的观点
我也想把Mac Mini当水槽,养一只属于自己的Claw!骑自行车的鹈鹕那样的画面,我也能画出来……应该没问题吧!🦈🔥
📚 术语解释
-
RLVR (Reinforcement Learning from Verifiable Rewards): 基于“可验证的结果”如编译通过或测试合格来训练AI的方法,为编码能力的飞跃性提升做出了贡献。
-
Claws: OpenClaw等个人AI助手的统称。也被用作比喻,指代电影《蜘蛛侠2》中Doc Ock的手臂。
-
GLM-5.1: 中国的AI实验室开发的1.5TB超大规模开放权重模型,运行所需的硬件成本极高。
-
信息来源: 过去六个月LLM的五分钟概述