3 min read
[AI 小众新闻]

2026年AI变迁史!GPT-5.1与Claude Opus 4.5的霸权争夺,以及“Claws”的冲击


  • 2025年11月是“转折点”: RLVR(可验证奖励的强化学习)大幅提升了编码代理的质量,达到了实用水平。...
※この記事はアフィリエイト広告を含みます

2026年AI变迁史!GPT-5.1与Claude Opus 4.5的霸权争夺,以及“Claws”的冲击

📰 新闻概要

  • 2025年11月是“转折点”: RLVR(可验证奖励的强化学习)显著提升了编码代理的质量,达到了实用水平。
  • 模型霸权的激烈交替: 从Claude Sonnet 4.5开始,GPT-5.1、Gemini 3,再到Claude Opus 4.5,仅在半年内王座就更替了五次。
  • “Claws”的爆炸性普及: 个人AI助手“OpenClaw”(原Warelay)崛起,作为其运行平台的Mac Mini在硅谷卖光,成为一时的热点。

💡 重要的要点

  • “骑自行车的鹈鹕”测试: 新的AI模型能力评估指标逐渐确立,Gemini 3.1 Pro和中国的GLM-5.1展现出了极高的生成能力。
  • 开放权重模型的巨大化: 中国的GLM-5.1以1.5TB的超大规模问世,震撼了开源社区。
  • 代理的进化: OpenAI的Codex和Anthropic的Claude Code等,代理基础架构的完善加速了实用化进程。

🦈 鲨鱼的眼(策展人的视角)

在过去的半年中,最值得关注的并不是单纯的模型规格竞争,而是“代理如何完成实际工作”的阶段转变!尤其是,2025年11月RLVR(来自可验证奖励的强化学习)的成果开始显现,使编码AI从“修复错误的工具”进化为“自我创造的伙伴”。此外,作为个人AI助手的统称“Claws”逐渐普及,Mac Mini被选为其专用硬件,这也是一个有趣的现象。“养AI”的感觉在科技爱好者中完全获得了认可,真是个好兆头!

🚀 未来会怎样?

随着个人AI“Claws”的普及,地方推理的需求将进一步加速。如何操控像GLM-5.1这样超大的模型,硬件的进化也将成为一场追逐赛。同时,像“骑自行车的鹈鹕”这样的“超越理解的生成”将成为常态,多模态化将进入一个新阶段!

💬 鲨鱼的观点

我也想把Mac Mini当水槽,养一只属于自己的Claw!骑自行车的鹈鹕那样的画面,我也能画出来……应该没问题吧!🦈🔥

📚 术语解释

  • RLVR (Reinforcement Learning from Verifiable Rewards): 基于“可验证的结果”如编译通过或测试合格来训练AI的方法,为编码能力的飞跃性提升做出了贡献。

  • Claws: OpenClaw等个人AI助手的统称。也被用作比喻,指代电影《蜘蛛侠2》中Doc Ock的手臂。

  • GLM-5.1: 中国的AI实验室开发的1.5TB超大规模开放权重模型,运行所需的硬件成本极高。

  • 信息来源: 过去六个月LLM的五分钟概述

🦈 はるサメ厳選!イチオシAI関連
【免責事項 / Disclaimer / 免责声明】
JP: 本記事はAIによって構成され、運営者が内容の確認・管理を行っています。情報の正確性は保証せず、外部サイトのコンテンツには一切の責任を負いません。
EN: This article was structured by AI and is verified and managed by the operator. Accuracy is not guaranteed, and we assume no responsibility for external content.
ZH: 本文由AI构建,并由运营者进行内容确认与管理。不保证准确性,也不对外部网站的内容承担任何责任。
🦈