黑客LLM的脑！通过复制中层来提升性能的『RYS』在最新模型中也有效

#LLM #RYS #Qwen3.5 #神经解剖学

※この記事はアフィリエイト広告を含みます

[AI小新闻快报] 黑客LLM的脑！通过复制中层来提升性能的『RYS』在最新模型中也有效

📰 新闻概要

无需训练的性能提升: 复制LLM中层的「RYS（Repeat Your Self）」方法在最新的Qwen3.5-27B中得到了确认。
三阶段结构的证明: 实验直接展示了模型内部以「编码（初期）」「推理（中期）」「解码（后期）」三个阶段运作的事实。
超越语言的思维空间: 在模型的中层，无论是英语还是中文，只要语义相同，就会以极高的相似度进行处理的「共同思维空间」确实存在。

💡 重要的要点

可扩展性的确认: 在Qwen2-72B中发现的RYS方法在更小巧且高度工程化的27B模型中依然有效。
大规模优化: 为了找出最佳的层次结构，进行了3,024个候选层和200万种构造的评分，彻底验证了这一过程。
语言无关的抽象化: 在中层（大约层15及以后的层次），不同语言中「谈论的内容」优先于「使用的语言」得以表达。

🦈 鲨鱼的眼（策展人的视角）

这个「RYS」方法在没有权重更新和额外训练的情况下，仅通过数学探针就能优化「大脑结构」来提升性能，简直太酷了！尤其令人振奋的是，实验证明中层作为『通用思维空间』的功能。当比较英语和中文的事实时，中层消除了语言障碍，只提取了「意义的纯粹本质」……这种抽象层正是LLM智能的核心！这种仅通过「层的叠加」来强化现有模型的方式，对资源有限的个人开发者来说，简直是希望的曙光！

🚀 接下来会怎样？

随着模型的「功能解剖学」变得更加清晰，增强特定能力（如逻辑思维）的层级强化方法将会普及。此外，在多语言模型中，将加速对不依赖特定语言的「概念层面」的黑客攻击。

💬 鲨鱼的观点

把AI的脑袋拼接起来变聪明，真是个赛博朋克的想法！无需训练就变强，性价比简直无敌！🦈🔥

📚 术语解说

RYS (Repeat Your Self): 通过复制并插入模型中特定的层（主要是中层），在没有额外学习的情况下，伪装地提升模型的参数数量和性能的方法。
余弦相似度: 表示两个向量在多大程度上朝同一方向的指标。用于测量AI内部表征的相似程度。
Transformers (变换器): 是当前LLM的基础架构，通过注意力机制学习数据中的相关性。
信息来源: LLM神经解剖学II：现代LLM黑客与通用语言的暗示？