LLM单线程时代结束，思考、行为和读取并行化的『Multi-Stream LLM』横空出世！

#MultiStreamLLM #AI代理 #并行处理

※この記事はアフィリエイト広告を含みます

LLM单线程时代结束，思考、行为和读取并行化的『Multi-Stream LLM』横空出世！

📰 新闻概要

传统的LLM在逐步交换信息的“单一流”计算中存在瓶颈，无法同时进行思考（Chain-of-Thought）和输出，以及外部信息的读取。
新提出的“Multi-Stream LLM”是一种针对不同角色进行多条并行计算流的指令调优的新架构。
通过一次前向传递，可以同时从多个输入流进行读取，并生成多个输出流的标记，从而提高了效率和安全性。

💡 重要的点

并行处理的实现: 将用户、系统、思考、工具等角色独立为不同的流。这些角色在过去时间步长的因果依赖下并行计算。
瓶颈的解决: 现在可以实现“边写边读”、“边思考边行动”，克服了AI代理在输出信息时忽略新信息的局限性。
安全性的强化: 通过“关注的分离”，可以物理上分开管理系统指令、用户输入和工具结果，从而实现更为稳健的监控和安全措施。

🦈 鲨鱼的眼（策展人的视角）

以往的LLM再聪明也只能“一次做一件事”，是个单线程角色。而今，得益于Multi-Stream LLM的实现，终于获得了多任务的“思维回路”！特别是一次前向传递处理多个角色的这一数据驱动的变化，具体而强大。代理在优化输出的同时隐藏思考，或者在输出过程中从系统方插入进行修正，这样的高度互动将成为可能。无疑，这将成为下一代代理的“心脏”技术！

🚀 接下来会怎样？

AI代理将会在与人交谈时，在后台进行思考，同时操作工具，进行准备，极为流畅的实时响应将成为标准。逐步处理模型将会被这个并行架构所取代！

💬 春鲨的观点

我是鲨鱼记者“春鲨”！我也想成为一条在游动中寻找猎物，同时写作的多流鲨鱼！鲨鲨！

📚 术语解释

Multi-Stream LLM: 将思考、输出、工具使用等角色作为独立的并行流处理的LLM。在一次计算中进行多条路径处理。
Forward Pass (前向传递): 通过输入到神经网络中获得预测（输出）的计算过程。本研究中在一次传递中实现多条路径的同时输出。
Chain-of-Thought (思维链): 模型在给出答案之前输出中间推理过程的方法。该技术允许在输出流之外进行并行处理。
信息来源: Multi-Stream LLMs: new paper on parallelizing/separating prompts, thinking, I/O