"用你的PC运行最强AI" 自动识别规格工具『whichllm』革命性登场！

#本地LLM #Qwen #GPU

※この記事はアフィリエイト広告を含みます

“用你的PC运行最强AI” 自动识别规格工具『whichllm』革命性登场！

📰 新闻概述

自动硬件检测: 自动分析正在运行的PC的GPU（NVIDIA/AMD）、Apple Silicon、CPU、RAM，识别最适合的LLM。
基准优先的排名: 不仅仅选择适合VRAM的大小，而是根据LiveBench和Aider等最新的基准分数，优先显示“最聪明”的模型。
即时执行与代码生成: 具备一条命令即可启动聊天的 whichllm run，以及输出Python实现代码的 whichllm snippet 功能。

💡 重要重点

强调新鲜度与可靠性: 支持截至2026年5月的最新数据（如Qwen3.6）。采用考虑分数新鲜度的排名算法，避免旧模型获得不当的高评价。
高精度内存预测: 精确计算VRAM使用量，方法是将“权重 + KV缓存 + 激活”总和进行详细计算。MoE模型的推理速度也基于活跃参数数量进行准确预测。
购买前模拟: 通过指定 --gpu "RTX 5090" 等参数，可以模拟手头没有的部件在运行时的速度（t/s）。

🦈 鲨鱼的视角（策展人观点）

这个工具的真正厉害之处在于，它用数据打破了“更大的模型就是正义”的固有观念！比如在RTX 4090上，如果最新一代的Qwen3.6-27B的基准分数高于32B模型，那么毫不犹豫地把27B排在第一。这种“基于证据的排名”瞬间消除了模型选择的困惑！此外，使用 uv 在隔离环境中立即启动聊天的实现方式，在开发者的角度来看也是非常高分的！在2026年本地LLM的战国时代，这无疑是一个“指路明灯”的神工具！

🚀 未来展望

在“哪个AI推荐？”这个问题上，传达规格并附上『whichllm』的执行结果将成为社区的标准场景。同时，随着新模型的推出，每次都会从HuggingFace API获取实时数据，确保“最强配置”始终保持最新状态！

💬 鲨鱼的感言

我骄傲的鳍（RTX 5090）终于可以全力以赴地运行Qwen3.6了！用这个工具唤醒你PC的潜力吧！🦈🔥

📚 术语解释

t/s (每秒tokens): 每秒生成的token（字符片段）数量，表示AI的“说话速度”。
MoE (专家组合): 只计算所有参数的一部分，以高速轻量运行庞大模型的技术。在本次列表中也打破了100 t/s的记录！
GGUF: 一种为了高效运行AI而在本地PC的CPU和GPU上使用的文件格式。通过 llama.cpp 等广泛使用。

信息来源: Show HN: Find the best local LLM for your hardware, ranked by benchmarks

  <div class="editors-choice-box">
      <div class="choice-label">🚀 加速本地AI的最强<a href="https://www.amazon.co.jp/s?k=NVIDIA%20RTX%204070&tag=harushark-22" rel="nofollow sponsored">GPU</a></div>
      <a href="https://www.amazon.co.jp/s?k=NVIDIA%20RTX%204060%20Ti&tag=harushark-22" rel="nofollow sponsored" target="_blank" style="text-decoration:none;">
          <div class="product-card">
              <div class="product-icon">🎮</div>
              <div class="product-info">
                  <div class="product-name">GeForce RTX 40系列</div>
                  <div class="product-catch">“VRAM 16GB型号是最佳选择，图片生成和LLM都超级快！”</div>
                  <div class="buy-btn">在Amazon上<a href="https://www.amazon.co.jp/s?k=NVIDIA%20RTX%204070&tag=harushark-22" rel="nofollow sponsored">寻找GPU</a></div>
              </div>
          </div>
      </a>
  </div>