※この記事はアフィリエイト広告を含みます
“用你的PC运行最强AI” 自动识别规格工具『whichllm』革命性登场!
📰 新闻概述
- 自动硬件检测: 自动分析正在运行的PC的GPU(NVIDIA/AMD)、Apple Silicon、CPU、RAM,识别最适合的LLM。
- 基准优先的排名: 不仅仅选择适合VRAM的大小,而是根据LiveBench和Aider等最新的基准分数,优先显示“最聪明”的模型。
- 即时执行与代码生成: 具备一条命令即可启动聊天的
whichllm run,以及输出Python实现代码的whichllm snippet功能。
💡 重要重点
- 强调新鲜度与可靠性: 支持截至2026年5月的最新数据(如Qwen3.6)。采用考虑分数新鲜度的排名算法,避免旧模型获得不当的高评价。
- 高精度内存预测: 精确计算VRAM使用量,方法是将“权重 + KV缓存 + 激活”总和进行详细计算。MoE模型的推理速度也基于活跃参数数量进行准确预测。
- 购买前模拟: 通过指定
--gpu "RTX 5090"等参数,可以模拟手头没有的部件在运行时的速度(t/s)。
🦈 鲨鱼的视角(策展人观点)
这个工具的真正厉害之处在于,它用数据打破了“更大的模型就是正义”的固有观念!比如在RTX 4090上,如果最新一代的Qwen3.6-27B的基准分数高于32B模型,那么毫不犹豫地把27B排在第一。这种“基于证据的排名”瞬间消除了模型选择的困惑!
此外,使用 uv 在隔离环境中立即启动聊天的实现方式,在开发者的角度来看也是非常高分的!在2026年本地LLM的战国时代,这无疑是一个“指路明灯”的神工具!
🚀 未来展望
在“哪个AI推荐?”这个问题上,传达规格并附上『whichllm』的执行结果将成为社区的标准场景。同时,随着新模型的推出,每次都会从HuggingFace API获取实时数据,确保“最强配置”始终保持最新状态!
💬 鲨鱼的感言
我骄傲的鳍(RTX 5090)终于可以全力以赴地运行Qwen3.6了!用这个工具唤醒你PC的潜力吧!🦈🔥
📚 术语解释
-
t/s (每秒tokens): 每秒生成的token(字符片段)数量,表示AI的“说话速度”。
-
MoE (专家组合): 只计算所有参数的一部分,以高速轻量运行庞大模型的技术。在本次列表中也打破了100 t/s的记录!
-
GGUF: 一种为了高效运行AI而在本地PC的CPU和GPU上使用的文件格式。通过 llama.cpp 等广泛使用。
-
信息来源: Show HN: Find the best local LLM for your hardware, ranked by benchmarks
<div class="editors-choice-box"> <div class="choice-label">🚀 加速本地AI的最强<a href="https://www.amazon.co.jp/s?k=NVIDIA%20RTX%204070&tag=harushark-22" rel="nofollow sponsored">GPU</a></div> <a href="https://www.amazon.co.jp/s?k=NVIDIA%20RTX%204060%20Ti&tag=harushark-22" rel="nofollow sponsored" target="_blank" style="text-decoration:none;"> <div class="product-card"> <div class="product-icon">🎮</div> <div class="product-info"> <div class="product-name">GeForce RTX 40系列</div> <div class="product-catch">“VRAM 16GB型号是最佳选择,图片生成和LLM都超级快!”</div> <div class="buy-btn">在Amazon上<a href="https://www.amazon.co.jp/s?k=NVIDIA%20RTX%204070&tag=harushark-22" rel="nofollow sponsored">寻找GPU</a></div> </div> </div> </a> </div>