当前位置：首页 > news >正文

30B小模型如何碾压1T大模型？MiroThinker推理能力实测，AI搜索新思路

news 2026/1/12 22:35:55

文章介绍了MiroThinker 1.5模型如何通过"Interactive Scaling"思路，让小模型(30B)战胜大模型。其核心优势在于实时搜索能力和严谨推理过程，能提供详细证据链而非简单答案。模型采用"时序敏感训练沙盒"避免"开天眼"现象，并以低成本实现高性能表现，为AI发展提供了新思路。

DeepSeek-V4什么时候发布？

我拿这个问题测了四个 AI。

ChatGPT 说「预计 2025 年 10 月前后」。问题是，现在已经 2026 年 1 月了。

Claude 说「春节前后」，没给依据。Gemini 说「2 月中旬」，也没说为什么。

第四个是 MiroThinker（dr.miromind.ai），一个 30B 参数的小模型。

它说「大概率 2 月 17 日，农历正月初一」。

然后给了四条证据链，区分了「能确定的」和「需观望的」，最后还给了业务排期建议。

同一个问题，回答质量差了一个量级。

它背后的模型叫MiroThinker 1.5，1 月 5 日刚发布。

01｜它是怎么得出「2 月 17 日」的

MiroThinker 没有直接给结论。

它先列了一个调查计划：官方论文节奏、去年R1时间线、mHC 论文措辞、中英文媒体报道、社交平台爆料。

五个方向，逐个搜索，全程可见。

最后的证据链是这样的。

去年R1是 1 月 20 日发的，春节前一周。DeepSeek 有「春节档发新品」的传统。

今年元旦的 mHC 论文里有一句「结论已通过内部大规模实验进一步证实」，这句话在之前的 NAS 论文里没出现过。MiroThinker 判断这可能暗示V4训练已完成。

多个媒体和社交平台的消息源，都指向同一个日期：2 月 17 日。

它还专门做了交叉验证：2026 年农历正月初一，确实是公历 2 月 17 日。

它甚至还区分了「能相对确定的」和「仍需观望的」，官方尚未发布正式公告，不排除因技术或监管原因顺延。

最后给了可操作建议：如果你要在业务里排期，按「春节后 1-2 周」做缓冲。

这些都是「查了信息源，交叉验证后推理出来的」。

而 ChatGPT 在 2026 年 1 月还在说「2025 年 10 月」。

这就是典型的「幻觉」，模型不知道自己不知道。

02｜又测了一道题

再来一题。

英伟达 2026 年股价怎么走？现在该买还是该卖？

这种问题，普通 AI 会说「我无法提供投资建议」，然后给你一堆免责声明。

MiroThinker 不一样。

它搜索了十几轮。先搜当前股价和估值，再搜分析师评级和目标价，然后是基本面数据、AI 芯片市场预测、竞争格局、地缘政治风险、技术面支撑位和阻力位。

结论是：当前股价 188 美元左右，华尔街平均目标价 250-270 美元，理论上还有 30-45% 上涨空间。但估值已经在高位，TTM 市盈率 46-47 倍，任何季度业绩不及预期都可能触发 20-30% 的回调。

更有意思的是，它区分了用户类型。

长期投资者，能扛 30% 回撤？现在更接近「可以分批买」的区间。

短线玩家，或者已经有大额浮盈？更接近「逢高减仓锁盈」的区间。

刚高位接盘压力很大？建议「降低仓位 + 拉长周期」，而不是情绪化止损。

它甚至给出了一个可执行的方案。把资金分 3-4 份，按价格区间慢慢买；设一个危险线，比如跌破成本价 25-30% 再集中审视；股价冲到 260-280 区间可以卖一半锁定利润。

最后它说，「我不能告诉你该买还是该卖，但基于以上信息，你可以自己判断。」

这才是正确的姿势。不是拒绝回答，是把决策所需的信息给你。

03｜30B 凭什么打赢 1T

MiroThinker 1.5是 MiroMind 的产品。创始人是陈天桥和代季峰。

陈天桥是盛大的创始人。代季峰是清华大学电子工程系副教授，论文引用 6 万次，CVPR 最佳论文奖得主。

MiroThinker 1.5有两个版本：30B 和 235B。

235B 版本在 BrowseComp 测试里拿下 69.8% 的准确率，刷新了ChatGPT Agent（68.9%）的纪录。

30B 版本 56.1%，但推理成本只有 0.07 美元一条，是Kimi-K2-Thinking的二十分之一，而且推理更快。

为什么小模型能打赢大模型？

过去两年大模型的主流逻辑是「大力出奇迹」。参数越多越好，把整个互联网语料背进脑子里，期待它能答对。

但这条路线有个问题，知识会过时。

MiroMind 换了个思路：「不让模型死记硬背，教它查资料。」

他们管这个叫Interactive Scaling。把算力花在对外交互上，而不是内部记忆上。

传统模型像做题家，背了一肚子知识，遇到新题从记忆里找最像的答案。

MiroThinker 像科学家，不确定就去查，查到矛盾就修正，直到证据收敛。

04｜为什么它知道「现在是 2026 年」

普通大模型训练时有个问题，它在数据里早就「见过结果」了。很多时候不是在预测，是在复述。

MiroThinker 的训练加了一层约束，模型只能看到「当前时间点之前」的信息。

这叫「时序敏感训练沙盒」。杜绝「开天眼」，以上帝视角作弊。

这就是为什么有的 AI 会在 2026 年还在说「2025 年 10 月」，而 MiroThinker 能准确判断「现在是 2026 年 1 月，V4还没发，根据最新信息推测是 2 月 17 日」。

新模型发布两天，已经有不少人用起来了。

评论区有人说「体验了一下，确实可以跟 GPT 扳手腕」，有人说「本地跑了一下，目前 30B 模型的 SOTA」，还有人直接给它起了个外号——「ChatGPT pro 青春版」。

搜索能力被提到最多，「单论搜索，确实有点东西」「实时搜索能力太强了」。

国外开发者的反应也差不多。

有人说「What is this magic?」，有人说「the thing is impressive, even in no pro mode」。

划重点

MiroThinker 1.5体验地址：dr.miromind.ai，开源，免费。

Hugging Face 模型下载：https://huggingface.co/miromind-ai/MiroThinker-v1.5-235B

Github 代码库：https://github.com/MiroMindAI/MiroThinker

它不会直接给你答案，但会告诉你答案是怎么来的。

01｜它是怎么得出「2 月 17 日」的

02｜又测了一道题

03｜30B 凭什么打赢 1T

04｜为什么它知道「现在是 2026 年」

划重点

相关文章：