简单聊聊小米今天开源这个「Xiaomi MiMo」到底强在哪?
我不是专业人士,只是尝试用最通俗易懂的方式,给大家讲一讲。
首先你需要知道两点,
1,目前主流这些推理模型,比如Open AI,参数量都是32B;
2,DeepSeek之前的论文里说,7B的参数量没法训练出模型的RL能力,或者说学习能力,还不如蒸馏;
你再看就很清晰了,「Xiaomi MiMo」只有7B的参数规模,但是逻辑推理能力完全不输给Open AI这些目前最热门的开源大模型。
所以可以得出的结论是,小米的AI团队是真有点东西,能够找到一条效率更高、效果更好的训练方法。
或者说,这是小米在AI领域的阶段性成果,只是宣传的少,但并不是没做。
这算是很强的利好信号,也是今天股票涨了的核心原因之一。
另外还有一点是,模型的参数量小,才可以部署在端侧,也就是在设备本地运行。
本地运行又有什么优势?
比如音响、手表等,如果具备端侧AI的能力,那么使用体验、交互都会有质的提升,小米人车家战略的含金量继续提升。
不过这里有个问题是,7B的参数量对端侧来说还是偏大,据说小米后续还会继续优化,会有参数量更小、能够直接部署在端侧的大模型出现。
Xiaomi MiMo