Kimi对标OpenAI多模态o1全球首次 kimi全面开放一周年之际,创始人杨植麟亲自发布新模型——数学模型k0-math,对标OpenAI o1系列,主打深入思考。在MATH、中考、高考、考研4个数学基准测试中,k0-math成绩超过o1-mini和o1-preview。在demo展示中,k0-math思考过程全面展示,解题过程可能会非常长。它会一边自言自语“我卡壳了”,一边不断尝试用各种思路。
以下面这道AIME竞赛题目为例,k0-math通过不断探索和试错,尝试了八九次做法后,最终得出了正确结果。杨植麟现场直言,很简单的问题有时它也会反复思考。比如遇到简单的“1+1等于几”,它要“先可视化一下”,“再检查一遍”、“用数学方式来确认”、“再用另一种方法来验证”,最终才能“信心满满”得出最终答案1+1=2。再比如4046/476等于多少,它其实一开始就得到了答案,但又进行反思经过一系列验证推出等于8.5。
在杨植麟看来,这是一个机遇,也是一个局限。预计在下一阶段的模型迭代中,会逐步改善这个问题,让模型能够自己知道何时需要深入思考。发布k0-math也反映出月之暗面现在的着重点——提升模型的深入思考能力、基于强化学习的Scaling Law。杨植麟表示最近Kimi探索版还运用强化学习技术创新搜索体验,提升了意图增强、信源分析和链式思考三大推理能力。(量子位)