今天,又一个国产AI工具成功超越了曾经同领域的AI大模型,月之暗面 Kimi发布上线了视觉思考模型 k1,该模型基于强化学习技术打造,原生支持端到端图像理解和思维链技术,并将能力扩展到数学之外的更多基础科学领域。
Kimi这次上线的K1大模型,在数学、物理、化学等基础科学学科的基准能力测试中,初代k1 模型的表现超过了 OpenAI o1、GPT-4o 以及 Claude 3.5 Sonnet。

这次Kimi从k0升级到k1大模型图像理解,把之前kimi数学推理模型k0-math无法解决的几何图形问题给解决了,同时还对标了OpenAI的o1模型,各项成绩都均有小超越,在解决初级几何图形问题上暂时是平手的状态。

k1 视觉思考模型已上线最新版“Kimi 智能助手”的手机App 以及电脑端网页版中点击“Kimi 视觉思考版”,即可拍照或传图体验。
Kimi网页版登录地址:
https://kimi.moonshot.cn/
不是官方说K1的几何能力出众吗?索性我找了个高三的立体几何综合练习题,检验一下Kimi的K1几何能力,看看Kimi给出的回答。


Kimi的K1在思考的途中还会自主纠错,就像一位老师在为同学答疑解惑,好像在告诉你为什么不能用这个思路来解答这道题。

k1 的强化学习后训练在数据质量和学习效率方面做了进一步优化,在强化学习的规模化上取得了新的突破。
我们接下来再测试下K1的化学能力,也是同样找了道高三的题目,来看下Kimi是如何回答的。


发现Kimi从来不会直接给你答案,会把每种可能性都给你一一列举出来,告诉你解题的思路,可以说是很详细了。
除了在数理化问题中能得到解决,Kimi 官方还展示,能够识别和分析古老的科学手稿。官方的示例中,k1 成功分析出了一份出自伽利略之手的手稿。我们在这里找了一张《清明上河图》中的图片,再测试下Ki的文学方面的能力是否像官方展示的那么准确。


Kimi的新视觉思考功能还有很多,不仅能辅助学习,而且使用的用户发送的随意图片也可以进行细致观察和分析。使用者可以询问Kimi关于拍摄照片的地点,Kimi将根据图片内容作出猜测,提供更便捷的服务体验。
官方则谦虚的表示K1也不是十全十美的,在最近进行的内部评估中,k1视觉思考模型在某些领域的表现尚有待提高。
具体来说,该模型在面对分布外数据的泛化能力、处理复杂问题时的成功率、在高噪声环境下的准确度以及多轮对话的效果等方面,都显示出了改进的潜力。此外,与OpenAI的o1系列模型相比,k1在某些场景和泛化能力方面还存在一定的差距。
经过一系列的测试,这次Kimi发布的K1大模型真的很牛,不仅把之前的K0大模型集成进去了,还又一次做了升级。功能不仅强大,主要还免费!
今年的中考、高考生有福了,需要辅导学习的家长们可以尝试一下,或是还有别的需求的小伙伴感兴趣也都可以尝试一下!