昨晚,在使用Kimi中,意外发现它的k0-math数学模型已经上线了。
在侧边栏,可以看到那个戴眼镜的同学,正是Kimi数学版。
简单来说就是,Kimi推出了类o1模型的k0-math模型,采用Self-play RL强化学习和Cot思维链技术,可模拟人类的思考和反思过程,特别擅长解决数学问题、推理问题,智力程度可比博士。
Kimi脑海中先后闪现了最基础算术、二进制、群域环抽象代数、维度计算、集合论、抽象代数、模运算、数轴计算、递归计算等近20种计算方法,最后得出自信的结论:2。
作为一个AI科技自媒体,我一直想知道什么时候我能够达到100万的粉丝,让Kimi数学版帮我算算?
问题1:我是一个自媒体博主,假设我发每1篇文章增长100个粉丝,目前我有10万粉丝,我每月发文20篇,需要多久可以才能达到100万粉丝?如果是日更呢,又要多久?
内容太长,截图未展示全,可访问这个链接查看全部回答:
https://kimi.moonshot.cn/share/ct1dhtprdij3dq4lkiq0
好家伙,达到100万粉丝,月更20篇,需要37年;保持日更,需要24年。这是计划让我干到退休,才能达到100万粉啊!各位,知道你们点赞、在看和转发三连的重要性了吧,真的拜托了!!
1/17721088,一千七百万分之一,算了算了,我还是安心做牛马吧。关键是,彩票本身就不科学……
看到这里,有细心朋友可能会发现,前面2个问题里,我都打错了字。
但Kimi还是准确识别出了我的意图,并进行运算,这正是新版Kimi探索版和数学版的一大特点——可以理解用户的模糊表达,并进行推理或运算。
也就是说,尽管我们的提问不是很准确,但Kimi还是能够懂你,然后帮你进行计算。
这对普通人来说,是真的有用。因为,我们大多数人(也包括我)其实都很难做到准确表达。打错字导致的同音字、多音字、同形字,日常中经常出现。然而Kimi就像你的老朋友一样,依然能够懂你,帮你。
冬天来了,想控制体重,问问Kimi能不能帮我制定一个饮食计划。
问题3:我目前体重62kg,每周运动4天,我希望在2025年春节前能够保持这个体重,请帮我设计一个健康饮食计划——从周一到周日每天的卡路里摄入量,并根据我的摄入量告诉我每天应该吃些什么。
Kimi的推理过程真的超长,大概有9000多字……这里我只截了一部分,可访问这个链接查看全部回答。
https://kimi.moonshot.cn/share/ct1e7sa1n4gn49dgehb0
也可以让Kimi直接输出一张表,我这就打印出来,贴家里冰箱上。
小时候看《西游记》,对凤仙郡祈雨的故事特别好奇,到底鸡要多久才能吃完米,狗要多久才能舔完面。
问题4:鸡吃完1000吨的米山、狗舔完1000吨的面山,哪个更快?
14705882天(4万年)、4396476天(1360年),好家伙,玉帝你是根本就不打算降雨吧。等鸡吃完米、狗舔完面,人间早已度过数万春秋。
因为Attention机制,有很多AI在草莓问题(统计strawberry中有几个r)上认栽,那k0-math模型这次表现如何呢。
不要小看这个统计问题,时至今日,无Cot思维链的模型,大概率是答不对的。如果答不对,用户怎能放心地把提效工作交给AI?
比如说,统计某个表xx姓有多少人,对xx特征的数据集进行提取,整理发票中xx公司的金额……这些都是非常具体的工作场景问题。如果你家的模型统计不准,常有数据丢失,我怎敢用?
Kimi数学版似乎解决掉了这一问题,欢迎大家来测,将你的体验结果分享在评论区。
那推理方面呢,Kimi数学版有没有提升?我们问2个常见的推理测试题,熟悉沃垠AI的朋友都知道,这是我们的老演员了。
问题6:小红有3个兄弟,4个姐妹,那么小红的兄弟有几个姐妹?
问题7:假如地球上所有人都站在同一个地方同时起跳落地,地球会发生什么?
上点难度,问问Yann LeCun设计的一个经典的机械传动问题,经常被用来测试和评估AI的逻辑推理和理解能力。
问题8:7 axles are equally spaced around a circle. A gear isplaced on each axle such that each gear is engaged with the gear to its left and the gear to its right. Thegears are numbered 1 to 7 around the circle. lf gear 3 were rotated clockwise, in which direction would gear7 rotate?
比如这道本科的金融题。
问题9:假设你用保证金购买了500股ABC公司的股票,每股50美元,保证金要求是60%,保证金利率10%(年化)。如果你1年后以每股45美元卖出股票,并且没有收到任何的保证金追加通知,请问你的投资回报率(ROI)是多少?
答案是-23.33%。原本的ROL应该是-10%((50-45)/50=10%),但是上了杠杆,亏损翻倍。所以啊,普通人投资,千万别加杠杆。
伽利略·伽利莱曾说过这样一句话:“宇宙这本书是用数学语言写成的,除非你首先学懂了它的语言,否则这本书是无法读懂的。”
对于人工智能,尤为如此。一年前,我们还在为LLM的文本生成能力惊叹;一年后,LLM的发展便来到了一个新的高度——可解数学问题。
今年下半年,AI拿下奥赛银奖,助攻顶尖数学家破解难题,帮助人们解锁工作、生活中的挑战性任务……智能的边界正在不断拓展。
基于Cot思维链和Self-play RL强化学习技术提升的LLM数学推理能力(代表模型:o1、kO-math、DeepSeek R1等),让AI在各个领域和场景的推理能力和智能水平进一步提升。
Kimi,作为China AI的佼佼者,率先完成Cot技术布局,推出数学模型k0-math,并开放可用,交出了一份非常亮眼的答卷。
在MATH中,k0-math模型拿到93.8分,超过o1-mini、o1-preview。
不愧是China AI Top级产品,期待Kimi未来更佳的表现。
(文:沃垠AI)