🍹 Insight Daily 🪺
Aitrainee | 公众号:AI进修生
Hi,这里是Aitrainee,欢迎阅读本期新文章。
o3-mini和o3-mini (high) 今天要发布了。
普通用户也获得 o3-mini,plus用户能用上o3-mini (high),o3-mini (high) 在Codeforce上比o1高约200分,比o1更快、编码和数学表现更佳,成本却还是o1-mini的水平。
plus用户 o3-mini每天能用100次。不过o3-mini (high)的使用次数限制还需要进一步确认。
有网友说,是的,R1这么火,Openai 按不住了:
而且前面Qwen团队除夕发qwen2.5-max,春节,大家还是要卷,哈哈哈。。。
其实早在圣诞节直播时,Openai就宣布了o3 mini将在2025年年初提供:
我们还是要说一下什么是 o3 和 o3-mini?
o3:一种在编码、数学甚至面向 AGI 基准测试中表现出色的尖端推理模型。它为智能和问题解决设定了新的基准。
o3-mini:o3 的性价比版本,以极低的成本和速度提供卓越的性能。
这些模型将推理提升到了全新的水平,使复杂任务中的突破成为可能,这些任务需要深入理解和逻辑。
编程能力:实际编程准确率71.7%,超过o1整整20%。在Codeforces上达到2727分,已经超越人类水平。
数学水平:美国数学奥赛预选赛准确率近97%。就连最难的Epic AI前沿数学题,也能拿到25%的成绩。
最惊人的是Arc AGI测试:87.5%的成绩,首次在这个难度极高的基准测试上超越人类。
为什么 o3-mini 是颠覆性的创新,o3-mini带来两个改变。
自适应思考:可以根据任务难度调整推理深度,选择低、中、高三种模式。让AI更贴近实际使用场景。
性价比突破:比o1-mini成本低,响应更快,效果更好。
不过,网友感叹o3 high每项任务消耗1000美元:
此外,确实现在的模型太多了,具体如何切换模型,我们还有待确认:
🌟 知音难求,自我修炼亦艰,抓住前沿技术的机遇,与我们一起成为创新的超级个体(把握AIGC时代的个人力量)。
(文:AI进修生)