OpenAI要开源了?真相是→

北京时间4月1日,OpenAI宣布将在未来几个月内发布一个‘强大且具备推理能力的新开放权重模型’,这是GPT-2发布以来的首次新模型计划。尽管OpenAI曾以’开放’命名,但其模型近年来大多采用了封闭策略。此次开放模型旨在为开发者、企业和政府提供更好的部署和使用体验,但仍会保留部分关键组件。

OpenAI“撒钱”模式再升级:每天1100万免费Tokens,GPT-4.5也来了!

去年圣诞节前后,OpenAI 开启了 ‘数据共享计划’,用户每天可免费获得总计1100万 tokens,其中包括gpt-4.5-preview、o3-mini等模型的API。最新活动延长至2025年4月30日,并推荐使用。但需注意不要上传任何隐私或敏感数据。

陶哲轩亲测点赞,o3-mini秒证图论难题!专家级证明完整呈现

陶哲轩分享了使用AI(o3-mini)辅助证明数学难题的故事,包括成功解决了Ruzsa-Szemeredi的三角形移除引理,但当面对研究级别的问题时表现不佳。他指出,大模型在快速提供标准论证细节方面是优秀的用例,但仍需用户详细引导和验证答案的准确性。

谷歌发布BIG-Bench超难基准:DeepSeek-R1得分6.8,只有o3-mini超过10分

近日,谷歌发布了一项高难度基准BIG-Bench Extra Hard(BBEH),旨在评估AI模型的高阶推理能力。该基准包含了23个任务,并将每个任务替换为更难的任务,覆盖更多方面的技能需求。如o3-mini (high)得分为44.8分不及格,而其它模型得分不超过10分。