推理能力归档 - 第4页共5页

实测豆包全家桶，推理、视觉、语音能力大增，唱歌居然跑调

下午2时 2025/01/24 作者 AI先锋官

临近春节，豆包1.5 Pro发布，包含基础模型、视觉和实时语音模型。测试显示其推理能力、视觉理解能力和语音识别能力均有提升，但仍有待提高。基础模型已开始灰度测试，其他两个模型已上线。

下午4时 2025/01/21 作者新智元

中国版o1 DeepSeek R1通过大规模强化学习训练，在多项任务中与OpenAI o1打成平手，展示了不依赖监督微调数据也能显著提升推理能力的潜力。

下午4时 2025/01/12 作者机器之心

加州大学伯克利分校发布Sky-T1-32B-Preview，其训练成本不到450美元。该模型在多个关键基准测试中与OpenAI o1的早期版本相当，并且是首个开源的推理模型。

下午2时 2025/01/09 作者 AI信息Gap

木易在‘AI信息Gap’公众号分享了Perplexity近期添加o1模型作为搜索底层模型的消息，强调o1是推理模型，拥有8个高级模型支持，并指出其昂贵的API费用限制了每日使用次数。通过2、3、5、12和四则运算测试展示了o1的强大能力。

下午12时 2024/12/31 作者 APPSO

像人类一样思考的 AI 离我们还有多远？
在道格拉斯·亚当斯的科幻小说《银河系漫游指南》中，一个高纬

下午8时 2024/12/25 作者智东西

国产AI模型多点开花。
作者 |
徐豫
编辑 |
漠影
还有不到一周就2025年了，各大社交音娱平台

下午2时 2024/12/22 作者量子位

明敏克雷西发自凹非寺
量子位 | 公众号 QbitAI
GPT-5被曝效果远不达预期。
Ope

下午2时 2024/12/22 作者机器之心

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000

下午12时 2024/12/21 作者甲子光年

是的，他们跳过了o2。
作者｜苏霍伊
‍
‍
编辑｜王博
‍
‍
北京时间12月21日，OpenAI