O3-mini 归档 - 每时AI

2天完成人类12年工作，AI自动更新文献综述，准确率碾压人类近15%

2025年6月16日23时作者量子位

多伦多大学和哈佛医学院等机构开发的AI系统otto-SR可以在两天内完成传统方法需12年的工作，显著提高了医学研究领域中Cochrane系统评价的效率。otto-SR结合GPT-4.1和o3-mini进行筛选和数据提取，相比人类评审员表现出更高的准确性和灵敏度。

2025年6月16日8时作者新智元

新智元报道
编辑：桃子
17家研究机构联手AI，仅用两天时间完成科学家12年的系统综述研究。结果显示，AI在文献筛选、数据提取等方面效率高超，准确率媲美甚至超越人类。

2025年5月9日16时作者 AI寒武纪

OpenAI正式推出强化微调（RFT），通过思维链推理和任务专属评分机制提升模型特定领域的性能。目前已开放给经过验证的组织使用，并提供折扣优惠和指南。RFT适用于需要正确且可验证决策的工作流，已在芯片设计、医疗编码分配及税务分析等多个领域展示出色效果。

2025年4月10日8时作者 NLP工程化

DeepCoder-14B-Preview：一个完全开源的代码模型，与 o3-mini 相当，数据集、代码和训练日志已公开，可于Together AI试用。

2025年4月1日16时作者财联社AI daily

北京时间4月1日，OpenAI宣布将在未来几个月内发布一个‘强大且具备推理能力的新开放权重模型’，这是GPT-2发布以来的首次新模型计划。尽管OpenAI曾以’开放’命名，但其模型近年来大多采用了封闭策略。此次开放模型旨在为开发者、企业和政府提供更好的部署和使用体验，但仍会保留部分关键组件。

2025年3月25日11时作者新智元

本文介绍了当前科研人员青睐的AI模型：o3-mini、DeepSeek-R1、Llama、Claude 3.5 Sonnet和Olmo 2。它们各有优劣，但为科研人员提供了多样选择。

2025年3月24日14时作者 AI信息Gap

去年圣诞节前后，OpenAI 开启了 ‘数据共享计划’，用户每天可免费获得总计1100万 tokens，其中包括gpt-4.5-preview、o3-mini等模型的API。最新活动延长至2025年4月30日，并推荐使用。但需注意不要上传任何隐私或敏感数据。