OpenAI归档 - 第80页共89页

OpenAI的强化微调：RL+Science 创造新神还是灭霸？

下午2时 2024/12/08 作者机器之心

OpenAI 发布了新的 Reinforcement Finetuning 方法，用于构造专家模型。只需上传少量数据，就能通过微调找到最合适的决策。该技术基于已广泛应用于 Alignment 和 Coding 的方法，并且适用于医疗诊断和科学决策等领域。不过，也引发了对潜在风险的关注。

下午12时 2024/12/08 作者多知

OpenAI计划通过整合定制化的GPTs来彻底改变在线教育。Siya Raj Purohit透露，教师可以创建与课程结合使用的自定义聊天机器人，帮助学生进行个性化互动，提高研究能力和信息吸收能力。

上午8时 2024/12/08 作者 AI寒武纪

2024年12月3日，加州大学洛杉矶分校（UCLA）数学教授暨菲尔兹奖得主陶哲轩（Terence T

下午1时 2024/12/07 作者财联社AI daily

北京时间周五凌晨，OpenAI发布了推理大模型o1及其订阅服务ChatGPT Pro。完整版o1模型比预览版更快、更准确，并支持图片输入和多模态输入。o1 Pro模式可提供更多的计算资源和支持更多功能，定价为每月200美元。

下午1时 2024/12/07 作者 AI前线

OpenAI 在其12天活动中发布了强化微调（Reinforcement Fine-Tuning）技术，并展示了ChatGPT Pro的演示。该技术允许用户通过极少量的数据定制模型，提高了其专业领域的推理能力。

下午1时 2024/12/07 作者 AI前线

吴恩达推出开源库aisuite，简化与多个大型语言模型的集成。该库允许用户通过更改字符串选择所需提供商和模型，提供标准化接口以便轻松使用不同供应商的语言模型。

下午1时 2024/12/07 作者量子位

OpenAI的Grok 3、Meta的Llama 3.3以及谷歌的新Gemini模型相继发布，引发热议。Llama 3.3表现出色，70B版本能实现405B的效果，并且成本更低；Gemini则成为最新lmsys大模型竞技场的榜首。此外，马斯克xAI的Grok 3也在传言中即将推出。