OpenAI的强化微调:RL+Science 创造新神还是灭霸?
OpenAI 发布了新的 Reinforcement Finetuning 方法,用于构造专家模型。只需上传少量数据,就能通过微调找到最合适的决策。该技术基于已广泛应用于 Alignment 和 Coding 的方法,并且适用于医疗诊断和科学决策等领域。不过,也引发了对潜在风险的关注。
OpenAI 发布了新的 Reinforcement Finetuning 方法,用于构造专家模型。只需上传少量数据,就能通过微调找到最合适的决策。该技术基于已广泛应用于 Alignment 和 Coding 的方法,并且适用于医疗诊断和科学决策等领域。不过,也引发了对潜在风险的关注。
OpenAI计划通过整合定制化的GPTs来彻底改变在线教育。Siya Raj Purohit透露,教师可以创建与课程结合使用的自定义聊天机器人,帮助学生进行个性化互动,提高研究能力和信息吸收能力。
北京时间周五凌晨,OpenAI发布了推理大模型o1及其订阅服务ChatGPT Pro。完整版o1模型比预览版更快、更准确,并支持图片输入和多模态输入。o1 Pro模式可提供更多的计算资源和支持更多功能,定价为每月200美元。
智谱公司计划在春节期间举办12场活动推广其产品和服务,包括AI小游戏、生成微信红包封面、AI视频生成等,以吸引更多用户参与,并借此与OpenAI竞争市场热度。
OpenAI 在其12天活动中发布了强化微调(Reinforcement Fine-Tuning)技术,并展示了ChatGPT Pro的演示。该技术允许用户通过极少量的数据定制模型,提高了其专业领域的推理能力。
吴恩达推出开源库aisuite,简化与多个大型语言模型的集成。该库允许用户通过更改字符串选择所需提供商和模型,提供标准化接口以便轻松使用不同供应商的语言模型。
OpenAI的Grok 3、Meta的Llama 3.3以及谷歌的新Gemini模型相继发布,引发热议。Llama 3.3表现出色,70B版本能实现405B的效果,并且成本更低;Gemini则成为最新lmsys大模型竞技场的榜首。此外,马斯克xAI的Grok 3也在传言中即将推出。