Justin Reese 归档

OpenAI发布季第二天：强化微调，少量样本就能训练自己的专家模型

2024年12月7日15时作者 Founder Park

OpenAI发布强化微调技术，允许开发者使用强化学习对模型进行定制化训练。通过监督学习方式提高模型在特定任务上的准确性，并增强其推理能力。

2024年12月7日13时作者 APPSO

OpenAI 推出强化微调（RFT）计划，优化 o1 模型在专业领域的推理能力，尤其适用于罕见遗传疾病诊断。

2024年12月6日4时作者 AI寒武纪

OpenAI 宣布推出 ChatGPT Pro 的全新升级版 o1，性能更强、功能更全面。Pro 版本为高精度需求用户提供专业模型选择，并引入‘4/4 可靠性’评估标准以提高准确性。OpenAI 还推出了 10 项奖助计划来支持科研机构和研究人员。