机器之心，作者每时AI - 第97页共105页

OpenAI 12连发第2弹：强化微调，少量样本就能训练自己的专家模型

下午1时 2024/12/07 作者机器之心

OpenAI 发布了强化微调技术，允许开发者使用强化学习针对具体任务对模型进行进一步的微调，并根据提供的参考答案对模型的响应进行评分。这种技术能提高其在特定领域上的C2任务上的准确性，并增强模型对类似问题的推理能力。

下午1时 2024/12/07 作者机器之心

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000

下午1时 2024/12/07 作者机器之心

机器之心报道
机器之心编辑部
现实世界版的 Genie-2？
最近，世界模型（World Model

下午1时 2024/12/07 作者机器之心

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000

下午1时 2024/12/07 作者机器之心

机器之心报道
机器之心编辑部
刚刚，美国电子电气工程师学会（Institute of Electri

上午4时 2024/12/06 作者机器之心

机器之心报道
机器之心编辑部
一天前，OpenAI 官方 X 账户的一条推文将 AI 社区的期待值拉

下午1时 2024/12/05 作者机器之心

NeurIPS颁发时间检验奖给Ian Goodfellow的GAN论文，GAN自提出十年内引用超8.5万次。作者Sherjil Ozair回忆了GAN诞生过程及人工智能在过去十年的发展。

上午11时 2024/12/05 作者机器之心

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000

上午11时 2024/12/05 作者机器之心

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000

上午11时 2024/12/05 作者机器之心

机器之心报道
机器之心编辑部
昨晚，世界模型向前迈出了一大步！
Google DeepMind 震撼