刚刚,奥特曼官宣开源:自GPT-2之后,我们要发首个带推理能力的开放权重模型
OpenAI 将在未来几个月发布一款具备推理能力的强大新型开放权重模型,训练参数公开,开发者可以分析和微调以执行特定任务。
OpenAI 将在未来几个月发布一款具备推理能力的强大新型开放权重模型,训练参数公开,开发者可以分析和微调以执行特定任务。
OpenAI宣布即将推出首个具备推理能力的语言模型,并完成了400亿美元融资用于Stargate项目。该模型计划在未来几个月内发布,且将向开发者收集反馈并展示原型。
北大团队研究发现,在训练数据中加入随机噪音并不会严重影响语言模型的性能。即使高达20%的数据被污染,模型的预测损失仅上升约1%,并提出局部梯度匹配方法进一步提升其鲁棒性。
OpenAI元老级人物Alec Radford即将离职进行独立研究,他在初代GPT、GPT-2及GPT-3等项目中均发挥重要作用。