OpenAI将开源什么样的模型?

OpenAI将开源什么样的模型?

我认为,他们很可能会推出

一个30B参数的推理模型

还会采用MIT/Apache授权

为什么呢?

因为OpenAI只会开源那种

在自己尺寸类别中绝对领先的模型

他们肯定会选择推理模型

不然在各种流行评测上

很难讲出一个好故事

还有个平衡点:

既要让人用得起

但又不能太大到影响API业务

30B参数刚好处在这个平衡点上

一台机器就能完成微调

推理也不会太吃力

用起来能感受到大模型的能力

但又不会蚕食OpenAI的API收入

这尺寸选择实在是需要精打细算啊!

推测这个模型的架构

可能会比他们内部模型简单许多

甚至可能基于Qwen或Llama架构

以避免暴露太多自家秘方

同时,我也很好奇他们会不会像

谷歌的Gemma那样采用知识蒸馏路线

而很大概率

他们可能用MIT/Apache协议

这一招就能直接把谷歌和Meta那些

复杂的授权条款给秒杀了

这样一来,竞争格局一下就变了:

DeepSeekGemma 3Qwen 2.5

(或者即将推出的Qwen 3)

还有Mistral 3.1

都要直面这个新对手了

不过也不是百分百确定

OpenAI会不会发布基础模型

但可以绝对确定的是

他们不会开放数据

毕竟一堆官司还没打完呢……

开放什么不好放这个……

同时OpenAI安全团队谈到了对模型发布的大量评估工作

这让我觉得

不太像是基础模型

OpenAI 除了搞 B 端

搞 C 端超级APP

搞融资

这次连开源社区也要想一锅端了

开源AI社区或许将再次沸腾

一个MIT 授权的30B推理模型

将会给整个生态带来什么影响?

开源圈的各家模型们

准备好接招了吗?

(文:AGI Hunt)

欢迎分享

发表评论