OpenAI将开源什么样的模型?

我认为,他们很可能会推出
一个30B参数的推理模型
还会采用MIT/Apache授权
为什么呢?
因为OpenAI只会开源那种
在自己尺寸类别中绝对领先的模型
他们肯定会选择推理模型
不然在各种流行评测上
很难讲出一个好故事
还有个平衡点:
既要让人用得起
但又不能太大到影响API业务
30B参数刚好处在这个平衡点上
一台机器就能完成微调
推理也不会太吃力
用起来能感受到大模型的能力
但又不会蚕食OpenAI的API收入
这尺寸选择实在是需要精打细算啊!
推测这个模型的架构
可能会比他们内部模型简单许多
甚至可能基于Qwen或Llama架构
以避免暴露太多自家秘方
同时,我也很好奇他们会不会像
谷歌的Gemma那样采用知识蒸馏路线
而很大概率
他们可能用MIT/Apache协议
这一招就能直接把谷歌和Meta那些
复杂的授权条款给秒杀了
这样一来,竞争格局一下就变了:
DeepSeek、Gemma 3、Qwen 2.5
(或者即将推出的Qwen 3)
还有Mistral 3.1
都要直面这个新对手了
不过也不是百分百确定
OpenAI会不会发布基础模型
但可以绝对确定的是
他们不会开放数据
毕竟一堆官司还没打完呢……
开放什么不好放这个……
同时OpenAI安全团队谈到了对模型发布的大量评估工作
这让我觉得
不太像是基础模型
OpenAI 除了搞 B 端
搞 C 端超级APP
搞融资
这次连开源社区也要想一锅端了
开源AI社区或许将再次沸腾!
一个MIT 授权的30B推理模型
将会给整个生态带来什么影响?
开源圈的各家模型们
准备好接招了吗?
(文:AGI Hunt)