来源:51CTO官微、科技每日推送、第一财经
雷军,亲自挖人了。
知情人士称,雷军认为小米在大模型领域发力太晚,于是亲自挖人,重金招募能够领军小米大模型的人才。
而且雷总已经初战告捷——帮小米赢得了 DeepSeek 的关键骨干罗福莉。据报道,作为95后的 AI 天才少女或将供职于小米 AI 实验室,领导小米大模型团队!
支付的薪酬,在千万元级别。
罗福莉,出生在四川小城一个普通家庭,上大学前没怎么接触过电脑,误打误撞进了北师大计算机专业。
因为基础太差,刚开始成绩垫底。
但靠着天赋和努力,很快跃升到前几名,并保研进入北京大学计算语言学研究所。
自此之后,罗福莉被关注的“传奇人生”就开始了。
身为北大硕士的她,因在 NLP 国际顶会 ACL 上发表 8 篇论文(其中 2 篇一作)而迅速走红,受到颇多关注。
毕业后,她又加入阿里达摩院机器智能实验室。
罗福莉主导开发的多语言预训练模型 VECO(同时支持多语言理解和生成的跨语言模型),被纳入阿里达摩院深度语言模型体系 AliceMind。
2022年,罗福莉离开阿里,加入 DeepSeek 担任深度学习研究员,参与 MoE 大模型 DeepSeek-V2 的开发。
在 DeepSeek-V2 发布后,她在知乎回答了相关话题,并且十分“接地气”地宣传 V2 是“性价比之王”。
不得不说,这种亲切、朴实的互动风格,还挺“米味”满满的。
即将加入小米大展拳脚的罗福莉,正印证着自己“不忘初心,一步一个脚印”的诺言。
那么,她将供职的小米 AI 实验室是什么情况,为什么雷军会急着亲自下场广纳人才?
不怪雷总着急,相比友商,小米在大模型上的发力确实晚了。
大家猜一下,小米小爱目前用的哪家模型:小米大模型?文心一言?阿里通义?字节豆包?
2023 年 4 月,小米 AI 实验室下设了专门的大模型团队。
同年11月,AI实验室主任王斌接受采访时,明确表示过小米不做 ChatGPT、不搞 AI 的军备竞赛。
小米对需要大规模“烧钱”的预训练显得尤为谨慎。“内部认为,轻量级模型亦有其存在的市场空间,且在某些特定任务上相比千亿大模型亦能具备一定的优势。”
当时,王斌透露,“专职大模型团队员工30多人,不会马上极速扩张;这个团队的目标还是通用语言大模型,第一步的目标基座模型参数在几百亿,然后会视前期爬坡结果,再决定下一步投入。”
作为对比,前年11月,vivo已经推出第一代蓝心大模型矩阵,包括十亿、百亿、千亿三个参数量级的五款语言大模型。
并且,在手机厂商中比对,小米大模型也显得太低调,宣传不足。
今年年底的多场旗舰机发布会中,大模型都作为重中之重,使用了大量的篇幅介绍自家的智能技术。而小米 15 整体的篇幅不足,更别提对大模型的介绍。一方面,这与小米向造车倾斜的转向有关,另外,小米这样做也在考量“产品优先”的原则。
在被询问小米大模型团队,是否会发布阶段性成果时,王斌回复道“跟其他公司不太一样,小米天生带着产品的属性,我相信小米大模型出来的时候,是由产品带着出来。”
在其他手机厂商 All in AI 时,小米默默地落后了。可能,当今年国产手机纷纷玩起智能体点餐时,小米才警觉其中的差距。
不过,小米的奋起直追,还有很大机会。毕竟小米的“人车家”战略最不缺大模型的落地场景,一旦储备了丰富的人才和技术积累,把这块短板补上来。
米系的小爱同学、IoT、自动驾驶、机器人等等,无数的应用场景能迅速反哺大模型的能力。这也使得小米大模型的上限会很高。
根据资料,小米AI实验室大模型团队的负责人是栾剑,向AI实验室主任王斌汇报。
栾剑此前曾担任小米技术委员会 AI 实验室语音生成团队的负责人。在此之前,他曾担任东芝(中国)研究院研究员、微软(中国)工程院高级语音科学家、微软小冰首席语音科学家以及语音团队负责人等职位。
若罗福莉领军大模型团队的消息属实,尚不知道栾剑的任职将如何调动。
根据去年的资料,该团队目前 AI 领域相关人员已超 1200 人。
相信在雷军给出发力大模型的信号之后,相关人才的招聘会更加如火如荼的进行。
在小米招聘的官方页搜索就可以发现,仅北京地区大模型相关岗位就多达 59 个职位,还开放了众多的负责人等管理岗虚位以待。
(文:Datawhale)