独家|字节调整AI部门Seed,刚从Gemini加盟的吴永辉成新负责人

ChatGPT发布以来,首个从硅谷最重要AI团队回国的高管

面对DeepSeek给模型技术及应用模式带来的新冲击和挑战,字节的调整比以往更加迅速到来。

多位接近字节的人士对硅星人透露,字节的AI核心部门Seed正在快速调整定位和调兵遣将。刚刚从谷歌加入字节跳动的AI大牛、参与了Gemini开发的Google Fellow吴永辉博士,将成为Seed新的负责人,替换原LLM团队及Seed总负责人朱文佳,团队内部正在梳理调整汇报关系。

对此,硅星人向字节跳动求证,对方称:吴永辉博士主要负责AI基础研究探索工作,偏基础研究,朱文佳主要负责模型应用相关的工作,偏模型应用,两个人都在Seed部门,都向梁汝波汇报。

不过,硅星人此前梳理Seed组织架构时发现,朱文佳既负责Seed,同时分管Flow(模型应用),现仅负责模型应用即便职级不变,但实际此次调整管理范围收缩。

这一人事变动的时间点颇具深意。就在上周的内部全员会上,字节跳动CEO梁汝波刚刚反思了公司在AI领域的短板,对重大技术的跟进速度不够。

整个2024年,字节在应用层花费了大量功夫,在年末成功将豆包打造成了国内日活用户最高的AI应用。但进入2025年,在经历了DeepSeek R1的冲击后,字节开始意识到仅靠产品创新和流量优势,已不足以在AI时代保持领先。

“字节过去一年看起来豆包冲的比较凶,但豆包只是一个代号,背后大模型上的投入也很大,最后结果是语音模型发展得最好,而视频模型上和世界一流有一定差距,LLM发展一般,特别是没赶上DeepSeek这波,这应该是吴永辉加入的关键原因。”一位知情者说道。

一切指向字节对其AI业务组织架构的重新梳理,由吴永辉带领的Seed显然将聚焦模型基础研发,不再与应用等混合在一起。

#01

第一位回到国内大厂的硅谷大模型明星科学家,花落字节

在加入字节跳动之前,吴永辉在谷歌工作了17年。据Google Research官网介绍,他于2008年9月加入谷歌,最初是一名搜索排名工程师,负责改进谷歌的核心搜索算法。2014年,他转向了当时方兴未艾的深度学习领域,加入Google Brain团队,在2023年与DeepMind团队合并之后,成为了VP of Research,并被授予“Google Fellow”的称号。

从研究领域来看,吴永辉的成果涉及机器翻译、语音技术和大语言模型等多个领域。据谷歌学术显示,2020年以来,吴的论文引用超过了4万次。

其最著名的研究是在机器翻译领域。2016年,吴永辉参与的谷歌神经机器翻译系统(GNMT)是一个行业技术发展的关键节点——该系统首次将端到端深度学习引入翻译引擎,通过多层LSTM网络结合注意力机制与残差连接,使翻译错误率较传统短语系统降低60%。

GNMT背后,涉及到RNN、LSTM、Seq2Seq、Attention机制、 Beam Search、Encoder-Decoder架构等模型,在发布之初,曾引起了语言服务市场上的一阵骚动,不仅让汉英翻译全面转向神经网络架构,更推动谷歌翻译日均处理量突破1800万条,而后谷歌翻译开始用神经网络翻译提供9国语言的互译。

在大模型的浪潮下,吴永辉另一个令人瞩目的经历是参与了Gemini系列模型的开发工作,包括Gemini Family和Gemini 1.5,推动了模型在长上下文理解、跨模态推理等方面的突破。

在参与大模型基础研究方面, 吴永辉还在2022年的《GLaM: Efficient Scaling of Language Models with Mixture-of-Expert》中提到通过稀疏专家网络优化万亿参数模型训练效率,相比传统密集模型降低三分之二能耗,这项技术重塑了超大规模AI系统的工程范式。

在图像生成模型领域,吴永辉则是参与开发了CoCa图文基础模型(2022年,引用1453次)等数个图文模型;在语音技术领域,他参与开发的Conformer语音识别架构(2020年,引用3575次)和Tacotron端到端语音合成系统(2017年,引用2595次),主要聚焦于提升语音识别精度和简化语音合成流程,并且在加入字节前的2024年到2025年,他的研究重点基本集中在语音方向,包括更自然的语音合成、端到端语音系统和多语言语音合成等项目。

可以说,在 17 年的谷歌生涯中,吴永辉积累了横跨多个细分研究领域的成果和经验。即使在近两年来国内外大模型人才战十分密集,这样一位从硅谷大模型大厂回国加入国内大模型大厂的明星科学家也并不多见。

回顾2023年以来,人才流动或在创业和大厂之间流动,或在国内、国外分隔流动,例如百度、阿里、字节之间,谷歌、微软、OpenAI之间,这也意味着,此前对国外大厂的科学家而言,国内大厂的机会不够有吸引力,以及国内大厂向海外挖人需要高昂的代价。也正是因此,此次吴永辉从谷歌加入字节,值得被视为一个新的节点。

#02

字节AI大转向,从应用层开拓到模型层探索

此前,此前的字节AISeed部门由朱文佳负责。朱文佳曾任百度搜索部主任架构师,2015年加入字节跳动,负责算法工作,凭借在算法和搜索领域的卓越能力,被誉为“头条算法技术Top 3”,而后先后担任今日头条CEO、TikTok产品技术负责人,直到2023年,朱文佳开始组建字节跳动大模型团队,探索搜索和广告等业务应用,2024年晋升为直接向CEO梁汝波汇报的核心负责人。

“并不是说朱文佳做的不好,而是业务发展了2年,对字节这种保持变化活力的公司来说,有变动非常正常。”一位知情者说道。

这或许与上周字节的内部全员会有关。在会上针对AI业务,字节CEO梁汝波反思了字节对技术浪潮的错失,并提出2025年的重点目标,其一就是,追求“智能”上限,相比于追求某个具体产品——比如豆包的 DAU,把智能本身作为最重要的目标可以激发更多尝试、不忽略关键技术节点。

不久前,字节还正式设立代号为“Seed Edge”的研究项目,核心目标是做比预训练和大模型迭代更长期、更基础的 AGI 前沿研究,项目员工考核周期放慢,过程指标考核也被放宽, 鼓励探索更长周期、不确定的和大胆的课题。

将目标设为打破智能上限,意味着字节要继续与世界一流的基础大模型公司一较高低,颠覆了过去一年的“应用工厂”思路。而吴永辉的技术出身和经历,更适合带领字节AI探索基础模型的未来。

这不是字节第一次反思自己错过关键的技术节点。2024年年初,梁汝波就在内部反思“公司变迟钝了”,忽视了以Transformer为核心的语言模型。于是,整个2024年,“效率至上”的字节都在疯狂追赶进度。

一方面,在人才储备上面,原谷歌VideoPoet 的项目研究负责人、高级科学家蒋路、阿里通义千问大模型技术负责人周畅、零一万物原联合创始人和预训练负责人黄文灏等相继加入字节等等;另一方面,在架构和产品上,在产品和模型层同时赛马,向内部开放抖音的流量。

最终,字节成功地让豆包APP从吊车尾上涨到国内日活跃用户第一的AI产品。直到这个春节,DeepSeek R1 发布,在没营销的情况下,靠模型基础技术的突破,轻描淡写地将这一优势打碎了。

去年下半年,国内开始了o1追逐赛之后,通义千问的Qwen QwQ、阶跃星辰的R-mini,再到DeepSeek R1和Kimi 1.5都是推理模型,但字节一直没有推出相应的推理模型,并且至今豆包也没有接入DeepSeek。至此,字节开始反思第二次错过,全员会上,梁汝波反思说去年 9 月 OpenAI 发布长链思考模型,字节 “没有觉得要马上复现出来 。”

这种对关键节点的错失和延迟的追随,正在让字节变得不够“字节”。毕竟,在互联网时代,字节才是那把反应敏锐的创新尖刀。当下,所有人都在寻找AI时代的字节跳动,字节跳动自己似乎仍停留在互联网模式里。

此次找来谷歌AI核心人物,字节AI必然会重新梳理AI路线和方法。不单纯地躺在流量王国之上,走在技术创新的前列,正如梁汝波所说,“做科技公司还不够,得做创新科技公司,不仅要应用好新技术,还要能探索、发明新技术。”

但这对字节来说并不是一件容易的事。突破技术的边界,和做最能洞察消费者的应用,是两个逻辑。这需要字节一定程度上跳出既有方法论和惯性,首先或许就是,要有更明确的技术思路,而不是靠赛马测试。

(文:硅星GenAI)

欢迎分享

发表评论