字节跳动 Top Seed 大模型顶尖人才计划启动了

字节跳动是国内少数几家坚持AI模型自研的公司,这就对模型基础设施建设能力提出很高要求了。就在刚刚,字节启动了2026届Top Seed校招计划,目标是在全球范围内招募约30名顶尖博士,涵盖大语言模型、多模态生成、机器学习算法等关键领域。


该计划已经连续第三年举办,它是以前5%人才为目标进行高规格招募的。在当前科技公司校招普遍收缩背景下,我认为字节这一举措的背后,是一场围绕大模型时代底层基础设施的较量。


⋯ ⋯


过去十年,字节跳动的核心竞争力一直建立在推荐算法与流量分发的应用层创新之上。


然而,大模型的出现彻底颠覆了传统AI技术栈。当模型参数量突破万亿级,训练成本呈指数级攀升时,单纯依赖开源框架或第三方云计算服务已无法满足技术突破的需求。


OpenAI每年超过20亿美元的算力投入,以及谷歌对TPU芯片的定制化开发,都充分表明大模型竞争已演变为一场涵盖芯片、框架、数据、算法的全栈战争。


字节的Top Seed计划,所涉及的研究方向也透露出其战略布局。除了常规的大语言模型外,机器学习算法与系统、多模态生成与理解的并列出现,暗示其正试图构建从分布式训练框架到多模态推理引擎的完整技术栈。


这与谷歌在Transformer架构上的布局颇为相似,2017年发布的相关论文看似是学术突破,实则为后续BERT、PaLM等模型奠定了坚实的基础设施基础。


当行业还在热议百模大战时,头部玩家已悄然转入底层技术标准的争夺战。


⋯ ⋯


Top Seed计划强调“不限专业背景,专注研究潜力”,这一策略在AI人才争夺中显得颇具迷惑性。


从表面上看,这体现了对创新思维的开放态度,但实际上却暴露了大模型研发的深层困境:传统计算机学科培养的人才,往往难以突破现有的技术范式。


以多模态生成方向为例,当前主流方法仍停留在对齐文本与图像的嵌入空间,但人类认知的本质是跨模态信息的神经同步处理。一位神经科学博士或许比计算机博士更早发现:借鉴大脑视觉皮层与语言区的连接机制,或许能够设计出更高效的跨模态注意力模型。


字节在2024年开源的多模态框架UI-TARS 1.5中,它的动态权重分配算法便受到生物神经元脉冲编码机制的启发,跨学科降维打击正在重塑AI研发的人才结构。


风险同样存在,并没有减少。来自物理、生物等背景的博士需要经历漫长的领域知识转换过程,而企业是否具备引导跨学科创新的组织能力则是一个关键问题。


Meta的FAIR实验室曾招募数学哲学家研究AI伦理,但最终因无法融入工程体系而导致项目流产。


字节的自由探索承诺,需要配套的跨学科协作机制才能真正兑现。


⋯ ⋯


在GPT-4需要消耗数百万GPU小时,训练数据几乎穷尽互联网内容的当下,OpenAI等巨头凭借数据与算力优势构建起了坚固的护城河。


字节应对策略却另辟蹊径,通过极小规模的高精尖团队,寻找颠覆性创新的杠杆点。


30人的规模仅相当于一个高校实验室,但其人员构成直指关键瓶颈。机器学习算法与系统方向聚焦训练效率提升,或许能在同等算力下实现10倍吞吐量优化。


语音与多模态理解组合攻关,有机会突破当前语音助手仅能处理单轮指令的局限。针尖式突破一旦成功,就能以算法优势部分抵消数据规模劣势。


类似案例,出现在DeepMind的AlphaFold团队,不足50人却用AI破解了困扰生物学界50年的蛋白质折叠难题。


但该模式对人才个体的创造性杠杆率要求极高,字节要求候选人“做95%的人做不到的事”,实则是将赌注押在极端非共识创新上。


⋯ ⋯


当学术界趋向保守时,企业实验室反而成为激进创新的试验场。我认为这种角色转换,标志着产业界正从技术应用者蜕变为基础研究的主导者。


(一)与纯研究机构不同,字节的多元化产品矩阵,抖音、TikTok、豆包等为技术落地提供了天然试验场。


(二)Top Seed计划强调依托应用场景推动成果落地,暗含一套独特的研发结合场景的反哺机制。


(三)当实验室探索多模态生成技术时,抖音的短视频创作工具能够立即提供用户反馈。语音模型迭代后,能够直接接入剪映的智能配音功能验证效果。实时数据闭环,能大幅缩短从论文到产品的转化周期。


2025年发布的豆包1.5模型,它的“看图思考”能力正是通过抖音电商的海量商品图片训练迭代而成。相比之下,OpenAI的GPT-4虽技术领先,却受限于有限的落地场景,难以快速形成商业价值反哺研发。


⋯ ⋯


科技巨头将校招触角伸向顶尖博士时,实质上是在重构学术人才培养体系。字节与中山大学、微软亚洲研究院的联合培养项目已运作三年,入选者能够直接进入Seed团队参与大模型研发。


定向孵化模式模糊了学术界与产业界的界限,博士论文课题也会直接服务于企业技术路线图,导师团队由高校教授与企业科学家共同组成。


剑桥大学2024年的研究显示,参与企业联合培养的博士生,其论文引用率较传统学术路径低32%,但专利数量高出4倍。字节的Top Seed计划实则是将博士教育转化为预研发阶段,在加速技术转化的同时,也会改变学术生态的底层逻辑。


字节跳动公司30人博士招募计划,本质上是一场围绕大模型基础设施的非对称竞争。通过极高的人才密度、跨学科创新机制与场景反哺闭环,字节试图在算力与数据劣势中撕开突破口。


未来的胜出者,未必是拥有最大数据中心的企业,而是最先找到“技术杠杆支点”的团队。

(文:陳寳)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往