直击CVPR现场:中国玩家展商面前人从众,腾讯40+篇接收论文亮眼

白交 发自 凹非寺
量子位 | 公众号 QbitAI

CVPR 2025落下帷幕,这次关注度和社交参与感,非常深度了。

比如随手抓住一只何恺明,直接变成追星现场。

在以谷歌/Meta等国际巨头为主导的展区里,中国企业规模创纪录,像腾讯、字节等大展区里面人从众。

展台面前排队体验的技术Demo,妥妥都是技术风向标~

总结下来,有这样几个有意思的发现。

首先,多模态、3D生成是此次论文接收和现场研讨的热门方向,尤其像3D生成是亮点,背后高斯泼溅技术成为此次论文标题出现次数最多的前五关键词之一。

其次,对于基础模型的讨论远比以往更加深入,并且延伸到了产业落地。具身智能、机器人AI在Workshop议程设置中独立出来一个大的板块。

最后,中国企业今年参与得很深度,不过目前还是聚焦在已经成熟商业化的大公司。

除此之外还有哪些亮点,现在就带大家一网打尽。

探展CVPR 2025

CVPR含金量提升

CVPR,视觉领域妥妥的顶会,甚至与其他两位并称的顶会ICCV和ECCV相比,名气还要高那么一点。

每一年被CVPR接收的论文大家都会关注,因为它们一定代表着最最前沿的技术风向。尤其是获得了最佳论文奖项的成果,那就得好好拜读一下。

如果你的论文能被CVPR接收,相当于受到非常大的认可。因此相关从业者一有机会都想冲一波,万一就被录用了呢。

所以这几年CVPR的接收数量逐年递增。今年CVPR共收到13008份有效论文,2878篇论文被接收,最终录用率为22.1%,录用率已经下降不少了,这样导致接收难度陡增。

所以,每一篇CVPR 2025论文含金量都在上升

多模态成为接收论文标题中的高频词,3D发展速度快、成果亮眼。

有热心网友整理了2878篇论文标题,得出了以下高频词。

多模态这个词位列第一。

此外,3D生成是亮点,背后高斯泼溅技术绕过了一众任务、技术词汇第四高频的关键词

美国俄勒冈州立大学副教授Fuxin Li曾表示:

自2020年NeRF论文首次发表以来,利用深度网络进行3D重建已成为趋势。如今高斯泼溅技术进一步推动了这一发展。

本质上,计算机视觉与图形学正在融合。神经渲染研究的兴起,显著推动了3D相关论文数量的增长。

这一点在国内也能感知到,尤其在这段时间技术跃迁很快。

像颇受学界关注的Hunyuan 3D,在此次发布会上进行了版本升级以及全面开源。

2.1版本主打的是几何与纹理的双重优化,特别在纹理贴面上有比较大的优化,可达到当前开源3D模型中的SOTA。它的训练代码、模型权重、数据处理流程全部开源,支持一键部署,开发者还可以自主精调。

据腾讯介绍,这是首个全链路开源的工业级3D生成大模型,并且达到了闭源级水平,同时还可适配消费级显卡。

企业参与力度大,探讨主题从技术难题探索拓展至产业应用

如果说论文展示(海报/口头报告)是顶会的一大亮点,那么研讨会(Workshop)则是另外值得关注的部分,来自全球顶尖机构的研究者在此围绕特定主题进行深度碰撞。

今年尤为值得注意的是:主题设计既延续技术纵深探索,又拓展行业生态建设,形成双轮驱动的学术范式。

一方面,去年就在关注的技术领域,今年讨论的话题更加深入。

比如视觉概念研讨会。当前多模态、世界模型讨论正酣,也许按照第一性原理探讨视觉是什么?或许就是解决技术挑战的关键。

另一方面,产业应用中的现实难题,也在这些研讨会中得到讨论。

像3D视觉与理解,从基础的单目深度估计到更复杂的3D场景理解和组合式3D视觉。今年还新增了3D捕获与重建轨道,以及城市建模、数字孪生等更具体的方向,这些都是应对真实世界三维信息获取和建模的需求。

再来看看这次展会,每年都有各种机构来到这里展示他们最新的技术成果。

值得注意的是,这次展台面前人从众的更多都是来自中国玩家的展商。细细扒了一下发现,原来他们的参与度要深度得多。

中国企业深度参与

首先最直接的就是论文接收数,从目前公开的信息来看,企业的接收数都不少,方向也很多元。

今年腾讯表现出众,他们有40+篇被接收论文。其中数十篇论文来自混元团队,覆盖多模态模型长思维链推理、3D生成、图片/视频生成多个领域。优图实验室这边有22篇论文入选,有DeepFake的视频检测、自回归视觉生成、多模态等研究方向。

本次会议的赞助商,其实也有点意思,能够看到企业/机构对于这次会议的支持和重视程度。

从地区分布来看,41家企业或研究机构中,来自美国的共有28家,中国队紧随其后,共有6家。其他国家和地区分布寥寥,各自仅有一家。

尤其在白金赞助这一栏,在一众科技巨头,包括亚马逊、谷歌、苹果等企业之中。中国的腾讯、字节跻身在列,其实足以可见他们对于这次顶会的投入。

这当中,腾讯在今年顶会上的投入比往年都大,不管是从赞助商等级,还是Workshop。

光是业务团队就来了小20个人,这当中还包括了混元、ARC Lab、AI Lab、腾讯视频等业务的技术负责人,在会场近距离分享相关领域的最新技术突破。

比如你可以遇到腾讯混元大模型团队现场Demo展示,用数位板画图,现场屏幕即可完成3D生图。

然后还能遇到ARC Lab高级研究员胡文博,跟你聊聊生成式AI与3D视觉相关。

除此之外,还安排了午餐会、晚宴等活动。

之前啊,就听到那些中国学生说,参加顶会可以蹭到腾讯的邮轮饭、米其林饭,真香啊,这下看来是真的了!

当然腾讯自然带有自己的目的,如果业务团队在现场与学生交谈甚欢,没准直接就完成了boss直聘,毕业之后就直接去腾讯上班。

腾讯CVPR2025群星未来之夜现场照片

以腾讯为代表的中国企业深度参与顶会的原因,其实也不难看出——

一方面全球加速大模型发展的大环境下,中国企业作为核心参与者,在全球舞台上展示技术实力,体现的是他们技术投入的决心。

以腾讯举例,其投入就非常多。2024年全年,腾讯研发开支约超过706.86亿元,从2018年至今研发投入已达3403亿元。并且还在不断加大AI投资,截至2024年12月,腾讯在全球主要国家和地区专利申请公开总数超过8.5万件,专利授权数量超过4.5万件,全年资本开支为人民币768亿元,同比增加221%,创历史新高。

现场遇到一位高校教授表示,中国公司在大模型领域的发展很快,对于他们带着优秀的成果到现场感到骄傲,腾讯在这个领域的进步让人欣喜。

这一次在学生们心中印象最深的,除了腾讯展台演示的Demo,还有一走进会场就遇到的巨型海报,不知道的还以为进入到国内某个行业峰会。

另一方面,通过在各种顶会的亮相吸引人才,以此转变为企业核心竞争力,形成正向循环。

而对于顶尖技术人才来说,他们择业首要标准可能不在于薪资,而在于技术认同。就拿OpenAI那群人来说,当初聚成火,现在满天星,背后也是这一原因所在。

这就与企业本身的技术特色和独特优势有关。

腾讯一直以来的优势,就在于应用场景,具备健康的生态矩阵,像微信、游戏这种业务有着过亿用户体量,覆盖了ToB、ToC,社交、游戏、产业等多重业务矩阵。

这庞大的数据量、应用场景,带来了巨大资源支持,资源代表了投入耐性,这些年一闪而过的技术公司很多,能活下来的都是能落地的。

而且更重要的是,立足于自身的独特应用和场景优势,国内企业已经呈现出商业反哺技术的良性循环,足以支撑技术生生不息地发展。这样人才可以不用担心公司未来,可以安心在里面搞技术。

今年一季度,腾讯高质量收入保持坚实的增长态势。AI能力已经对效果广告与长青游戏等业务产生实质性的贡献,因此也加大对元宝应用与微信内的AI等新AI机遇的投入。

技术的终极意义是服务于人,只有有应用场景才能彰显技术的价值,保证企业拥有数据和资源,持续反哺技术研究,探索技术的上限。

One More Thing

腾讯在All in AI的策略指导下,对技术人才的投入力度空前。

数据显示,截至2025年3月,腾讯科技类人才占比已达73%,其中直接从事技术研发的员工超2.7万人。

今年腾讯的顶尖人才招聘计划-青云计划就打出薪酬上不封顶、职级升级等吸引技术人才加入。还有顶尖科学家导师培养、线下活动交流等等资源。

所以如果你快毕业,正在看工作机会,可以看看腾讯青云计划。

CVPR虽然落幕了,腾讯今年还提供大量的线下接触的机会,不仅推出全新升级的校企课题合作模式,让同学们在校期间提前感受研究与落地的技术碰撞,还参加国内外学术顶尖会议,并举办多城市丰富的青云线下活动,为大家提供见面交流的机会,大家也可以继续关注官号发布。

据交流获知,为了更集中资源培养,今年的青云计划的名额有所减少,更加稀缺了,甄选也更加严格,感兴趣抓紧去看看。

了解青云计划以及报名线下活动,可以点击阅读原文跳转,或者复制以下链接:腾讯2026青云计划全球启动

—  —

📪 量子位AI主题策划正在征集中!欢迎参与专题365行AI落地方案,一千零一个AI应或与我们分享你在寻找的AI产品,或发现的AI新动向

💬 也欢迎你加入量子位每日AI交流群,一起来畅聊AI吧~



一键关注 👇 点亮星标

科技前沿进展每日见


一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!


(文:量子位)

发表评论