腾讯版Sora发布即开源!130亿参数,模型权重、推理代码全开放

腾讯发布超大规模视频生成模型混元,参数量达130亿,并已上线用户试用。该模型具备超写实画质、高语义一致性和流畅运动画面等优势。同时支持多镜头切换和动作生成等功能。

ACM Web 2025大会邀请您参与:多媒体对象重识别Workshop MORE 2025

在悉尼举行的MORE @ WWW’25研讨会聚焦跨模态行人异常行为检测,欢迎提交重识别和多模态研究论文。大会包括原创、挑战赛和技术综述论文,4月28-5月2日举办。

何恺明MIT开门弟子名单公开:奥赛双料金牌得主、清华姚班学霸在列

何恺明团队入驻MIT后公布的研究成果包括使用连续标记的Fluid模型刷新FID和GenEval分数的文本到图像生成,以及跨不同机器人的异构预训练架构HPT。博士生邓明扬在竞赛中表现出色,黎天鸿负责表示学习和生成模型研究,并担任ICLR 2025区域主席。团队还包括白行健和Jake Austin等成员。