视频生成
马斯克进军AI视频,收购视频生成初创公司,4人13个月打造类Sora模型
马斯克收购视频生成初创公司Hotshot,该团队仅4人用了两年时间开发出多个视频生成模型。老马表示即将发布自己的视频生成模型Grok。Hotshot的投资者包括Stripe前高管、Reddit联合创始人等。
生数挖来骆怡航担任CEO,视频生成公司们终于要拼商业化落地了
原字节跳动AI大将骆怡航加入生数科技担任CEO,全面负责公司研发、产品、商业化及团队管理工作。唐家渝仍保留总裁一职,专注于战略发展和品牌等核心职能。
ICRA 2025|清华x光轮:自驾世界模型生成和理解事故场景
AIxiv专栏分享了一项名为AVD2的研究成果,旨在提升自动驾驶系统对事故场景的理解。通过生成与自然语言描述一致的事故视频并结合多任务学习技术,AVD2增强了事故分析能力,并提出了一个新的数据集EMM-AU来推动相关研究。
中国团队首次夺魁!无问芯穹FlightVGM获FPGA’25最佳论文,峰值算力超GPU,抹平21倍
,今年的最佳论文颁发给了无问芯穹和上交、清华共同提出的视频生成大模型推理 IP 工作 FlightV
无需训练让扩散模型提速2倍,上交大提出Token级缓存方案|ICLR‘25
上海交通大学张林峰团队提出Toca方法,通过token粒度的缓存策略实现无需训练的图像和视频生成加速,相比现有方法具有更强适配性和优异性能。
千帧长视频时代到来!MIT全新扩散算法让任意模型突破时长极限
MIT团队提出的新算法Diffusion Forcing Transformer(DFoT)让视频扩散模型生成了比之前长近50倍、上千帧的长视频,论文介绍了历史引导算法及其在不同数据集上的效果。
复旦视频扩散模型综述:覆盖300+文献,探讨近期研究趋势与突破,Github揽星2k+
复旦团队发表综述论文《A Survey on Video Diffusion Models》,系统梳理扩散模型在视频生成、编辑及理解领域的进展,涵盖300+文献。