视频生成归档 - 第2页共5页

首个统一多模态模型评测标准，DeepSeek Janus理解能力领跑开源，但和闭源还有差距

下午4时 2025/04/09 作者量子位

LMs）逐渐成为研究热点，近期GPT-4o，Gemini-2.0-flash都展现出了非凡的理解和生

下午11时 2025/03/28 作者机器之心

AI 可以生成如此逼真的视频，一时间各大高校实验室、互联网巨头 AI Lab 以及创业公司纷纷入局视

下午11时 2025/03/18 作者量子位

马斯克收购视频生成初创公司Hotshot，该团队仅4人用了两年时间开发出多个视频生成模型。老马表示即将发布自己的视频生成模型Grok。Hotshot的投资者包括Stripe前高管、Reddit联合创始人等。

下午12时 2025/03/13 作者硅星人Pro

原字节跳动AI大将骆怡航加入生数科技担任CEO，全面负责公司研发、产品、商业化及团队管理工作。唐家渝仍保留总裁一职，专注于战略发展和品牌等核心职能。

上午8时 2025/03/04 作者机器之心

AIxiv专栏分享了一项名为AVD2的研究成果，旨在提升自动驾驶系统对事故场景的理解。通过生成与自然语言描述一致的事故视频并结合多任务学习技术，AVD2增强了事故分析能力，并提出了一个新的数据集EMM-AU来推动相关研究。

下午4时 2025/03/03 作者机器之心

，今年的最佳论文颁发给了无问芯穹和上交、清华共同提出的视频生成大模型推理 IP 工作 FlightV

下午4时 2025/02/28 作者量子位

上海交通大学张林峰团队提出Toca方法，通过token粒度的缓存策略实现无需训练的图像和视频生成加速，相比现有方法具有更强适配性和优异性能。

下午4时 2025/02/26 作者机器之心

MIT团队提出的新算法Diffusion Forcing Transformer（DFoT）让视频扩散模型生成了比之前长近50倍、上千帧的长视频，论文介绍了历史引导算法及其在不同数据集上的效果。

下午11时 2025/02/20 作者量子位

复旦团队发表综述论文《A Survey on Video Diffusion Models》，系统梳理扩散模型在视频生成、编辑及理解领域的进展，涵盖300+文献。

下午12时 2025/02/18 作者量子位

态大模型！
新模型共2款：
全球范围内参数量最大的开源
视频生成模型Step-Video-T2V
行