今天起,汉字也能AI视频生成了!《滕王阁序》直接拿捏到位了
AI视频生成模型通义万相2.1成功制作出多个复杂汉字、英文单词以及包括‘摸鱼一天 快乐无边’、中世纪真人写实风动画等在内的多种风格的视频内容。通过采用VAE与DiT架构协同发力、超长序列训练上的突破和数据与评估双轮驱动的技术创新,实现了对无限长1080P视频的高效编解码,并在视觉质量和运动质量方面提升模型性能。
AI视频生成模型通义万相2.1成功制作出多个复杂汉字、英文单词以及包括‘摸鱼一天 快乐无边’、中世纪真人写实风动画等在内的多种风格的视频内容。通过采用VAE与DiT架构协同发力、超长序列训练上的突破和数据与评估双轮驱动的技术创新,实现了对无限长1080P视频的高效编解码,并在视觉质量和运动质量方面提升模型性能。
Sketch2Sound 是一种生成音频模型,能够根据一组时变控制信号(响度、亮度、音调以及文本提示)创建高质量的声音,支持声音模仿并保持输入音频的节奏。
开源 AI 视频社区新成员 Lightricks 推出首个能实时生成高质量视频的 DiT 模型,其速度比普通视频观看快。该模型名为 LTX-Video,在一块 Nvidia H100 上仅需 4 秒即可生成 5 秒时长的 24FPS 视频,代码库和模型权重已开源。