AI视频生成一夜被颠覆:Runway重磅发布Gen-4,保真度、动态性、一致性全面升级
Runway公司发布了新一代视频生成模型Gen-4,解决了场景一致性问题并增强了保真度、动态运动捕捉和可控性。Gen-4的核心优势包括高动态与真实感、高度一致性及精准理解与执行能力。
Runway公司发布了新一代视频生成模型Gen-4,解决了场景一致性问题并增强了保真度、动态运动捕捉和可控性。Gen-4的核心优势包括高动态与真实感、高度一致性及精准理解与执行能力。
Google 和 OpenAI 分别发布了新功能。OpenAI 推出了4o 文生图功能,能创建高质量图像;Google 使用 DeepSeek 模型进行更新,提升了模型质量和代码表现。
OpenAI正式推出GPT-4o原生图像生成功能,Sam Altman认为这代表了赋予用户创作自由度的新高度。亮点包括上下文理解、复杂指令执行、文本与图像融合及聊天式交互能力。该功能已向ChatGPT和Sora的Plus、Pro、Team用户以及免费用户提供,并计划扩展至企业版、教育版和开发者API使用。
马斯克团队Grok模型成功实现基于Token的图像生成技术突破,直接将输入图像分解为token。Aurora新模型增强了其图像生成能力,即将添加图像编辑功能。
Mistral AI 发布了Pixtral Large超大杯多模态模型,具备强大的图像理解能力,并升级了免费聊天机器人le Chat,新增图像生成、网络搜索和交互式画布功能。