路过银河AI
最顶级的AI视频模型,这次真的来了
谷歌发布视频生成模型Veo 2,分辨率最高达4K、时长为2分钟。相比OpenAI的Sora模型,Veo 2在细节和逼真度方面表现更出色,但当前分辨率上限为720p,长度为8秒。
造梦师手记:超现实主义摄影
本多模态大型项目涵盖人物、场景、动物及产品设计等超现实元素,强调摄影细节和技术调整。技术方面采用DPM2算法和高分迭代提升图像质量,模型能生成多种风格的图像并鼓励大胆创新。
淘宝模特失业了:AI一键换装工作流
去年广东服装店主尝试用开源工具实现AI换装效果不佳。如今大模型技术成熟,推荐使用Flux Fill模型、分割万物模型等进行一键换装工作流,注意背景简单和人物穿着接近等因素。
Flux模型PuLID换脸工作流
字节的Flux PuLID 0.91版更新,相比前版速度更快。PuLID通过结合Lightning T2I分支和扩散分支,并引入对比对齐损失和精确的身份ID损失来实现高效身份ID定制,保持图像元素一致。优点是速度快、保真度高;缺点是换脸动作单调。