海螺AI悄悄上线的这个新功能,我愿称为一致性的新王。

早上起床,看到海螺的AI视频新增了主体参考功能。上传一张照片和一段描述,就可以让你的角色出演任何场景。该功能已经在海外版上广泛应用,并且得到了用户的好评。目前这款产品在国内也已上线。使用便捷,生成效果稳定且情绪表演自然逼真,但还需进一步优化肢体动作的表现。未来AI视频将更加成熟并具备完整故事的拍摄能力。

Nvidia开源AI文本转音效模型,只要3.7秒就能生成30秒的音效,影视配音将越来越简单。

文章介绍了TangoFlux,一款由新加坡科技设计大学和NVIDIA联合开发的高效文本到音频生成模型。它能在单个A40 GPU上仅用3.7秒生成长达30秒的高质量音频,展示了优越性能,并详细阐述了其技术特点,包括高效的生成能力、流匹配与直流量化流技术以及Clap排名偏好优化(CRPO)等。

CerebrasCoder:AI 开源一键建站,程序员失业是 “危” 还是 “机”?

CerebrasCoder 是一款开源 AI 网站搭建工具,利用 Cerebras 的超快晶圆芯片和 Llama 3.3-70B 模型,在不到一秒钟内生成网站应用。它支持一键生成、高度可定制化以及多语言支持,并提供免费的完全访问权限。