拍一张要花400多?!明星抢着晒的撕拉片,AI也能整!还被我们做成了复古广告片
2025年AI撕拉片盛行,文章介绍如何利用大模型生成类似上世纪胶卷风格的照片及视频。通过提示词和多张照片合成动图,模拟传统撕拉片效果。但模型在修图方面表现不佳,建议使用图像应用滤镜来实现理想效果。
2025年AI撕拉片盛行,文章介绍如何利用大模型生成类似上世纪胶卷风格的照片及视频。通过提示词和多张照片合成动图,模拟传统撕拉片效果。但模型在修图方面表现不佳,建议使用图像应用滤镜来实现理想效果。
HeyGen发布的Avatar IV模型能通过一张照片、一段脚本和声音生成逼真数字人,支持多角度图像输入,不仅能说还能唱。新引擎根据语音节奏自动生成表情和动作,应用场景广泛。
谷歌NotebookLM新增中文支持,可将文本、网页、视频等上传转化为音频播客。功能包括互动脑图和音频概览。音频概览能将内容转化为主持人对话式的AI播客,帮助理解复杂信息。目前支持50多种语言,包含中文。
Sia晒完新技能后,谷歌 Gemini 网页 Canvas 功能上新。用户只需点击要求,AI 即可协助写作、生成代码和设计网页等内容。Gemini 还推出了 Audio Overview 功能,帮助用户总结分析深度报告内容。
一款名为CSM的新语音模型在Hacker News上引起轰动,用户表示其类人程度令人震惊。Sesame公司开放了CSM公测,该模型具有记忆功能、低延迟和情感表现力,但目前暂不支持中文。
腾讯智能工作台 ima.copilot 推出双模版本,接入 DeepSeek-R1 后提升搜索、读写能力。支持批量导入微信生态资源,并能灵活选择信息来源。
文章介绍了两款新的AI工具——MMAudio和天谱乐,它们能够自动为视频生成背景音乐。此外还提及了YouTube的Dream Track服务,并对比了国内与国外在AI音乐创作领域的进展差异。