来自现场:豆包发布视觉理解模型,价格低到离谱
上海火山引擎2024冬季FORCE原动力大会上发布了豆包大模型家族的新版本,包括视觉理解、通用Pro模型、音乐模型、文生图模型等。发布会还展示了即梦AI及其在剪映中的应用,并重点介绍了扣子开发者平台。总体来说,此次大会旨在推动AI技术的广泛应用和普及。
上海火山引擎2024冬季FORCE原动力大会上发布了豆包大模型家族的新版本,包括视觉理解、通用Pro模型、音乐模型、文生图模型等。发布会还展示了即梦AI及其在剪映中的应用,并重点介绍了扣子开发者平台。总体来说,此次大会旨在推动AI技术的广泛应用和普及。
最近,粉丝朋友反馈公众号有所变化,作者与读者对话时提到接入了AI助手小逸、声音克隆和AI配图等技术,提升服务效率和用户体验;同时强调AI助手提供的信息主要来源于知识库,并建议遇到无法解答的问题可以添加微信联系。
Sora正式向全球用户开放使用,成为首个支持文生、图生以及V2V功能的AI视频平台。它提供了18个关键问题的快速了解,包括新功能如Storyboard、Style presets等,并介绍了其核心特性及价格体系。
这个视频提示词生成器以混元模型为基础进行微调,特别适合混元文生视频。使用方法是先将关键词发给AI,再输入关键词得到场景描述,微调后发送至混元视频模型即可。作者分享了几个实测案例,并提出了使用时的注意事项:避免画面超过5秒、保证主体一致性、注意连贯性以及适当抽卡等经验。最后感谢开源精神和贡献者。
Kimi上线AI视频创作工具,用户上传音频即可生成30秒MV视频。产品具备一定的画面一致性与物理规律遵循能力,但存在模型限制导致的问题。目前生成速度较慢且免费额度有限。