日期: 2024 年 12 月 18 日
太好了!是豆包文生图模型,AI生成中字有救了
字节豆包在2024火山引擎FORCE原动力大会上发布了多项大模型更新,包括视觉理解模型、文生图模型、音乐大模型和3D大模型。豆包视觉理解能力增强,并推出了加量不加价的识图功能;文生图模型支持生成中文内容;音乐大模型能局部修改歌词;3D大模型则可生成3D世界模型,提升了用户创作效率和体验。
来自现场:豆包发布视觉理解模型,价格低到离谱
上海火山引擎2024冬季FORCE原动力大会上发布了豆包大模型家族的新版本,包括视觉理解、通用Pro模型、音乐模型、文生图模型等。发布会还展示了即梦AI及其在剪映中的应用,并重点介绍了扣子开发者平台。总体来说,此次大会旨在推动AI技术的广泛应用和普及。
Sora发布即翻车,谷歌Veo2偷塔AI视频新王?
谷歌新发布的Veo2视频生成模型在分辨率和时长上都有所提升,并能理解物理规律与电影语言。它通过4D卷积神经网络和GAN架构提高了逼真度,但可能面临Sora一样的问题,如复杂的场景处理、用户期望与实际性能之间的差距等挑战。
4k星星!一个容器化的向量检索RAG系统,支持多模态输入、混合搜索和知识图谱构建。
RAG技术通过结合信息检索和自然语言生成,提高智能搜索和问答系统的效率。R2R项目利用容器化、RESTful API等优化策略支持多模态摄取、混合搜索及知识图谱构建等功能。
AI代理火了!美股AI应用巨头翻倍扩招销售团队
赛富时CEO贝尼奥夫计划招聘2000名销售人员推销新发布的AI应用工具。公司发布了新一代AI代理平台Agentforce 2.0,并表示未来将发布第三代平台。赛富时认为AI应用在过去几个月中快速发展,为业务增长提供了机会。
OpenAI Day 9 发布新的 o1 系列模型,超长上下文与实时交互能力双双突破
第九天,OpenAI 发布了全新的 o1 模型,不仅支持处理长文本上下文,还增加了结构化输出、Developer 角色及偏好微调功能。同时发布的新实时 API 支持 WebRTC 和 WebSocket,提升了交互体验和稳定性。