多模态融合归档

AI独角兽创始人最新警告：48小时没人转发？你的AI产品已经“死了”

2025年7月8日23时作者乌鸦智能说

键变量。
Lovable联合创始人Anton Osika直言：“现在的AI创业者必须接受一个新规则—

2025年6月23日8时作者开源星探

表格和公式的复杂文档。
RAG-Anything
是由香港大学数据智能实验室开发的一款开源的多模态R

2025年6月16日16时作者量子位

Scaling Law
，
首次在这条赛道被验证！
来自中国的
小鹏汽车
，完整拿出了技术方案和A

2025年5月23日14时作者老刘说NLP

的玩法。比如，
Dolphin检测+解析双阶段多模态文档解析
思路，效果实测并不理想，尤其是带图片的

2025年5月17日8时作者 PaperWeekly

自 20 年 OpenAI 发布第一代图文跨模态模型 CLIP 以来已经过去了 5 年的时间。
第一

2025年5月16日14时作者老刘说NLP

事情，这些都在2024年得到了很好的发展，也涌现出了许多细化的方案，GraphRAG，DeepRes

2025年4月26日16时作者乌鸦智能说

的智驾淘汰赛也在悄然开启，智驾能力成为车企能否“上牌桌”的关键。
在这场关于关乎技术、生态与商业化的

2025年4月25日14时作者小兵的AI视界

上海 AI Lab 开源的 Aether 项目通过三维时空建模和多模态融合技术，实现了生成式世界模型在虚拟数据上的出色表现，并具备对真实世界的零样本泛化能力。

2025年4月6日16时作者硅星人Pro

Meta发布的Llama4系列模型包括多模态MoE架构、超长上下文支持和优化的注意力机制。通过原生多模态预训练融合方法、轻量级后训练策略等创新技术提升了模型能力。

2025年3月8日16时作者机器之心

毕业于苏黎世联邦理工学院（ETH Zurich），在硕士期间，他跟随导师 Luc Van Gool