跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

多模态融合

AI独角兽创始人最新警告:48小时没人转发?你的AI产品已经“死了”

2025年7月8日23时 作者 乌鸦智能说

键变量。
Lovable联合创始人Anton Osika直言:“现在的AI创业者必须接受一个新规则—

分类 资讯 标签 AI技术、 个性化推荐、 多模态融合、 大模型、 数据治理、 社交平台转型 发表评论

开源RAG又添新军!港大开源多模态RAG神器,多文档格式统一解析、知识图谱索引与混合检索!

2025年6月23日8时 作者 开源星探

表格和公式的复杂文档。
RAG-Anything
是由香港大学数据智能实验室开发的一款开源的多模态R

分类 开源 标签 RAG-Anything、 多模态融合、 开源社区、 性能优化、 结构化数据提取、 自定义处理器 发表评论

Scaling Law首次在自动驾驶赛道被验证!小鹏汽车CVPR演讲详解:AI「吃」下6亿秒视频后,智能涌现

2025年6月16日16时 作者 量子位

Scaling Law
,
首次在这条赛道被验证!
来自中国的
小鹏汽车
,完整拿出了技术方案和A

分类 资讯 标签 增强学习、 多模态融合、 大模型、 小鹏汽车、 自研芯片、 通用化设计 发表评论

技术思考:小尺寸+两阶段式多模态文档解析模型Dolphin思路评析及PP-OCRv5更新

2025年5月23日14时 作者 老刘说NLP

的玩法。比如,
Dolphin检测+解析双阶段多模态文档解析
思路,效果实测并不理想,尤其是带图片的

分类 大模型 标签 Reasoning-OCR、 多模态融合、 大型模型、 手写体复杂文字、 提升效果、 用户反馈 发表评论

ICML 2025  细粒度图文对齐突破!360发布全新一代图文跨模态模型FG-CLIP

2025年5月17日8时 作者 PaperWeekly

自 20 年 OpenAI 发布第一代图文跨模态模型 CLIP 以来已经过去了 5 年的时间。
第一

分类 大模型、 学术 标签 FG-CLIP、 多模态融合、 文本生成、 视觉理解、 长/短标题、 难样本处理 发表评论

RAG往后发展的三点感触及语言文化分析的两个工作

2025年5月16日14时 作者 老刘说NLP

事情,这些都在2024年得到了很好的发展,也涌现出了许多细化的方案,GraphRAG,DeepRes

分类 大模型 标签 RAG、 多模态融合、 大模型、 数据集、 文档解析、 领域特定训练 发表评论

2024年财报解读:四维图新拿到了智驾终局的船票

2025年4月26日16时 作者 乌鸦智能说

的智驾淘汰赛也在悄然开启,智驾能力成为车企能否“上牌桌”的关键。
在这场关于关乎技术、生态与商业化的

分类 资讯 标签 个性化定制、 伦理安全、 多模态融合、 开源社区、 跨行业协作、 边缘计算 发表评论

Aether:上海 AI Lab 开源的生成式世界模型,探索三维时空建模与智能决策新境界

2025年4月25日14时 作者 小兵的AI视界

上海 AI Lab 开源的 Aether 项目通过三维时空建模和多模态融合技术,实现了生成式世界模型在虚拟数据上的出色表现,并具备对真实世界的零样本泛化能力。

分类 开源 标签 4D 动态重建、 AETHER、 上海 AI Lab、 多模态融合、 扩散模型、 生成式世界模型 发表评论

1000万上下文+2880亿参数的Llama4,却让DeepSeek们松了一口气

2025年4月6日16时 作者 硅星人Pro

Meta发布的Llama4系列模型包括多模态MoE架构、超长上下文支持和优化的注意力机制。通过原生多模态预训练融合方法、轻量级后训练策略等创新技术提升了模型能力。

分类 资讯 标签 Llama4、 Meta、 多模态融合、 开源模型、 注意力机制、 计算资源 发表评论

ICLR 2025 Spotlight 「免费」多模态信息助力3D小样本分割

2025年3月8日16时 作者 机器之心

毕业于苏黎世联邦理工学院(ETH Zurich),在硕士期间,他跟随导师 Luc Van Gool

分类 学术、 资讯 标签 多模态融合、 少样本适应性任务、 技术改进、 新视角、 研究问题、 领域发展 发表评论
较早文章
页面1 页面2 页面3 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub Google GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • CSEAC 2025,九月与您相约无锡
  • OpenAI 工程师最新演讲:代码只占程序员核心价值的 10%,未来属于“结构化沟通”
  • 风云再起!英伟达H20芯片解禁,老黄“杀回”中国市场
  • 为大模型思考装上“猎鹰重装引擎” :腾讯混元 SEAT 重塑深度思考
  • 华南理工开源小智AI硬件后端服务,支持MCP。

2025 年 7 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
28293031  
« 6 月    

归档

  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×