跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

图像

一篇80页多模态RAG技术最新综述:MRAG3.0

下午7时 2025/04/16 作者 PaperAgent

多模态检索增强型生成(MRAG)通过整合文本、图像和视频等多模态数据显著提升了大型语言模型的生成质量,并系统回顾了其进展与关键技术组件。

分类 分享 标签 MRAG、 图像、 搜索规划、 文本、 文档解析、 视频 发表评论

Meta 发布 Llama 4 系列 AI 模型了

上午11时 2025/04/06 作者 陳寳

Meta发布Llama 4系列AI模型,引入混合专家架构以提升效率和性能,并尝试在生成式AI领域实现差异化突破。

分类 分享 标签 Meta公司、 低延迟、 图像、 文本、 混合专家架构(MoE)、 视频数据训练 发表评论

MoshiVis:让语音模型“看懂”图像,开启视觉对话新时代

上午8时 2025/03/27 作者 NLP工程化

MoshiVis利用7B参数的Moshi模型新增适配器参数支持讨论图像,兼容PyTorch、Rust和MLX三种后端,具备实时视觉对话能力。

分类 开源 标签 kyutai-labs、 MLX、 MoshiVis、 PyTorch、 Rust、 图像 发表评论

AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

近期文章

  • 【最新AI综述】人工智能为什么越来越聪明?15年重大突破告诉你答案!
  • Claude 4核心成员万字实录:行业大模型不是未来趋势
  • 仅150M参数!Reason-ModernColBERT推动RAG检索能力直达第三阶段!
  • Anthropic称DeepSeek未超越前沿,仅是训练时间更晚:我们也可以用「500万美元或广告中宣传的任何金额来训练它。」
  • 被知乎文化所感染的第 1947 天

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 5 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 4 月    

归档

  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×