跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

文本

一篇80页多模态RAG技术最新综述:MRAG3.0

下午7时 2025/04/16 作者 PaperAgent

多模态检索增强型生成(MRAG)通过整合文本、图像和视频等多模态数据显著提升了大型语言模型的生成质量,并系统回顾了其进展与关键技术组件。

分类 分享 标签 MRAG、 图像、 搜索规划、 文本、 文档解析、 视频 发表评论

Meta 发布 Llama 4 系列 AI 模型了

上午11时 2025/04/06 作者 陳寳

Meta发布Llama 4系列AI模型,引入混合专家架构以提升效率和性能,并尝试在生成式AI领域实现差异化突破。

分类 分享 标签 Meta公司、 低延迟、 图像、 文本、 混合专家架构(MoE)、 视频数据训练 发表评论

ChatGPT 给Vscode做了外挂!可直接编辑代码

下午4时 2025/03/07 作者 AI工程化

ct’;

function _arrayLikeToArray$2(arr, len) {

分类 分享 标签 __setDesc、 交互协议、 文本、 视频内容、 超链接、 超链接投票 发表评论

可视化图解MOE大模型的7个核心问题:专家、路由、负载均衡及其用于视觉模态

下午7时 2025/03/02 作者 老刘说NLP

,可视化图解moe讲的挺不错,转载过来并做翻译,当作记录,值得收藏慢慢看。
原文在:https://

分类 大模型 标签 MoE、 文本、 稀疏参数、 老刘、 视觉、 计算效率 发表评论

剑指专业领域零部件级3D生成!Meta联手牛津推出全新多视图扩散模型

下午4时 2025/01/08 作者 新智元

Meta与牛津大学研究人员发布PartGen,能够生成子结构可分离的高质量3D模型,解决现有AI生成3D对象缺乏零部件信息的问题。

分类 资讯 标签 3D重建、 PartGen、 多视图扩散模型、 文本、 牛津大学、 高质量3D模型 发表评论

全球首个端侧全模态理解模型:Megrez-3B-Omni,能同时处理图片、音频、文本

下午12时 2024/12/22 作者 GitHubStore

Megrez-3B-Omni是无问芯穹研发的端侧全模态理解模型,基于Megrez-3B-Instruct扩展,在图像、语音和文本领域均取得最优精度。

分类 开源 标签 Megrez-3B-Omni、 图片、 文本、 无问芯穹、 端侧全模态理解模型、 音频 发表评论

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

近期文章

  • 盲测击败了ElevenLabs的一款TTS:Chatterbox
  • K8S集群化部署RAGFlow文档
  • DeepSeek 发布DeepSeek R1-0528
  • DeepSeek再次升级!R1-0528:站上世界第二,智力全面超越xAI与Meta!
  • WebDancer:迈向自主信息寻求的智能体

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 5 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 4 月    

归档

  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×