跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

多模态大模型

商汤甩出具身智能大招!最强多模态大模型登场,给机器人装上大脑和眼睛

2025-04-10 作者 智东西

模型,给人形机器人装上大脑、眼睛、耳朵和嘴巴了!
这位傅利叶通用人形机器人GRx,立即辨认出“水”和

分类 资讯 标签 全局记忆技术、 商汤科技、 国产GPU集群、 多模态大模型、 强化学习框架、 离线推理 发表评论

首次引入强化学习!火山引擎Q-Insight让画质理解迈向深度思考

2025-04-08 作者 机器之心

Q-Insight 提出了一种基于强化学习训练的多模态大模型图像画质理解方案,通过挖掘大模型自身的推理潜力,实现对图像质量的深度理解,并在多个任务上达到业界领先水平。

分类 学术、 资讯 标签 Q-Insight、 北京大学、 多媒体实验室、 多模态大模型、 火山引擎、 音视频处理 发表评论

GPT-4.5创造力比GPT-4o弱!浙大上海AI Lab发布新基准,寻找多模态创造力天花板

2025-04-04 作者 量子位

日常问答中展现出惊人的上下文连贯性,在设计、咨询等需要高度创造力的任务中也大放异彩。
当GPT-4.

分类 资讯 标签 Creation-MMBench、 创作能力评估、 多模态大模型、 现实场景、 视觉事实性、 详细评判标准 发表评论

【清华大学第六弹】2025年AIGC发展研究3.0版-180页

2025-04-04 作者 AI技术研习社

2025年AIGC(人工智能生成内容)发展趋势及挑战分析。涵盖技术突破、应用场景拓展和市场增长等方面,并指出版权、隐私和伦理等问题。

分类 大模型 标签 AIGC、 多方专家、 多模态大模型、 数字经济、 智能客服、 生成对抗网络 发表评论

动态场景,开放文本查询!清华哈佛联合建模4D语言场 CVPR 2025

2025-04-02 作者 新智元

清华大学等团队提出4D LangSplat方法,结合多模态大模型和状态变化网络,成功重建动态语义场并实现高效精准的开放文本查询任务。该方法在多项评估指标上优于现有技术。

分类 资讯 标签 动态语义场、 哈佛大学、 多模态大模型、 清华团队、 状态变化网络、 视频分割 发表评论

10万台服务机器人,15年海量场景数据,擎朗人形机器人撕开万亿新市场

2025-04-01 作者 智东西

上一句话,机器人就可以为你倒一杯果汁、打一个鸡蛋、将桌子上的碗筷准确放到收纳架上,机器人还可以读懂你

分类 资讯 标签 具身智能、 多模态大模型、 市场需求、 技术合作、 擎朗智能、 软硬件工程化 发表评论

GPT-4o的P图太火了,GPU在融化,官方终于限流了

2025-03-28 作者 机器之心

OpenAI 的 GPT-4o 图像生成功能上线不到 2 天就受到了服务器压力,尽管付费用户仍可使用该功能,但免费用户可能面临更多限制。

分类 学术、 资讯 标签 GPT-4o、 OpenAI、 多模态大模型、 山姆·奥特曼、 技术改进、 版权限制 发表评论

7B模型搞定AI视频通话,阿里最新开源炸场,看听说写全模态打通,开发者企业免费商用

2025-03-27 作者 量子位

大模型——
通义千问Qwen2.5-Omni-7B
,来了。
仅靠一个
一体式模型
,就能搞定文本、

分类 资讯 标签 Qwen2.5-Omni-7B、 多模态大模型、 开源活动、 语音指令、 通义千问系列、 阿里巴巴 发表评论

阿里深夜开源Qwen2.5-Omni,7B参数完成看、听、说、写

2025-03-27 作者 机器之心

阿里发布全新 Qwen2.5-Omni 多模态大模型,支持语音和视频聊天,并开源了7B参数的Thinker-Talker架构模型,性能优于单模态模型。

分类 学术、 资讯 标签 Apache 2.0、 Qwen2.5-Omni-7B、 多模态大模型、 视频聊天、 语音聊天、 阿里通义千问团队 发表评论

诚邀参加 青岛AICC”用昇腾玩转DeepSeek、Qwen开发实战”集训营活动

2025-03-21 作者 极市干货

多模态大模型深入解读专栏介绍,涵盖Transformer系列、LVM模型及扩散模型等内容。

分类 学术 标签 多模态大模型、 应用领域、 技术专栏、 极市平台、 架构、 训练过程 发表评论
较早文章
较新文章
← 上一页 页面1 页面2 页面3 页面4 … 页面8 下一页 →

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • 「深度报告」洞悉智算散热革命:千亿市场如何崛起?芯片禁令变量几何?
  • 90后创始人身价200亿,“影石”敲钟之余,整个AI圈也正在被90后改变
  • “智启未来·共筑机器人新生态” 2025中国机器人智能大会在海淀区成功举办
  • 2025第三届全球手术机器人大会定档9月,汇聚全球智慧,共绘医疗科技革新蓝图
  • 乐鑫携手扣子”完全开源”第三代AI智能硬件,支持MCP,交互能力MAX!

2025 年 6 月
一 二 三 四 五 六 日
 1
2345678
9101112131415
16171819202122
23242526272829
30  
« 5 月    

归档

  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×