跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

多模态理解

一手实测文心4.5和X1:不输DeepSeek

下午7时 2025/03/16 作者 沃垠AI

心大模型4.5
是百度的新一代原生多模态基础大模型,多模态理解能力优秀,理解、生成、逻辑、记忆能力全

分类 分享 标签 2025年、 多模态理解、 技术创新、 推理+工具调用、 文心4.5、 文心X1 发表评论

AI 时代的超级应用,是一个超级框

下午4时 2025/03/13 作者 APPSO

夸克升级推出「AI 超级框」,具备多模态理解与深度思考能力,能协助创意构思、健康咨询、学习解惑及专业任务处理。展示了 AI 在C端的新形态。

分类 资讯 标签 多样化任务、 多模态理解、 夸克、 深度思考、 阿里、 阿里通义系列模型 发表评论

小红书、上交发布多模态大模型新基准,Gemini 1.5 Pro准确率仅48%

下午11时 2025/02/28 作者 PaperWeekly

WorldSense
,一个全新的基准测试,用来
评估多模态大模型(MLLMs)的多模态真实场景理

分类 大模型、 学术 标签 多模态理解、 文字转录、 视觉信息、 视频帧采样、 音频信息、 高效训练 发表评论

马斯克正式发布Grok 3,竞技场首超1400分、Karpathy实测推理能力好于DeepSeek

下午4时 2025/02/18 作者 Founder Park

这样的评价:
Grok 3是首个突破1400分的模型,并且在所有类别中排名第一。
而且,Grok 3

分类 资讯 标签 Grok 3、 xAI、 多模态理解、 文本生成、 游戏业务、 融资 发表评论

最强全模态模型Ola-7B横扫图像、视频、音频主流榜单,腾讯混元Research&清华&NTU联手打造

下午12时 2025/02/18 作者 机器之心

多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,

分类 学术、 资讯 标签 Ola、 全模态语言模型、 多模态理解、 视频-音频问答、 跨模态数据准备、 音频模型 发表评论

英伟达市值蒸发近6000亿,而DeepSeek刚刚又开源新模型!

下午10时 2025/01/28 作者 Datawhale

Datawhale分享
最新:DeepSeek,编辑:机器之心
龙年即将结束,但有些股民可能无心过春

分类 分享 标签 7B、 DeepSeek、 Janus Pro、 多模态理解、 技术创新、 视觉模型 发表评论

DeepSeek除夕狂飙大招:开源多模态掀翻全场!256张A100训两周碾压DALL-E 3

下午4时 2025/01/28 作者 新智元

新智元报道
编辑:Aeneas 好困
【新智元导读】
DeepSeek除夕又放出重磅炸弹:多模态大一

分类 资讯 标签 80%、 Janus-Pro、 多模态理解、 统一模型、 视觉生成、 视觉编码解耦 发表评论

追平满血版o1的国产多模态模型终于来了!训练细节全部公开

下午11时 2025/01/20 作者 机器之心

机器之心报道
机器之心编辑部
春节前最后一周,能媲美 Open AI 满血版 o1(Full Ver

分类 学术、 资讯 标签 kimi、 OpenAIo1模型、 在线镜像下降法、 多模态理解、 强化学习、 长上下文scaling 发表评论

李飞飞谢赛宁:多模态LLM「空间大脑」觉醒,惊现世界模型雏形!

下午2时 2024/12/23 作者 新智元

新智元报道
编辑:Aeneas 好困
【新智元导读】
李飞飞、谢赛宁团队又有重磅发现了:多模态LLM

分类 资讯 标签 LLM、 MetaMorph、 VPiT、 多模态理解、 视觉生成、 认知映射 发表评论

谷歌推出Project Mariner了

上午10时 2024/12/13 作者 陳寳

谷歌推出的新产品Mariner展示了AI技术在实际应用中的巨大潜力,具备多模态理解、自动化操作和持续学习等特性,在多个场景下提高了用户的网络浏览和操作体验。

分类 分享 标签 Gemini 2.0、 Mariner、 多模态理解、 智能体、 用户隐私、 谷歌 发表评论
较早文章
较新文章
← 上一页 页面1 页面2 页面3 下一页 →

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

近期文章

  • 提示工程101第十四课:处理歧义与提升清晰度
  • 未来属于AI SaaS,这8个开源工具必不可少!
  • 95%的人不知道什么是AGI,也不知道他们将很快失业
  • 再见Latex,基于Markdown的多功能排版系统Quarkdown
  • 中美史诗级大团结,在一款被玩家狂喷的游戏里实现了

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 5 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 4 月    

归档

  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×