跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

图像理解

刚刚,OpenAI发布GPT-4.1!全系支持百万token上下文,全方位碾压GPT-4o并且价格更低

上午8时 2025/04/15 作者 机器之心

含了三个模型,分别是
GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano,它们仅

分类 学术、 资讯 标签 GPT-4.1、 OpenAI-MRCR、 图像理解、 视觉相关、 视频基准、 长上下文 发表评论

Llama4凌晨突然发布!以超高性价比开启原生多模态AI和开源MoE的新时代,并公开训练策略!

下午2时 2025/04/06 作者 GiantPandaCV

Llama 4
系列中的首批模型,这些模型将使人们能够构建更个性化的多模态体验。
Llama 4 S

分类 学术 标签 2万亿参数、 Llama 4、 Meta公司、 图像理解、 多模态性、 强化学习 发表评论

DeepSeek与Qwen组团开源了模型,冲!

下午2时 2025/03/26 作者 PaperAgent

阿里通义千问和DeepSeek分别开源了Qwen2.5-VL-32B-Instruct和DeepSeek-V3-0324两个模型,前者主要提升了数学推理、细粒度图像理解与推理能力,并且调整输出样式以提供更符合人类偏好的答案;后者则强调编程能力和前端开发功能。

分类 分享 标签 32B规模、 Qwen、 图像理解、 大语言模型、 数学推理、 阿里云 发表评论

阿里开源 Qwen2.5-VL-32B:小模型,大能量

下午2时 2025/03/25 作者 子非AI

阿里巴巴发布Qwen2.5-VL-32B-Instruct,参数仅为32B却在多项关键指标上超越自家72B模型及GPT-4。该模型展示了强大的数学推理、图像理解能力,并且可以在单 GPU或配置合理的Mac笔记本电脑上运行。

分类 分享 标签 72B、 Apache 2.0、 Qwen2.5-VL-32B-Instruct、 图像理解、 复杂推理、 阿里巴巴 发表评论

Long-VITA:突破百万Tokens限制!开源多模态大模型新标杆

下午4时 2025/03/01 作者 PaperWeekly

落后于闭源模型。部分专注于长上下文场景的开源模型在短上下文场景(如短视频或静态图像)中又表现不佳。

分类 大模型、 学术 标签 4096帧、 Long-VITA、 图像理解、 大模型、 开源数据、 视频理解 发表评论

一篇关于 DeepSeek 的深度答疑!

下午2时 2025/02/11 作者 Datawhale

hompson
是科技领域最具洞察力的分析师之一,他的博客 Stratechery 以其对科技行业的

分类 分享 标签 AI模型、 DeepSeek、 中国市场、 图像理解、 生态系统、 语言理解 发表评论

LLaVA-Mini来了!每张图像所需视觉token压缩至1个,兼顾效率内存

下午12时 2025/02/06 作者 机器之心

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000

分类 学术、 资讯 标签 LLaVA-Mini、 图像理解、 显存使用、 视频推理、 视频理解、 计算负载 发表评论

全球首个全模态理解开源端模型:长语音自动总结,图文音啥都会!300%推理速度领先,来自无问芯穹

下午2时 2024/12/16 作者 量子位

全球首个端侧全模态理解开源模型Megrez-3B-Omni发布,支持图片、音频、文本三种模态数据,在多种测评基准中表现优异。

分类 资讯 标签 Megrez-3B-Omni、 全模态理解、 图像理解、 开源模型、 文本理解、 无问芯穹 发表评论

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

近期文章

  • 从打分器到思考者:RM-R1用推理重塑模型价值判断
  • SSM+扩散模型,竟造出一种全新的「视频世界模型」
  • 250美元起售,还开源,Hugging Face 发布史上最亲民人形机器人
  • 一周两破18年数学纪录!陶哲轩惊叹:AlphaEvolve带来久违「加速度」
  • 大模型推理的“左右脑”革命!华为盘古Embedded凭昇腾之力,让快慢思考合二为一

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 6 月
一 二 三 四 五 六 日
 1
2345678
9101112131415
16171819202122
23242526272829
30  
« 5 月    

归档

  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×