阿里QVQ-72B开源，o1视觉圈的王！

在迈入2025年之前，Qwen为你准备了最后一份礼物，开源了视觉推理模型QVQ-72B-Preview，其中V代表视觉。它只需读取一张图片和一个指令，开始思考，适当地进行反思，持续推理，得到最终预测。

QVQ-72B-Preview 在 MMMU 基准测试中取得了 70.3 的分数，显著超越了 Qwen2-VL-72B-Instruct。在剩下的三个专注于数学和科学问题的基准测试中，该模型表现出色，有效缩小了与领先的最先进的 o1 模型之间的差距。此外，整体效果优于GPT-4o-2024-05-13、Claude3.5-Sonnet。

QVQ-72B-Preview Demo测试：

https://huggingface.co/spaces/Qwen/QVQ-72B-previewhttps://huggingface.co/collections/Qwen/qvq-676448c820912236342b9888https://qwenlm.github.io/zh/blog/qvq-72b-preview/

（文：PaperAgent）

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

发表评论 取消回复

下载每时AI手机APP

发表评论取消回复