首创像素空间推理,7B模型领先GPT-4o,让VLM能像人类一样「眼脑并用」
研究团队提出像素空间推理范式,让视觉语言模型具备原生视觉操作能力,打破文本对视觉语义的翻译牢笼。通过视觉主动操作和视觉主导推理实现高效视觉理解,在高清图像、复杂场景计数及长视频推理中均取得显著性能提升。
研究团队提出像素空间推理范式,让视觉语言模型具备原生视觉操作能力,打破文本对视觉语义的翻译牢笼。通过视觉主动操作和视觉主导推理实现高效视觉理解,在高清图像、复杂场景计数及长视频推理中均取得显著性能提升。
李开复创立的零一万物公司研发的应用接入DeepSeek-R1模型。这是中国‘大模型六虎’中首个接入DeepSeek模型的AI应用,DeepSeek估值预计在10亿美元至逾1500亿美元之间。