新范式,自回归大一统!北大提出VARGPT:单一框架实现视觉「理解」与「生成」
北大团队提出VARGPT模型,通过单一自回归框架实现视觉理解与生成。其创新设计包括引入视觉解码器、多尺度图像分词器和特征投影器,并采用三阶段训练策略优化性能。
北大团队提出VARGPT模型,通过单一自回归框架实现视觉理解与生成。其创新设计包括引入视觉解码器、多尺度图像分词器和特征投影器,并采用三阶段训练策略优化性能。
2025 GDC全球开发者先锋大会即将在上海举办,涵盖大模型、元宇宙、机器人等应用场景。大会将发布多项重要成果,吸引科技界大神和重量级嘉宾参与,提供产业合作、融资对接及社区活动机会。
新智元报道
编辑:编辑部 HZs
DeepSeek成功登顶中美应用商店,打破了美国在AI领域的主导地位。纽约大学教授马库斯认为,当前阶段的‘AI霸权’之争已经结束,中美两国暂时处于平局状态。
新智元报道编辑:peter东 乔杨近日研究发现,即使是最先进的大模型智能体也无法完全应对现实世界中的复杂任务。《Agent Company》项目展示了智能体在虚拟软件公司的运营中所遇到的问题,包括常识缺乏、社交技巧不足以及网页浏览困难等挑战。
新智元报道
编辑:KingHZ
AI模型在「人类最后一次考试」中的准确率低于10%,表现自信过度。该项目包含3000个问题,覆盖100多个学科领域。