新范式,自回归大一统!北大提出VARGPT:单一框架实现视觉「理解」与「生成」

北大团队提出VARGPT模型,通过单一自回归框架实现视觉理解与生成。其创新设计包括引入视觉解码器、多尺度图像分词器和特征投影器,并采用三阶段训练策略优化性能。

2025 GDC上海开战!AI应用全覆盖,VC疯狂撒钱,offer掉到你手软

2025 GDC全球开发者先锋大会即将在上海举办,涵盖大模型、元宇宙、机器人等应用场景。大会将发布多项重要成果,吸引科技界大神和重量级嘉宾参与,提供产业合作、融资对接及社区活动机会。

顶级AI智能体不会社交,创业远不如人类!CMU等:最多完成24%任务

新智元报道编辑:peter东 乔杨近日研究发现,即使是最先进的大模型智能体也无法完全应对现实世界中的复杂任务。《Agent Company》项目展示了智能体在虚拟软件公司的运营中所遇到的问题,包括常识缺乏、社交技巧不足以及网页浏览困难等挑战。