北大开源首个针对视频编辑的新指标,与人类感知高度对齐|AAAI25

北京大学MMCAL团队开发了首个用于视频编辑质量评估的新指标VE-Bench,并通过丰富且符合人类主观感受的数据集进行训练。该指标将视频的整体效果分成多个维度进行综合评价,包括文字-目标一致性、参考源与目标的关系、技术畸变和美学标准等多个方面。

创业搞AI的清北复交毕业生们,都选择在哪些城市开公司?

中国AI创业者倾向于在毕业学校所在地或之前工作过的公司所在地创业。以清华、北大、浙大等高校为例,AI创业者更倾向于在北京、上海和浙江注册公司;而阿里系、百度系及腾讯系的AI创业者则偏好选择在浙江、北京和广东等地。

世界模型进入4D时代!单视角视频构建的自由视角4D世界来了

极佳科技团队通过ReconDreamer实现自动驾驶场景的自由视角重建与生成。该模型仅需单视角输入视频,即可通过世界模型训练减少伪影并进行渐进式修复,显著提升大范围相机运动下的渲染质量,媲美专业三维重建技术。

重磅!北大联合字节VAR模型获NeurIPS 2024最佳论文:改写图像生成的未来范式

北大与字节跳动团队的论文《Visual AutoRegressive Modeling: Scalable Image Generation via Next-Scale Prediction》获得NeurIPS 2024最佳论文奖。该模型提出了多尺度预测的新范式,显著提升了图像生成的效率和质量,并在视觉生成领域验证了‘规模化定律’。

DeepSeek等团队新作JanusFlow: 1.3B大模型统一视觉理解和生成

Janus团队提出了一种名为JanusFlow的新模型,该模型结合了预训练视觉编码器与MLM的方法以及基于Rectified Flow的生成框架,实现了统一的视觉理解和生成能力。通过将理解与生成任务分别配置专用编码器,并利用REPA方法加速生成训练,JanusFlow在多模态理解和生成任务上表现出色。