字节开源了一款多模态神器!BAGEL上线,超越Qwen2.5-VL,媲美SD3!

字节跳动发布的BAGEL是首个支持多模态输入输出、思维链推理和MOT架构优化的跨模态超级AI模型,性能超越Qwen2.5-VL、InternVL-2.5。它能理解图像更准确,生成图像媲美Stable Diffusion 3,并在10+基准测试中表现优异。

75万元奖金池+心动offer,启元实验室2025重磅赛事来袭,三大赛道,等你来战!

启元实验室启动”启智杯”算法大赛,聚焦卫星遥感图像、无人机目标检测和多模态大模型对抗三大方向。大赛设立75万元奖金池,面向研究机构、企事业单位等开放参赛。

ICML 2025 长视频理解新SOTA!蚂蚁&人大开源ViLAMP-7B,单卡可处理3小时视频

蚂蚁和中国人民大学的研究团队提出ViLAMP模型,实现对超长视频的高效处理。ViLAMP通过混合精度策略,在关键帧上保持高精度分析,大幅提升了视频理解效率,并在多个基准测试中超越现有方案。

上海AI“北斗七星”亮了 !

上海徐汇已汇聚七家AI标杆企业,构建技术研发、场景落地和产业协同创新生态。这些企业在模型能力提升、应用推广和技术商业化等方面发挥作用,推动人工智能发展,并通过高质量孵化器吸引顶尖企业和人才,助力建设全国人工智能高地。