多模态
关税刷屏的一周,AI圈也暗流涌动:Llama 4来了,O3和O4-mini也要来了,DeepSeek R2和GPT-5也不远了?
Meta发布Llama 4系列,强调多模态和超长上下文窗口;OpenAI确认O3和O4-mini即将上线且GPT-5将免费;DeepSeek与清华提出SPCT方法提升推理扩展性能。
2024 AAAS Fellow名单出炉:华人学者刘威入选
三位华人学者入选2024年AAAS Fellow名单,包括腾讯杰出科学家刘威、纽约城市学院教授田英利和埃默里大学教授熊莉。他们分别在计算机视觉、机器学习及数据隐私等领域做出突出贡献。
在线教程丨YOLO系列重要创新!清华团队发布YOLOE,直击开放场景物体实时检测与分割
清华大学团队提出YOLOE模型,实现了开放物体探测与分割。该模型基于YOLO架构改进,具备多模态能力,能听懂语言指令、看懂图像,并自主发现新事物。HyperAI超神经平台上线了详细的部署教程。
谷歌发布Gemini 2.5 Pro:思考模型、原生多模态,编码、数学能力屠榜
谷歌发布的Gemini 2.5 Pro模型在多个基准测试中达到SOTA水平,并且在Arena排行榜上排名第一。它具有强大的推理能力和代码生成能力,在视觉和编程领域表现卓越。
ICLR 2025北京论文分享会启动,一起探讨多模态、Agent等热门话题
大模型时代,ICLR 2025 论文分享会吸引了大量研究机构和高校参会。该活动将设置 Keynote、论文分享、圆桌对话、Poster 展示环节,邀请顶级专家与作者交流热门主题,包括多模态、Agent 等。