SigLIP 归档 - 每时AI

AI视觉重大突破！Meta等发布Pisces「双脑架构」：一个模型通吃20+榜单

2025年6月20日23时作者极市干货

Meta等机构发布Pisces模型，它采用“双脑架构”，通过解耦视觉编码架构和三阶段渐进训练策略，实

2025年6月12日8时作者极市干货

一个整合高分辨率对比语义编码器与多模态大模型的统一生成框架，仅用 2.7M 样本即支持图像理解、生成、编辑与感知等多种任务。

2025年4月23日16时作者量子位

腾讯混元与InstantX合作推出开源版角色生成插件InstantCharacter，基于DiTs架构实现高保真度和个性化角色创作，克服了传统方法的限制。

2024年12月5日18时作者新智元

OpenAI挖走DeepMind和Midjourney多名顶级工程师，涉及多模态人工智能研究。其中三人曾共同发表多篇顶尖论文，包括Vision Transformer (ViT)，提出了一种新的图像识别方法。

2024年11月29日15时作者机器之心

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000