科研工作者归档

GPT-4o图像生成架构被“破解”了？自回归主干+扩散解码器，还有4o图像生成全面测评基准

上午11时 2025/04/09 作者量子位

”了！
最近一阵，
“万物皆可吉卜力”让GPT-4o的图像生成功能一炮而红
，人们随之好奇：
4o图

下午4时 2025/04/07 作者机器之心

AI 大模型将接管大多数资料处理工作。文章介绍了心流 AI 助手的功能，包括论文精读、引文直达、知识库问答和多轮深度搜索等科研专用工具，帮助用户高效获取与沉淀知识。

下午12时 2024/12/16 作者机器之心

AI Pioneers 专栏投稿
作者
：BV百度风投
Han、轲迪
通用语言模型率先起跑，但通用视

上午8时 2024/12/08 作者 PaperWeekly

引言
在当今人工智能研究领域，视觉语言模型（VLMs）在多模态推理任务中展现了显著的进步。VLMs