V²Flow归档 - 每时AI

视觉Token无缝对齐LLMs词表！V²Flow：基于LLMs实现高保真自回归图像生成

上午11时 2025/04/03 作者量子位

V²Flow团队发布的新开源框架V²Flow解决了视觉Token与大语言模型词表的不一致问题，实现了高保真自回归图像生成。该技术通过视觉词汇重采样器将视觉内容嵌入到LLM的词汇空间中，并使用掩码自回归流匹配解码器进行视觉重建，显著提高了压缩效率和生成质量。