一次训练搞定图像生成 + 理解?谷歌UniFluid:连续视觉 Token 实现多模态融合 2025年7月8日23时 作者 极市干货 归架构,通过将文本离散 Token 与图像连续 Token 融合,共同推动图像生成与视觉理解任务。