港大与字节提出TokenBridge:离散和连续token优点我都要!|自回归视觉生成模型解读系列
模简单的优点,又可以保持连续 token 的强表示能力。
>>
加入极市CV技术交流群,走在计算机视
模简单的优点,又可以保持连续 token 的强表示能力。
>>
加入极市CV技术交流群,走在计算机视
ETok在仅使用128个token的情况下,于256×256和512×512分辨率的ImageNet
上海交通大学提出SiTo方法,通过基于相似性的令牌剪枝技术,无需训练且硬件友好地加速扩散模型。显著提升了生成质量并减少了内存和计算成本。
通过1.58-bit FLUX量化模型,显著降低了存储需求和推理内存,同时保持与全精度FLUX相当的性能,在文本生成图像基准测试中表现出色。