文生图进入R1时刻:港中文MMLab发布T2I-R1

姜东志博士提出了一种新型的文本生成图像模型T2I-R1,融合了语义层面和细粒度令牌层面的协同推理策略。该模型通过强化学习方法统一了这两个层次的推理解析过程,并使用集成视觉专家模型作为奖励机制来评估生成图片的质量,显著提高了图像生成的效果。