LLM 自回归做理解,MaskGIT 方案做生成!VILA‑U:一个模型搞定图像理解、视频理解和生成,简洁而强大 下午11时 2025/06/09 作者 极市干货 kGIT 方案做生成的生成理解统一模型。 >> 加入极市CV技术交流群,走在计算机视觉的最前沿 太长