无需微调即可适应20多种视觉任务!爱诗科技与悉尼大学联合推出LaVin-DiT:大规模视觉扩散Transformer 下午11时 2024/12/04 作者 极市干货 ↑ 点击 蓝字 关注极市平台 作者丨王兆卿博士 悉尼大学,爱诗科技 研究方向|视觉表征学习,多模态表
支持20+视觉任务,多项SOTA!可扩展多任务视觉基础模型LaVin-DiT:融合时空VAE与DiT 下午8时 2024/12/15 下午11时 2024/11/21 作者 极市干货 ↑ 点击 蓝字 关注极市平台 作者丨AI生成未来 来源丨AI生成未来 编辑丨极市平台 极市导读 模型