无需微调即可适应20多种视觉任务!爱诗科技与悉尼大学联合推出LaVin-DiT:大规模视觉扩散Transformer 下午11时 2024/12/04 作者 极市干货 ↑ 点击 蓝字 关注极市平台 作者丨王兆卿博士 悉尼大学,爱诗科技 研究方向|视觉表征学习,多模态表
爱诗科技与悉尼大学联合发布大视觉模型LaVin-DiT,统一多项视觉任务 下午2时 2024/12/03 作者 PaperWeekly 研究问题 当前的 Large Vision Models 多为直接从自然语言处理架构改编,但这些模型