爱诗科技与悉尼大学联合发布大视觉模型LaVin-DiT,统一多项视觉任务 下午2时 2024/12/03 作者 PaperWeekly 研究问题 当前的 Large Vision Models 多为直接从自然语言处理架构改编,但这些模型