实践教程|Transformer Decoder-Only 模型批量生成 Trick
本文介绍了如何通过调整输入向量的位置和掩码,使得Transformer模型在批量生成时能够更好地模拟训练过程中的情况,从而解决生成与训练阶段的不匹配问题。
本文介绍了如何通过调整输入向量的位置和掩码,使得Transformer模型在批量生成时能够更好地模拟训练过程中的情况,从而解决生成与训练阶段的不匹配问题。
清华大学提出DiffGS生成式模型,实现无预处理三维高斯生成,支持多种任务如图生3DGS、文生3DGS等。该模型利用函数化方法表示三维高斯,并通过扩散生成式模型进行训练和生成。
↑ 点击
蓝字
关注极市平台
作者丨王兆卿博士 悉尼大学,爱诗科技
研究方向|视觉表征学习,多模态表