LLM 自回归+Diffusion Loss?Orthus:仅需72小时训练时间,即可高精度多模态生成 2025年6月17日23时 作者 极市干货 型 Orthus,可同时生成离散文本和连续图像特征。其通过特定的扩散头和语言模型头分别处理图像和文本