ETT:打破原生多模态学习视觉瓶颈,重塑视觉tokenizer优化范式 下午4时 2025/05/27 作者 机器之心 本文提出了一种新的端到端视觉 tokenizer 调优方法 ETT,解决了传统方法存在的问题,显著提升了多模态任务的性能。