简单却强大!端到端视觉Tokenizer调优让多模态任务性能飙升!智源&卢湖川团队等发布ETT 下午11时 2025/05/20 作者 极市干货 本文 提出了一种端到端视觉分词器调优方法ETT,通过联合优化分词器的重建目标和下游任务目标,并利用码