简单却强大!端到端视觉Tokenizer调优让多模态任务性能飙升!智源&卢湖川团队等发布ETT 2025年5月20日23时 作者 极市干货 本文 提出了一种端到端视觉分词器调优方法ETT,通过联合优化分词器的重建目标和下游任务目标,并利用码
ICLR 2025 从碎片到完整:面向语义完整且等价的多模态视觉分词新范式SeTok 2025年5月7日16时 作者 PaperWeekly ion tokenization)作为视觉与语言语义对齐的关键环节,发挥着至关重要的作用。 然而,现