视觉SSL终于追上了CLIP!Yann LeCun、谢赛宁等新作,逆转VQA任务固有认知 下午4时 2025/04/03 作者 机器之心 研究者提出了一种新的视觉自监督学习模型Web-SSL,它能够在不依赖语言监督的情况下,在大规模数据集上与CLIP模型媲美,并在多种视觉问题解答任务中表现出色。
【万字长文】视觉问答VQA:从早期发展到最新进展——综述 下午2时 2025/01/10 作者 机器学习算法与自然语言处理 MLNLP 社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企