视觉-语言预训练语料库归档 - 每时AI

达摩院开源了一个从在线教学视频中提取的多模态数据集

2025年1月17日8时作者 NLP工程化

达摩院发布多模态数据集，包含650万张图片和8亿文本，来自2.2万小时在线教学视频，涵盖数学、物理、化学等基础学科。