达摩院开源了一个从在线教学视频中提取的多模态数据集 上午8时 2025/01/17 作者 NLP工程化 达摩院发布多模态数据集,包含650万张图片和8亿文本,来自2.2万小时在线教学视频,涵盖数学、物理、化学等基础学科。