教育场景里的OCR工具,专门处理教育材料,可以从像试卷这种复杂的教育材料中提取结构化数据的多模态OCR工具:Versatile-OCR-Program。支持多语言文本、数学公式、表格、图表等元素提取,还能以语义注释的方式进行标注,生成自然语言描述。支持日语、韩语、英语,可扩展到其他语言,输出格式为JSON或Markdown,支持复杂的布局。


参考文献:
[1] github:https://github.com/ses4255/Versatile-OCR-Program
(文:NLP工程化)