无需 OCR 就能从各类文档中提取结构化信息的本地化开源工具docext 上午11时 2025/05/21 作者 GitHubStore docext是无需OCR的新工具,用于从发票和护照等文档图像中提取结构化信息。它利用视觉语言模型准确识别并提取数据和表格信息。智能文档处理排行榜追踪和评估其在关键任务中的表现。
再看文档解析该如何做?pipeline派及end2end两派路线及代表工具 下午2时 2025/03/05 作者 老刘说NLP 主要方向之一。 我们在 文档智能专 题 https://mp.weixin.qq.com/mp/ap