英伟达开源的一款智能文档信息提取及结构化工具:nv-ingest 上午8时 2025/01/14 作者 NLP工程化 英伟达开源的一款智能文档信息提取及结构化工具:nv-ingest,能高效处理大规模的PDF、Word、PPT以及图像等复杂的文档,并结构化输出。它可以同时处理多个文档,并把每个文档分成独立的页面,能识别页面上表格、图表、图像以及文本等不同的内容类型,分别提取出来。 参考文献:[1] github:https://github.com/NVIDIA/nv-ingest (文:NLP工程化) 欢迎分享