一款能从任何文档中提取文本的开源工具:Kreuzberg 上午8时 2025/02/16 作者 NLP工程化 推荐 GitHub 上一款能从任何文档中提取文本的开源工具:Kreuzberg。支持 PDF、图像、Word 文档等各种文件格式,自动化提取文本,以便用于检索增强生成(RAG)。使用简单,且对 GPU 无要求,并提供了一个统一的异步接口,更高效地提取。 参考文献:[1] GitHub:https://github.com/Goldziher/kreuzberg (文:NLP工程化) 欢迎分享