一款能从任何文档中提取文本的开源工具:Kreuzberg
Kreuzberg 是一款开源工具,能从各种文件格式(如 PDF、图像、Word 文档)中自动化提取文本,支持 GPU 无要求且提供统一的异步接口。
Kreuzberg 是一款开源工具,能从各种文件格式(如 PDF、图像、Word 文档)中自动化提取文本,支持 GPU 无要求且提供统一的异步接口。
Kreuzberg 是一个现代 Python 库,用于从多种文件格式中高效提取文本。它提供高级功能、错误处理和全面支持,通过多种异常类型确保稳健的性能。