一款强大且可离线使用的 OCR 工具:Ollama OCR

GitHub 上一款强大且可离线使用的 OCR 工具:Ollama OCR。通过搭配 Ollama 在本地使用,支持多种视觉模型,包括 LLaVA 7B、Llama 3.2 Vision 等。支持多种文件格式输出,如 Markdown、纯文本、JSON 等,同时支持并行处理多个图像。

参考文献:
[1] GitHub:https://github.com/imanoop7/Ollama-OCR


(文:NLP工程化)

发表评论