OCR技术归档 - 每时AI

解锁文档处理新高度！这个开源神器支持OCR+机器学习，超丰富的API接口，效率翻倍！

上午8时 2025/06/07 作者开源星探

Dedoc是一款ISPRAS团队开源的文档提取与转换工具，支持多格式文档处理，包括Office、PDF和扫描件等，并能智能提取表格、文本格式和逻辑结构。其核心功能亮点涵盖文档逻辑结构提取、复杂表格解析以及OCR扫描件处理。

下午4时 2025/05/23 作者量子位

标准了！
来自香港科技大学、腾讯西雅图AI Lab、爱丁堡大学、Miniml.AI、英伟达的研究者联

下午7时 2025/04/12 作者 AI探索时代

关于RAG在实际场景中的应用，重点讨论了文档处理和高效检索的问题。文档处理涉及多样化和复杂的格式，需要拆分和识别文本、图片和图表等不同内容类型。高效的检索则需利用多种匹配方式（精确字符匹配与语义匹配），通过多路召回策略综合考虑多个维度的数据来优化结果。

下午11时 2025/02/20 作者多知

阿尔法蛋高速词典笔D1Pro新增彩色内容扫描识别功能，通过彩色摄像头和优化算法提升小初高英语教材的识别体验。

上午8时 2024/12/30 作者开源星探

STranslate 是一款集翻译和OCR功能于一身的开源工具，支持多种语言翻译、离线OCR识别及多种翻译服务接入。它还具备高级功能如回译、全局TTS等，适用于学习语言、阅读外文资料、语言创作以及提高工作效率等多种场景。

下午6时 2024/12/17 作者开源AI项目落地

一个基于深度学习的漫画图像翻译工具Manga Image Translator，通过OCR技术识别并翻译漫画中的文字，并无缝嵌入原图中。该项目由作者持续更新维护，支持多种语言和功能选项，目前已有良好效果。