markdown
将PPT 转 Markdown 文件的开源工具:PPTX2MD
一款 PPT 转 Markdown 文件的开源工具:PPTX2MD,支持保留标题、列表、粗体、斜体、颜色等格式,并且还支持将图像内容插入到 Markdown 中。
专注于记录和写作的跨端 AI 笔记应用NoteGen
NoteGen 是一款基于 Tauri 开发的跨端 AI 笔记应用,提供记录、写作和 AI 助手功能。它支持多种记录方式,并具备整理功能将笔记自动转换为可读文章。
Github 趋势榜第一!开源 Agent 开发神器,任意文档转 JSON、MD
MLNLP社区介绍其目标是促进自然语言处理领域内的交流合作。近日开源的Docling文档解析工具,支持多种文档格式转换为JSON/Markdown,解决了文档处理中的多格式不统一、排版复杂等问题,提高了生产环境下的稳定性和效率。
JinaAI发布ReaderLM-v2,1.5B轻松拿捏HTML转JSON或MarkDown
ReaderLM-v2 是一个拥有1.5B参数的语言模型,能够将HTML转换为美观的Markdown或JSON格式,并支持29种语言。它在生成复杂元素、使用预定义模式输出JSON以及处理长文本方面表现出色,并通过强化学习提升稳定性。
8.4K Star!本地化高精度OCR神器!GPT驱动,零样本即可识别!
一款名为Zerox的OCR工具通过集成GPT-4o-mini模型实现了高效文档处理。支持PDF、DOCX等多种格式文件,并能准确识别包含复杂布局(如表格、图表)的扫描文档,输出Markdown格式便于编辑和使用。
将PDF文档转换为Markdown的智能工具Vision Parse
使用最先进的视觉语言模型将 PDF 文档解析为格式精美的 Markdown 内容。支持多种 Vision LLM 模型,并提供本地模型托管功能。
微软开源MarkitDown,RAG文档解析就这么解决了~
近期微软开源了MarkItDown,一款将PDF、PPT、Word等文件转换为Markdown的实用程序,支持多种格式,并提供Python基本用法和使用大型语言模型进行图像描述示例。
微软开源MarkItDown:一键转换文档为Markdown,LLM时代的必备利器!
微软开源MarkItDown工具,支持PDF、Word等多种文件转换为Markdown格式,并具备调用大语言模型描述图像的功能。使用简单,代码几行即可实现转换。
将各种文件格式转换为Markdown的开源工具E2M
E2M 是一个 Python 库,用于将多种文件格式(如 doc, docx, epub, html 等)转换为 Markdown 格式。通过解析器和转换器架构实现,支持包括 PDF、MP3、URL 在内的多种文件类型的处理,并提供 CLI 工具来加速转换过程。