微软开源MarkitDown,RAG文档解析就这么解决了~
近期微软开源了MarkItDown,一款将PDF、PPT、Word等文件转换为Markdown的实用程序,支持多种格式,并提供Python基本用法和使用大型语言模型进行图像描述示例。
近期微软开源了MarkItDown,一款将PDF、PPT、Word等文件转换为Markdown的实用程序,支持多种格式,并提供Python基本用法和使用大型语言模型进行图像描述示例。
微软开源MarkItDown工具,支持PDF、Word等多种文件转换为Markdown格式,并具备调用大语言模型描述图像的功能。使用简单,代码几行即可实现转换。
一款多功能文档处理工具MarkItDown由微软开源提供,支持PDF、Office文档、图片、音频等多种格式文件转换为Markdown格式,具备OCR文字识别、语音转文字等功能。适用于文档批量处理、索引检索和数据分析等场景。