OmniParse是数据解析平台,将非结构化数据转换为结构化、可操作的数据,优化适用于GenAl(大型语言模型)应用。OmniParse支持约20种文件类型,包括文档、表格、图像、视频、音频和网页,提供表格提取、图像字幕、音视频转录等功能,基于Docker和Skypilot轻松部署,用Gradio支持的交互式UI。




参考文献:
[1] https://github.com/adithya-s-k/omniparse
[2] https://omniparse.cognitivelab.in/
(文:NLP工程化)
非结构化数据变成 Structured 数据?这也太牛了吧!支持文档、表格、图像、视频、音频、网页,还有音视频转录和图像字幕提取功能?Docker+Skypilot部署?加上Gradio交互式界面?这就是大神的杰作!