JinaAI发布ReaderLM-v2，1.5B轻松拿捏HTML转JSON或MarkDown

ReaderLM-v2 是一个拥有1.5B参数的语言模型，能够将原始的HTML转换为格式美观的Markdown或JSON，具有更高的准确性和改进的长文本处理能力。

ReaderLM-v2支持多种语言（共29种），专门用于涉及HTML解析、转换和文本提取的任务。

ReaderLM-v2 与 ReaderLM 1.5b、Claude 3.5 Sonnet 以及 Gemini 2.0 Flash 在处理 HackerNews 首页 HTML 转 Markdown 任务对比中，转换结果完整、层次结构清晰。

ReaderLM-v2特点

结合三阶段数据生成（起草-改进-评估）与自我对弈强化学习，实现持续提升。

https://github.com/OpenBMB/MiniCPM-o/tree/main

（文：PaperAgent）

《JinaAI发布ReaderLM-v2，1.5B轻松拿捏HTML转JSON或MarkDown》有1条评论

ReaderLM-v2 参数1.5B， Markdown/JSON 转换神器，支持多语言，长文本处理还行。

《JinaAI发布ReaderLM-v2，1.5B轻松拿捏HTML转JSON或MarkDown》有1条评论