JinaAI开源升级!一个开源HTML转Markdown和JSON的小型语言模型,参数仅有1.8B。

在大数量级AI数据处理场景下,JinaAI的ReaderLM-v2语言模型通过将原始HTML转换为Markdown或JSON格式解决了资源消耗问题,并实现了更好的Markdown生成、新增JSON输出及更强的上下文和多语言支持。

Jina AI 发布 ReaderLM-v2:1.5B小模型大突破,HTML 转 Markdown 和 JSON 性能显著提升

Jina AI 发布了第二代小型语言模型 ReaderLM-v2,专注于HTML转Markdown和JSON。该模型在长上下文处理、语法生成和直接转换功能上表现突出,支持多语言且性能超越大型模型,在多个关键指标上领先。

HTML转换为高质量的Markdown支持29种语言,使用Kokoro-82M将电子书变为有声书,唱歌声音转换模型

本期内容涵盖了ReaderLM-v2、PDF to Podcast、Audiblez、RIFT-SVC和MangaNinja等五个AI工具或模型,分别用于HTML转Markdown/JSON、PDF转换音频、电子书转化为有声书、唱歌声音转换以及基于参考的动漫线条艺术上色。