3B参数模型
3B小模型吊打72B巨头!轻量级文档解析OCR,性能超Gemini,高效且精准!
近日,Yuliang-Liu团队发布了一款名为MonkeyOCR的轻量级文档解析模型,它以结构-识别-关系(SRR)三元组范式实现了高效精准的文档解析,在英文文档解析任务中超越了Gemini 2.5 Pro和Qwen2.5-VL-72B。其处理速度达每秒0.84页,支持中英文文档处理,并能生成Markdown或JSON结构化数据,适用于企业文档处理、学术研究等场景。
nanoAhaMoment:单文件强化学习库,专为LLM设计,不到700行代码即可实现高效训练
nanoAhaMoment是一款专门为大型语言模型设计的单文件强化学习库,特点包括:单GPU训练3B参数模型、提供详细教程和10小时内完成R1-zero倒计时任务。