小型语言模型归档

PDF文件长出「AI大脑」？网友惊呼：这操作太「黑科技」了！

下午4时 2025/05/16 作者新智元

Aiden Bai展示了在PDF文件中嵌入大语言模型的技术，TinyStories、Pythia和TinyLLM等小型模型可在PDF内运行，支持讲故事、聊天等功能。他还提到通过RISC-V模拟器将Linux系统置于PDF中运行的项目。

下午4时 2025/03/15 作者量子位

ChineseEcomQA是淘天集团研发的首个聚焦电商领域的可扩展问答基准，旨在精准评估大模型对电商基础概念的理解。它通过覆盖20个行业的1800组高质量问答数据来提升模型性能，并探讨了RAG在增强LLM知识方面的作用。

下午2时 2025/01/21 作者 Hugging Face

2024 年 4 月，我们发布了 Jina Reader (https://jina.ai/read

下午4时 2025/01/11 作者多知

微软发布rStar-Math技术，让小型语言模型具备深度思考能力。通过蒙特卡罗树搜索方法，该技术在多个开源模型测试中取得了显著提升，甚至超越了OpenAI的o1-preview系统。

下午1时 2024/11/24 作者机器之心

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000