日期: 2025 年 2 月 23 日
微软发布3.48T token训练数据集+高质量处理管线,覆盖通用、代码、数学、问答等关键领域
微软发布3.48T token训练数据集及高质量处理框架,覆盖通用、代码、数学和问答等多领域。REDSTONE项目显著提升数据质量和处理效率。
Lightpanda Browser,一个专为 AI 和自动化设计的无头浏览器项目
Lightpanda Browser 是一个专为 AI 和自动化设计的无头浏览器项目,特点是超低内存占用、极其快速执行和启动速度快,目前仍在开发中。
大模型的门槛,又被打下来了!
最近DeepSeek爆火,百度等巨头加速应用。高薪职位「大模型应用开发工程师」炙手可热,知乎知学堂推出就业速成计划,涵盖技术原理、实战案例和职业发展等内容,100个名额限时免费预约。
39K 颠覆传统搜索!RAGFlow:AI驱动的开源文档搜索引擎来了!
RAGFlow 是一款基于深度文档理解的开源 RAG 引擎,能从 100 多种文件格式中高效提取关键信息,并支持文本切片、模板化处理和多种数据源。它解决了大语言模型在实际应用中的文档处理难题。