RAG系统
bge-base-en-v1.5微调实战!手把手教你打造垂直领域“最强大脑”,让Embedding模型秒变行业专家!
文章介绍了嵌入微调在RAG系统中的重要性,强调其对于特定领域专业知识的提升作用,并详细说明了数据集构建、损失函数选择和模型训练的方法。
可基于任何内容创建的 AI 问答助手Gurubase
Gurubase 是一个开源 RAG 系统,支持通过网页、PDF、视频和 GitHub 仓库创建 AI 驱动的问答助手(’Gurus’)。它允许嵌入网站提问,并提供实时更新等功能。
构建生产级RAG系统注意事项
构建生产级 RAG 系统涉及检索、数据切分、嵌入模型选择、向量数据库部署和搜索策略等多个关键组件,还包括生成部分如 LLM 选择和 Prompt 设计。同时需要关注规则与启发式应用以及观察评估监控安全性等保障措施。
RAG101第一课:一个简单的RAG工作流
从这一篇文章开始,我们将正式开启 RAG101 系列教程。我们介绍如何使用 Qwen 模型构建一个简单的 RAG 系统,并包含文档加载、文本拆分、嵌入处理和语义检索等步骤。
27个大模型混战电商领域,DeepSeek-R1&V3仍是最强丨首个中文电商问答基准评估结果
ChineseEcomQA是淘天集团研发的首个聚焦电商领域的可扩展问答基准,旨在精准评估大模型对电商基础概念的理解。它通过覆盖20个行业的1800组高质量问答数据来提升模型性能,并探讨了RAG在增强LLM知识方面的作用。