语言模型归档 - 第5页共6页

《大语言模型基础》书籍

下午11时 2025/01/20 作者 NLP工程化

论文《Large Language Models的基础》已上传arXiv，内容丰富，欢迎关注和研究。

下午10时 2025/01/18 作者 AI技术研习社

近年来检索增强生成技术的发展使得语言模型能够高效利用外部知识。然而小语言模型在RAG中的使用受限，MiniRAG通过语义感知异构图索引和轻量级拓扑增强检索解决了这个问题。

下午11时 2025/01/16 作者开源AI项目落地

在大数量级AI数据处理场景下，JinaAI的ReaderLM-v2语言模型通过将原始HTML转换为Markdown或JSON格式解决了资源消耗问题，并实现了更好的Markdown生成、新增JSON输出及更强的上下文和多语言支持。

下午4时 2025/01/13 作者新智元

谷歌发布的新基准测试FACTS Grounding用于评估AI模型在特定上下文中生成准确文本的能力，通过去除无效回复确保评分准确性。

下午11时 2025/01/08 作者机器之心

机器之心报道
编辑：张倩
老婆饼里没有老婆，夫妻肺片里没有夫妻，RLHF 里也没有真正的 RL。在最

MLNLP 社区致力于促进 NLP 学术界、产业界及爱好者间的交流合作，Meta 新研究展示了记忆层在预训练语言模型扩展中的实用性和性能提升。

下午6时 2024/12/26 作者机器之心

DeepSeek AI开源最新混合专家语言模型DeepSeek-V3-Base，性能优于多个竞品模型，编程能力大幅提升。