自然语言处理(NLP) 归档 - 每时AI

RegressLM：让文本回归分析变得简单高效

2025年7月4日8时作者 NLP工程化

eleganceLM：一种简化高效的文本回归模型，支持预训练和微调，处理长文本输入（最大长度达2048），基于PyTorch开发，易于扩展和集成。

带你从零开始实现一个稀疏专家混合语言模型（MoE模型）

2025年2月25日8时作者 NLP工程化

Hugging Face博客介绍了如何从零实现稀疏专家混合语言模型（MoE），通过解析代码详解自注意力机制、专家模块等组件。