RegressLM:让文本回归分析变得简单高效 2025年7月4日8时 作者 NLP工程化 eleganceLM:一种简化高效的文本回归模型,支持预训练和微调,处理长文本输入(最大长度达2048),基于PyTorch开发,易于扩展和集成。
带你从零开始实现一个稀疏专家混合语言模型(MoE模型) 2025年2月25日8时 作者 NLP工程化 Hugging Face博客介绍了如何从零实现稀疏专家混合语言模型(MoE),通过解析代码详解自注意力机制、专家模块等组件。