大规模语言模型归档

verl-pipeline：为大规模语言模型（LLM）的强化学习训练提供高效、灵活的解决方案

2025年5月11日8时作者 NLP工程化

Agentica-project/verl-pipeline 提供高效灵活的解决方案支持高达70B参数模型和数百个GPU训练，集成多种主流LLM框架及强化学习算法。

2025年4月28日16时作者机器之心

业
技术书
，更是
AI时代不可或缺的知识工具书。
任何人
都能在本书中找到属于自己的成长路径。
在

2025年4月19日16时作者新智元

58 2B4T，将低精度与高效能结合，开创了AI轻量化的新纪元。通过精心设计的推理框架，BitNet

2025年4月10日23时作者量子位

的视频，都可以直接做
推理
和
解析
了！
瞧~只需“喂”上一段
柯南片段
，AI就摇身一变成“名

2025年4月10日11时作者机器之心

token，导致其生成昂贵且缓慢。
近日，EAGLE 团队的新作《EAGLE-3: Scaling

2025年4月9日8时作者 NLP工程化

Genspark发布了一个结合LLM和多种工具的数据集的混合超级智能体，能够帮助用户生成旅行计划、预定餐位并制作动画短片。

MLNLP社区是国内外知名的人工智能学术社区，其愿景是促进机器学习与自然语言处理领域内的交流合作。论文《Stop Overthinking》探讨了高效推理的方法及其在自动驾驶和医疗诊断等领域的应用挑战，提出模型优化、动态压缩和提示工程三大方向的研究进展及未来展望。

2025年2月22日14时作者 GiantPandaCV

cale-playbook
作者：nanotron
校正：pprp
我们在最多 512 个 GPU

2025年2月21日12时作者每日AI新工具

本文介绍了五个开源项目：Refly用于AI创作，Crawl4LLM用于大规模语言模型预训练的网页爬虫工具，Open Reasoner Zero用于提升大规模推理导向的强化学习训练，SongGen用于文本生成歌曲，Train-DeepSeek-R1通过强化学习提升模型推理能力。

2025年2月13日16时作者机器之心

于是，不少大大小小的 AI 云服务商都看到了机会，部署上线了 DeepSeek 的各个模型，并还通过