SGLang 源码学习笔记:Cache、Req与Scheduler 下午7时 2025/05/14 作者 GiantPandaCV 41 前言 笔者一直想找个开源的推理引擎框架学习一下源代码,机缘巧合认识了 sglang 社区的朋友
《超大规模操作手册:在 GPU 集群上训练 》Part1(基础概念,DP,TP) 下午2时 2025/02/22 作者 GiantPandaCV cale-playbook 作者:nanotron 校正:pprp 我们在最多 512 个 GPU
被玩疯的小红书 AI 翻译,用了哪家大模型? 下午11时 2025/01/20 作者 特工宇宙 小红书在五天内全量更新了笔记和评论的多语言翻译功能。此功能利用大语言模型技术,处理文字的歧义和缩写等情况时更加精准,并且有时会出现意料之外的结果。