SGLang 归档 - 每时AI

腾讯发布混元-A13B，可能是效率最高的开源大模型

2025年6月30日11时作者路过银河AI

Hunyuan-A13B
，这是一个基于细粒度混合专家（MoE）架构的创新且开源的大语言模型（LL

SGLang 推理引擎的技术要点与部署实践｜AICon 北京站前瞻

2025年6月13日16时作者 AI前线

SGLang 是一个备受瞩目的开源推理引擎，在 GitHub 上已有近 15K 星星和月均 10 万次下载。尹良升分享了 SGLang 的关键技术和优化，包括 PD 分离、推测解码和 KV 缓存落盘等技术，帮助平衡性能、资源利用率和成本，并强调开源社区对于推动技术演进和应用落地的重要性。

135 个项目、七大趋势、三大赛道：撕开大模型开源生态真相，你会怎么卷？

2025年5月29日16时作者机器之心

Claude
三大开发者大会接连登场的一周里，微软为
Windows
加装模型上下文协议（
MCP

爆！三大热门大型模型服务方案实测：VLLM、LLaMA.cpp、SGLang 谁才是你的最强生产力引擎？

2025年5月19日14时作者 AI技术研习社

文章介绍了三种当前流行的大型语言模型（LLM）和服务方案：VLLM、LLaMA.cpp HTTP Server 和 SGLang。VLLM 以其高性能和快速响应著称；LLaMA.cpp 是一个轻量级的本地部署选项，适合没有高端 GPU 的用户；SGLang 则是一个智能框架，支持多步骤推理和函数调用，适合需要自定义 DSL 的场景。文章详细比较了每种方案的特点、优点及适用场景，并提醒了各自可能遇到的问题。