DeepSeek-V3 + SGLang: 推理优化 (v0.4.3.post2+sgl-kernel:0.0.3.post6)
DeepSeek V3 SGLang 优化
继续我们的DeepSeek V3与SGLang集成的技术
DeepSeek V3 SGLang 优化
继续我们的DeepSeek V3与SGLang集成的技术
谷歌最新发布的推理模型Gemini 2.5 Pro在多项基准测试中表现出色,尤其在数学、推理、多模态和长上下文方面。其性能领先于其他同类模型,并且具有自我验证的能力。实测结果显示,Gemini 2.5 Pro在一系列复杂的逻辑运算题目上均能正确解答,无一错误。
Gemma 3 是一个开源的多模态、多语言 LLM,拥有128k token 的上下文窗口,并提供4种不同大小的模型,支持140多种语言,在LMArena中排名第一。
用一文记录AI大模型领域风云变幻的一月,LiveBench和LMSYS排行榜对比显示,Claude 3.7 Sonnet-Thinking荣登榜首,GPT-4.5紧随其后。LMSYS StyleCtrl排名中,GPT-4.5和Grok 3表现优异。
在2024年12月,OpenAI发布了满血版o1,谷歌发布多个重要模型,DeepSeek发布升级版本。LMSYS和LiveBench排行显示,OpenAI o1、谷歌Gemini-Exp-1206、谷歌 Gemini-2.0-Flash-Thinking、DeepSeek V3分别位列排行榜前几名。
Google推出的新模型「质心」能在30秒内解决复杂的物理问题,且不需要展示推理过程。这一发现引发业界热议,认为AI正在变得更加高效和隐形。