vLLM 归档 - 第2页共3页

利用 vLLM 快速高效地为 ModernBERT 分类器模型进行推理

2025年5月5日23时作者 NLP工程化

利用vLLM快速高效地为ModernBERT分类器模型进行推理，支持大规模数据集批量处理、简单易用的接口、显著提升推理效率。

2025年4月30日16时作者 HyperAI超神经

HyperAI超神经上线教程，一键部署Qwen3-30B-A3B模型体验。8款混合推理模型开源，性能提升显著，GitHub获近20k stars。Qwen3-30B-A3B参数量少表现佳，迅速成为开源大模型王座。HyperAI提供免费算力福利和部署教程助力更多开发者便捷体验Qwen3的强大能力。

2025年4月28日14时作者 GiantPandaCV

介绍它们。
在本文开始前，
插一个题外话，简单解释下今年我很久不更新的原因
：我在xhs等平台上，大

2025年4月15日16时作者新智元

A100 40GB显卡上，30亿参数模型的流式推理速度甚至超过了音频播放速度。甚至可以zero-sh

2025年4月14日23时作者机器之心

DeepSeek 发布文档宣布将开源自己的内部推理引擎，并与开源社区建立更广泛的合作。文档提到将与现有的开源项目合作，包括 SGLang 和 vLLM 项目。网友猜测 OpenAI 可能会发布多种模型和智能体产品。

2025年4月13日19时作者 AIGC创想者

Python项目排行：8个精选项目简介，涵盖自动化工具、大型语言模型引擎、AI代理框架等；从Star总数和Star新增量分析项目受欢迎程度。

2025年3月20日16时作者 HyperAI超神经

HyperAI超神经上线了使用vLLM部署Gemma-3-27B-IT教程，该模型支持文本和图像输入，适用于问答、摘要和推理等多种任务。

2025年3月16日8时作者 NLP工程化

清华团队发布赤兔Chitu模型推理引擎，DeepSeek成本减半、性能提升3.15倍，支持多系列芯片，在A800集群上部署效率显著提高。

2025年2月9日23时作者新智元

sloth近期更新，将GRPO训练的内存使用减少了80%！只需7GB VRAM，本地就能体验AI「啊