NVIDIA将全量版DeepSeek-R1打包成NIM微服务 上午8时 2025/02/03 作者 NLP工程化 NVIDIA将DeepSeek-R1打包成NIM微服务,在配备8张H200 GPU的服务器上实现每秒近4000个Token处理速度,支持在本地部署以保障数据安全。