跳至内容
每时AI
菜单
菜单
资讯
国际
分享
大模型
学术
开源
机器人
关于我们
offload策略
谈谈DeepSeek原厂推理方案
下午2时 2025/03/04
作者
GiantPandaCV
基本上单卡在并行策略恰当时能够做到1800~3000个tokens.
昨天DeepSeek公布了
《