跳至内容
每时AI
菜单
菜单
资讯
国际
分享
大模型
学术
开源
机器人
关于我们
TensorCore
谈谈DeepSeek-v3在算力约束下的出色工作
下午11时 2024/12/30
作者
极市干货
寒冷的周末, 加完班挤点时间读个论文吧. Deepseek-v3仅用了2048块H800 GPU就超