DeepSeek V3论文细节:如何绕开CUDA的垄断! 下午10时 2025/01/29 作者 Datawhale DeepSeek 使用英伟达 PTX 编程技术,在硬件受限条件下训练出高性能语言模型,展示了在减少对算力需求的同时提升性能的可能。