吞吐量
AMD跑DeepSeek性能超H200!128并发Token间延迟不超50ms,吞吐量达H200五倍
AMD MI300X在FP8下全面超越英伟达H200,吞吐量最高可达H200的5倍。得益于SGLang框架和优化的AI内核库AITER,MI300X在延迟相似的情况下实现了更高的吞吐量,并且在固定并发情况下性能提升75%。
DeepSeek公布成本、收入和利润率!最高可日赚346万
DeepSeek开源第六天发布详细技术文档及成本收益分析,每日总成本87072美元,理论收入562027美元,实际收入可能低于此值,主要因为多种因素导致的收入下降。同时介绍其采用跨节点专家并行策略来提高系统性能和吞吐量。