-
在 180 节点集群中实现了 6.6 TiB/s 的聚合读取吞吐量; -
在 25 节点集群的 GraySort 基准测试中达到 3.66 TiB/min 的吞吐量; -
每个客户端节点在 KVCache 查找时可达到 40+ GiB/s 的峰值吞吐量; -
采用分离式架构,具有强一致性语义。
data:image/s3,"s3://crabby-images/79f59/79f5972c9de01e019bed51fa35498149ab23cd94" alt=""
data:image/s3,"s3://crabby-images/08e51/08e516e4b31c5b9dab0cec94fdbf2b6f10beba4f" alt=""
-
开源链接:https://github.com/deepseek-ai/3FS -
Smallpool(3FS 上的数据处理框架):https://github.com/deepseek-ai/smallpond
data:image/s3,"s3://crabby-images/a2452/a2452a56786d322dd5e525fc9929d13e1bbe94db" alt=""
data:image/s3,"s3://crabby-images/ba2ad/ba2ad82ac9f2f4a7f439f37d596366da2cc1bb5e" alt=""
-
分离式架构。结合了数千个 SSD 的吞吐量和数百个存储节点的网络带宽,使应用程序能够以不受位置限制的方式访问存储资源。
-
强一致性。实现了带有分配查询的链式复制(CRAQ)以保证强一致性,使应用程序代码简单且易于理解。
-
文件接口。开发了由事务性键值存储(如 FoundationDB)支持的无状态元数据服务。文件接口广为人知且随处可用。无需学习新的存储 API。
-
数据准备。将数据分析管道的输出组织成层次化的目录结构,并高效管理大量中间输出。
-
数据加载器。通过支持跨计算节点对训练样本的随机访问,消除了预取或打乱数据集的需求。
-
检查点保存。支持大规模训练的高吞吐量并行检查点保存。
-
用于推理的 KVCache。为基于 DRAM 的缓存提供了一种成本效益高的替代方案,提供高吞吐量和显著更大的容量。
data:image/s3,"s3://crabby-images/df343/df343c58a7135705124a1486e9a9cbef24cab664" alt=""
data:image/s3,"s3://crabby-images/73f33/73f338cffae18b6ed26952a9be6b91b4733b58c8" alt=""
data:image/s3,"s3://crabby-images/07e39/07e394a73f81c88b1671a250c4e25efb670358fe" alt=""
data:image/s3,"s3://crabby-images/38de2/38de2ec80bb09bb22bfb7da307f81a8902f3be30" alt=""
data:image/s3,"s3://crabby-images/236ad/236ad8a4f68019cb4afc5025eaad13b78584ba4d" alt=""
data:image/s3,"s3://crabby-images/afec6/afec6fe8529aa7998475c4222462af3c68b2940f" alt=""
data:image/s3,"s3://crabby-images/0a910/0a910e21b58f97df3d72af79779bed97c1334ddc" alt=""
data:image/s3,"s3://crabby-images/7601c/7601cc12908649e415497e17e246880dfe065e8f" alt=""
(文:机器之心)