惊爆!研究发现DeepSeek训练数据中藏有12000个活跃API密钥!
Truffle Security发现DeepSeek训练数据中包含约12000个活跃API密钥和密码,分布在400TB的网络数据中。研究揭示大语言模型可能在无意中学习并复制不安全的编码实践。
Truffle Security发现DeepSeek训练数据中包含约12000个活跃API密钥和密码,分布在400TB的网络数据中。研究揭示大语言模型可能在无意中学习并复制不安全的编码实践。
DeepSeek开源周结束,公布了V3和R1训练推理过程中使用的Fire-Flyer文件系统(简称3FS)和Smallpond数据处理框架。3FS利用现代SSD和RDMA网络性能,实现了惊人的读取吞吐量。
上海交通大学张林峰团队提出Toca方法,通过token粒度的缓存策略实现无需训练的图像和视频生成加速,相比现有方法具有更强适配性和优异性能。
北大团队发现一段提示词可以让大模型陷入无限思考,并且这种现象可以传递和复制。研究显示乱码问题更容易引发模型的“stuck”机制,说明模型有一定程度的防御措施,但面对具有含义的正常文本时仍需加强。