高性能
DeepSeek开源周最后一天:让数据处理「从自行车升级到高铁」
DeepSeek 开源了高性能并行文件系统3FS,实现了高吞吐量和强一致性,支持AI训练和推理工作负载。它利用现代SSD和RDMA网络提供共享存储层,具有分离式架构、强一致性和无状态元数据服务等优势。
DeepSeek,又杀疯了!
DeepSeek爆火,高性能低成本让企业接入AI成为必然趋势。大模型工程师等岗位年薪百万,但普通程序员正被AI替换。知乎知学堂推出大模型应用开发工程师速成计划,帮助学员掌握前沿技术、提升竞争力。
4 种方法在本地部署蒸馏版的DeepSeek-R1
本文介绍了四种让DeepSeek-R1等本地运行大型语言模型(LLM)的方法:Ollama、LM Studio、vLLM和LlamaCPP。Ollama简单易用;LM Studio提供图形化界面方便切换模型;vLLM追求高性能且兼容OpenAI API;LlamaCPP跨平台且高效,适合用户自定义设置。无论哪种方式,都能让用户拥有强大的本地LLM助手。
化解机器人的「幻觉」:北大发布OmniManip,VLM结合双闭环系统,3D理解能力大幅提升
北大师生团队提出OmniManip架构,通过双闭环系统实现VLM到机器人的泛化操作。关键设计包括基于物体的交互基元、循环规划和执行,显著提升性能,适用于多种真实任务。