DeepSeek
让DeepSeek模型变更强!SGLang团队将吞吐量提高5倍,API成本降到官方五分之一
SGLang团队在开源技术博客中介绍了如何优化DeepSeek模型,在96个H100 GPU上实现了显著性能提升。通过引入PD分解、TBO以及专家重新平衡等策略,提高了预填充和解码阶段的吞吐量,并减少了不平衡现象对性能的影响。
不是 R2,不是 V4,DeepSeek 却悄悄放了个 6710 亿参数的狠活
DeepSeek 发布了一个专注于数学证明和复杂推理的新模型 DeepSeek-Prover-V2-671B,它是目前全球最大规模的数学定理证明模型。该模型在多个数学评测数据集上表现出色,可应用于数学论文验证、教材开发及数学研究助理等场景。
DeepSeek开源最新大模型,数学能力大突破!
DeepSeek开源了V2数学大模型,参数量分别为671B和7B,在MiniF2F测试中的通过率为88.9%,在ProverBench中包含325个问题的评估集。
来自flomo、沉浸式翻译、Cubox、Podwise、Fellou、Manus的劳动节礼物
两天前,Founder Park 发布了「AI 产品市集」计划的第一期内容,向大家推荐了10款创新、有趣、好用的 AI 产品。发布后不到24小时,飞书群就突破了1000人,并持续增长。该计划涵盖早期产品和多样化的产品形态,包括移动端、Web端、插件、硬件等,旨在帮助优秀 AI 产品获得关注。
文科生也能搞定编程和AI!DeepSeek助力零基础起飞全攻略
随着DeepSeek等AI工具的出现,编程和AI开发变得对所有人友好。文科生擅长理解需求、打磨细节和沟通协作,而这些正是AI开发中最稀缺的能力。通过自然语言交互、小步快跑式学习以及从小项目起步等方式,文科生可以快速进入编程与AI的世界,并利用AI助手创造自己的产品和服务。
不到2年,AI PPT赛道第一!像素绽放CEO赵充:今年是AI应用创业最佳时期 中国AIGC产业峰会
IGC产业峰会上,不到2年时间在AI PPT赛道做到NO.1的赵充如是说。
原因有三:
1)Deep