DeepSeek-V3归档 - 第4页共5页

OpenAI首席研究官：DeepSeek独立发现了o1的一些核心思路，奥特曼、LeCun纷纷置评

下午12时 2025/01/29 作者机器之心

低成本的DeepSeek模型引发了市场对AI硬件需求的担忧。OpenAI和Meta等公司正准备迎接推理需求的增长，同时专家指出训练成本降低可能不如推理成本降低更重要。

DeepSeek重创美国芯片产业，英伟达一夜蒸发6000亿！巨头破防，美股历史性崩盘

下午12时 2025/01/28 作者新智元

美股科技股今日全线崩盘，英伟达股价暴跌近17%，市值一夜间跌破6000亿美元。Karpathy指出，开发前沿AI模型并不需要大规模GPU集群。英伟达市值缩水超过苹果和可口可乐总值。

“洋悟运动”+“深海巨鲸”：当世界开始仰望中国制造！

下午2时 2025/01/25 作者 AI信息Gap

木易创建了‘AI信息Gap’公众号，专注于分享AI知识。2025年1月，小红书因用户激增和TikTok禁令引发流量爆发，并被网友戏称为‘洋悟运动’。DeepSeek发布新模型后引起广泛关注并决定开源。文章认为这体现了中国科技的崛起与开放精神。

中科院北大等揭示「蒸馏真相」：除Claude豆包Gemini，其他很多模型都「蒸」过头

下午11时 2025/01/21 作者新智元

新智元报道
编辑：编辑部 HYZ
【新智元导读】
模型蒸馏也有「度」，过度蒸馏，只会导致模型性能下降

2024国内AI盘点：谁领风骚？

下午2时 2024/12/30 作者 AI信息Gap

木易总结2024年国内AI领域发展：360AI搜索获web端最佳流量奖、百度文库和Kimi分列app端前两名；阿里通义、DeepSeek、零一万物获奖模型；Kimi在UI设计上表现优秀；腾讯作为大厂默默无闻，百度和360因用户体验问题受挫。

OpenAI科学家盛赞中国大模型：算法非常强，算力用到极致！

上午8时 2024/12/30 作者 AIGC开放社区

OpenAI联合创始人Andrej Karpathy分享了中国开源大模型DeepSeek-v3，仅使用280万小时GPU算力即超越Llama-3。该模型在多种基准测试中表现优异，并采用MLA和MoE等高效策略节省大量计算资源。

AI Weekly『12月23-29日』：DeepSeek-V3开源发布，xAI完成60亿美元C轮融资！

下午2时 2024/12/29 作者 AI信息Gap

本周最受关注的进展包括DeepSeek发布6710亿参数模型DeepSeek-V3、智谱开源GLM-PC基座模型CogAgent-9B、阶跃星辰推出增强型AI图像模型Step-1X-Medium、阿里通义千问开源视觉推理模型QVQ-72B-Preview、马斯克xAI完成60亿美元C轮融资以及Cursor融资1亿美元。这些进展涵盖了AI领域的算法优化、模型性能提升及投资动态，体现了技术进步和行业发展的前沿方向。

国产 AI 一夜刷屏海外！2000 块 GPU 打造 GPT-4o 平替， AI 大佬纷纷点赞

下午6时 2024/12/27 作者 APPSO

一
夜之间，中国大模型在国际上狠狠秀了一波肌肉。
近日，国产大模型厂商 DeepSeek 宣布
De

DeepSeek-V3外网刷屏爆火，训练成本只有600万，把AI大佬都炸出来了

下午6时 2024/12/27 作者 Founder Park

DeepSeek V3 发布并同步开源，直接在外网刷屏了。
延续便宜大碗特点的基础之上，DeepSe

2025 年 6 月
一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30