OpenAI首席研究官:DeepSeek独立发现了o1的一些核心思路,奥特曼、LeCun纷纷置评
低成本的DeepSeek模型引发了市场对AI硬件需求的担忧。OpenAI和Meta等公司正准备迎接推理需求的增长,同时专家指出训练成本降低可能不如推理成本降低更重要。
低成本的DeepSeek模型引发了市场对AI硬件需求的担忧。OpenAI和Meta等公司正准备迎接推理需求的增长,同时专家指出训练成本降低可能不如推理成本降低更重要。
美股科技股今日全线崩盘,英伟达股价暴跌近17%,市值一夜间跌破6000亿美元。Karpathy指出,开发前沿AI模型并不需要大规模GPU集群。英伟达市值缩水超过苹果和可口可乐总值。
木易创建了‘AI信息Gap’公众号,专注于分享AI知识。2025年1月,小红书因用户激增和TikTok禁令引发流量爆发,并被网友戏称为‘洋悟运动’。DeepSeek发布新模型后引起广泛关注并决定开源。文章认为这体现了中国科技的崛起与开放精神。
木易总结2024年国内AI领域发展:360AI搜索获web端最佳流量奖、百度文库和Kimi分列app端前两名;阿里通义、DeepSeek、零一万物获奖模型;Kimi在UI设计上表现优秀;腾讯作为大厂默默无闻,百度和360因用户体验问题受挫。
OpenAI联合创始人Andrej Karpathy分享了中国开源大模型DeepSeek-v3,仅使用280万小时GPU算力即超越Llama-3。该模型在多种基准测试中表现优异,并采用MLA和MoE等高效策略节省大量计算资源。
本周最受关注的进展包括DeepSeek发布6710亿参数模型DeepSeek-V3、智谱开源GLM-PC基座模型CogAgent-9B、阶跃星辰推出增强型AI图像模型Step-1X-Medium、阿里通义千问开源视觉推理模型QVQ-72B-Preview、马斯克xAI完成60亿美元C轮融资以及Cursor融资1亿美元。这些进展涵盖了AI领域的算法优化、模型性能提升及投资动态,体现了技术进步和行业发展的前沿方向。