马斯克:xAI 将发布超越 DeepSeek 的模型!
马斯克在视频中表示xAI即将发布比DeepSeek更强大的模型,并强调中国工程师潜力巨大。不过他也指出xAI拥有全球最大的GPU集群、独特的人工强化学习模式以及X平台的海量训练数据等优势,力挺自己团队的技术储备。
马斯克在视频中表示xAI即将发布比DeepSeek更强大的模型,并强调中国工程师潜力巨大。不过他也指出xAI拥有全球最大的GPU集群、独特的人工强化学习模式以及X平台的海量训练数据等优势,力挺自己团队的技术储备。
一封来自2016年的邮件揭示了OpenAI由开源转向闭源的背后推手,包括Ilya Sutskever和Elon Musk。该邮件表达了对构建安全人工智能难度增加的担忧,并认为完全开放可能带来灾难性后果。
Google DeepMind最新推出的AlphaGeometry2(AG2)在国际数学奥林匹克竞赛中表现出色,解题覆盖率从66%提高至88%,超越了往年IMO金牌得主平均水平。AG2具备四大超能力:语言系统升级、特种部队式搜索算法、推理引擎速度提升及3亿定理训练。未来或将颠覆传统奥数考场。
Anthropic CEO Dario Amodei 称 DeepSeek 模型安全性最差,并指责其生成危险信息。网友对此展开嘲讽,认为这可能更有利于 DeepSeek 并且批评 Amodei 在技术创新上的态度。
GitHub CEO宣布Copilot升级为具备自主行动力的AI工程师,不仅能理解核心需求并自动拆解子任务、修正错误及执行终端命令,还能独立完成代码开发过程。同时上线的新功能允许开发者召唤多种模型协同工作,并集成到GitHub生态中,使其成为数百万用户的成本效益选择。
斯坦福与华盛顿大学研究人员仅用50美元训练出一个性能堪比OpenAI模型的新模型s1,并开源了全部代码和数据。研究揭示,高效训练不依赖大量数据、复杂强化学习或高昂成本。
中国AI公司DeepSeek的R1模型发布引发全球关注。Tanishq博士揭示五大误解,指出DeepSeek早在2023年已推出编程模型,并详细介绍训练成本及技术创新,反驳算力扩展、抄袭等质疑,强调技术突破不分国界。
Google发布了Gemini 2.0全家桶,包含Flash、Pro实验版和Flash-Lite三个模型。Flash擅长处理大规模任务;Pro实验版能写代码;Flash-Lite价格适中且性能良好。这些模型已在多个平台上开放使用,并提高了安全性。
Grok-3因不符合要求而推迟发布,马斯克在AI竞赛中通过超强算力改写游戏规则。超级计算中心拥有20万块GPU,为了支持它建造了自己的天然气发电厂、部署了特斯拉电池以及安装了制冷系统。关于Grok-3的推理能力改进,工程师们正在添加新的功能以使其更强。不过也有质疑的声音认为拥有最多GPU并不意味着能做出最好的模型。