斯坦福揭秘o1-preview软肋!数学竞赛题稍作修改,准确率骤降30%
斯坦福研究发现,即使在数学竞赛中表现出色的大模型o1-preview,在题目稍作修改后准确率也会大幅下降30%。这揭示了AI模型在应对变体题时的局限性。
斯坦福研究发现,即使在数学竞赛中表现出色的大模型o1-preview,在题目稍作修改后准确率也会大幅下降30%。这揭示了AI模型在应对变体题时的局限性。
五角大楼启动90天AI计划测试生成式AI在现实军事场景中的应用,重点集中在海军上。该计划旨在提高假想冲突中的作战效率,特别是在与中国的战略竞争中。
新智元报道
DeepSeek团队通过优化英伟达GPU的PTX指令集,绕过了CUDA实现了高效训练超大规模语言模型。这一突破引发了业界对CUDA护城河的质疑。
美股科技股今日全线崩盘,英伟达股价暴跌近17%,市值一夜间跌破6000亿美元。Karpathy指出,开发前沿AI模型并不需要大规模GPU集群。英伟达市值缩水超过苹果和可口可乐总值。