DeepSeek V3 引发AI路径之辩:从“鹦鹉学舌”到“乌鸦喝水”?

DeepSeek V3 是一款6710亿参数的开源模型,在训练成本上仅需278.8万GPU小时。其技术创新包括多头潜在注意力(MLA)和混合专家架构(MoE),展示了在推理效率和成本控制上的潜力,引发了业界对于更经济实惠AI路径的关注与讨论。

深夜发布!英伟达 Jetson Orin Nano“掌中超算”到底有多强?

英伟达发布Jeston Orin Nano超算,体积小至信用卡大小,内置CUDA核心和ARM CPU,提供高达每秒70万亿次的计算能力。耗电仅25瓦,价格从上代的Jetson Orin NX下降到249美元。老黄定义其为机器人处理器,支持本地信息采集训练、视觉AI处理及生成式AI应用。未来可应用于智能城市和智能家居领域。但因反垄断调查影响,普通用户暂时无法使用。

Sora发布即翻车,谷歌Veo2偷塔AI视频新王?

谷歌新发布的Veo2视频生成模型在分辨率和时长上都有所提升,并能理解物理规律与电影语言。它通过4D卷积神经网络和GAN架构提高了逼真度,但可能面临Sora一样的问题,如复杂的场景处理、用户期望与实际性能之间的差距等挑战。