云端算力竞赛新突破:创纪录英伟达GB200参与MLPerf测试,性能提升超两倍

CoreWeave与英伟达和IBM联合发布的MLPerf Inference v5.0测试结果显示,在使用2496块GB200 Grace Blackwell芯片构成的集群中,Llama 3.1 405B基础模型训练仅用时27.3分钟完成。这一成果不仅提升了超过两倍的训练性能,还彰显了GB200 NVL72架构的强大性能。

告别刷榜内卷!清华×百度提出Feedbacker,开启LLM深度洞察新评估时代

本文提出评估范式的转变,从排名竞争转向诊断反馈。通过引入树状能力图谱、动态评估标准和可视化分析等创新组件,开发了Feedbacker框架,用于提升LLM的评估效率与准确性。

OpenAI迈向AI智能体重要一步:ChatGPT新功能Tasks可设未来任务提醒

OpenAI发布的新功能Tasks允许ChatGPT Plus、Team和Pro的订阅用户设置最多十个任务提醒。该功能使ChatGPT从被动对话的代理进化为能够主动管理和执行计划任务的助手,预示着OpenAI进军可自主行动的智能体(AI agent)时代的步伐。