o4-mini暴击六大数学天团,攻破陶哲轩难题!4.5h激战人类阵地失守
不到两年,o4-mini与40位数学家挑战300道菲尔兹奖级难题,一举击败6组团队,碾压人类平均水平。Epoch AI举办比赛考察AI数学能力进展,结果显示AI在FrontierMath上解决了约22%的题目,而人类总体上解决约35%的题目。未来1-2年内,『超级程序员』和『AI数学家』将取得重大突破。
不到两年,o4-mini与40位数学家挑战300道菲尔兹奖级难题,一举击败6组团队,碾压人类平均水平。Epoch AI举办比赛考察AI数学能力进展,结果显示AI在FrontierMath上解决了约22%的题目,而人类总体上解决约35%的题目。未来1-2年内,『超级程序员』和『AI数学家』将取得重大突破。
苹果首款带屏HomePod已进入最终研发阶段,预计2025年上市。这款集成7英寸LCD屏幕、可拆卸电池组的设备将搭载升级版Siri智能助手,并支持智能家居控制中枢功能及人脸识别与手势交互。
清华大学与墨尔本大学团队揭示了开源大模型微调过程中隐藏的安全风险,通过后门注入技术秘密窃取下游私有数据。该研究指出攻击者可从5000条微调数据中恢复接近4000条完整查询。
小米发布第一季度财报,营收1113亿元创历史新高;手机销量重回国内第一;自研芯片玄戒O1、T1及SUV新车YU7发布;IoT设备连接数增至9.437亿。
阿里巴巴团队提出QwenLong-L1框架解决长短上下文推理强化学习问题,显著提升长文档问答任务性能,超越OpenAI等旗舰模型。
2025长三角(芜湖)算力算法创新应用大赛火热进行中,奇瑞汽车发布4项真实工业场景AI挑战任务。赛事覆盖图像识别、多目标检测、语音识别等关键赛道,优胜项目有机会对接企业试用并推动工程转化。
AI 模型 Claude Opus 4 成功解决了程序员多年的 Bug,展示了其在复杂代码任务中的强大能力。虽然 AI 可能会替代某些工作,但与人类结合使用仍可发挥巨大作用。
本文介绍了一种名为AnomalyAny的创新框架,利用Stable Diffusion生成能力仅需单个正常样本和文本描述即可生成逼真且多样化的异常样本,解决了视觉异常检测中异常样本稀缺的问题。