量子位
打破思维链推理瓶颈!“软推理”让大模型学会人类抽象能力,token使用量还更少了
研究提出Soft Thinking方法,让模型在连续的概念空间中进行“软推理”,打破基于离散token的推理瓶颈。相比标准CoT,最高提升Pass@1平均准确率2.48%,减少token使用量22.4%。
AI项链?OpenAI首款硬件爆料,乔布斯爱将操刀,“像iPod Shuffle一样优雅”
OpenAI与强纳肾合作开发的AI可穿戴设备,外形类似iPod Shuffle,具备摄像头和麦克风功能,有望于2027年投入量产。但网友对此褒贬不一,有人认为挂脖设计可以更接近眼睛获取视角,也有人担心其沉重的设计可能被视为‘电子镣铐’。
微软AI公开折磨微软员工,修Bug唯一贡献是改了PR标题,GitHub评论区成吃瓜现场
微软员工尝试使用Copilot修复代码中的Bug时遭遇失败,引起了程序员们的围观和嘲笑。AI智能体的建议经常导致错误,并且不能有效解决问题。
字节把GPT-4o级图像生成能力开源了!
字节跳动最新发布BAGEL模型,融合图像理解、生成、编辑等多种功能,参数规模只有7B,但表现超越或媲美众多顶级开源和闭源模型。通过MoT架构实现统一多模态能力,并在Hugging Face上架开源。
大模型首次打破围棋思维「黑盒」,打通科学发现新路径!上海AI Lab发布新一代InternThinker
作为衡量AI专业能力最具代表性的任务之一。
目前,AI虽然在棋力、效率、通用性等方面均取得显著成绩,
超长推理还能节省计算!Salesforce开源神器两连发:教大模型边想边省,显著提升数学编程准确率
Salesforce团队开源的Elastic Reasoning和Fractured Sampling两种方案提升了推理效率,前者通过将思考部分和解题部分分开管理预算,后者则采用三维碎片化采样策略。这两种方法在数学和编程任务上提高了准确率,在推理预算紧张时依然表现优秀。
预测误差仅0.26mm,中科院自动化所×灵宝CASBOT团队让机器人提前“知道你要干嘛”
灵宝CASBOT团队提出的DTRT方法在ICRA 2025录用,通过结合人类引导的运动和力数据来估计人类意图并分配角色,在物理人机协作中的预测精度显著优于现有技术。
四位图灵奖掌舵,2025智源大会揭示AI进化新路径
第七届北京智源大会将于2025年6月6日至7日在中关村国家自主创新示范区展示中心举行,汇聚全球顶尖研究者分享最新成果。大会将围绕人工智能四大主题展开,包括基础理论、应用探索、产业创新和可持续发展等,设有近20场专题论坛。