棋盘变战场,大模型却呆了?普林斯顿、UT Austin新基准SPIN-Bench曝AI智商瓶颈 上午11时 2025/03/25 作者 机器之心 大学奥斯丁分校 最新评测基准 SPIN-Bench,用一套 “组合拳” 暴击了大模型的软肋。 研究显
还没拿到Manus邀请码?不要急,让子弹飞一会… 下午7时 2025/03/07 作者 AI信息Gap Manus 火爆全网,但作者认为它更多是渐进式改进而非颠覆性创新。本文提醒读者不要急躁,让子弹飞一会儿。
让RAG更聪明,通义实验室ViDoRAG开启视觉文档检索增强生成新范式,重塑大规模文档集合迭代推理! 下午7时 2025/03/04 作者 PaperAgent 里的精妙布局,再到医疗档案中的多维数据展示,这些富含视觉元素的文档,不仅仅是简单的文字堆砌,而是融合
南大周志华带队斩获AAAI 2025杰出论文奖!吴恩达亲临现场,3篇上榜 下午11时 2025/03/03 作者 新智元 南京大学周志华团队的论文《基于溯因学习的神经-符号推理错误纠正》在AAAI 2025会议上荣获杰出论文奖。
大模型多智能体辩论不敌单智能体CoT?上海AI Lab等重新审视多智能体辩论的有效性 下午11时 2025/03/02 作者 PaperWeekly (Multi-Agent Debate, MAD)方法持续引发学界关注,并频繁亮相于顶级学术会议。该
Deepseek的RL算法GRPO解读 下午2时 2025/02/14 作者 机器学习算法与自然语言处理 业研究人员。 社区的愿景 是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进
别再瞎忙了!上海交大和 GAIR 推出的 PC – Agent让办公效率一路狂飙 下午2时 2025/02/02 作者 小兵的AI视界 在人工智能技术蓬勃发展的当下,人们对于电脑操作的智能化、自动化需求日益增长。 传统的电脑操作方式在面
无需训练,性能提升100%!谷歌提出CoA「智能体链」,多LLM协作搞定长文本 下午4时 2025/01/31 作者 新智元 新智元报道 编辑:KingHZ 【新智元导读】 谷歌提出了多智能体协作的新方法「智能体链」(Chai
27页综述,354篇参考文献!最详尽的视觉定位综述来了 下午4时 2025/01/31 作者 机器之心 AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000