逻辑推理
OpenAI o3-pro 全网沸腾!最强AI + o3降到“白菜价”,但是有哪个“槽”你发现了吗?
文章介绍了OpenAI最新发布的模型o3-pro及其降价策略,强调了其在推理、科学数据分析、代码编写等方面的强大能力,并讨论了其对AI产业生态可能产生的影响。
苹果宣判推理模型死刑!Google CEO:忘了AGI吧,先用好AJI
苹果研究员通过一系列全新智力测试题,揭示了多种「推理」模型在高复杂度问题上的无效性。研究发现这些模型实际上是高级版的记忆大师,并且在训练时无法理解实际情况中的问题。Google CEO Sundar Pichai提出AJI(Artificial Jagged Intelligence)概念,描述当前AI处于「惊艳与弱智并存」的状态。Pichai预测到2030年将看到巨大进步,但强调重要的是利用现有能力带来积极影响。
新版DeepSeek-R1深夜整大活!编程能力暴涨,实测直逼Claude 4,网友玩疯直呼太强了
DeepSeek发布了新版本R1-0528,并在Hugging Face上开源。该模型在编程、逻辑推理和交互能力等方面显著提升。开发者称其性能接近OpenAI的o4 mini和o3模型高版本。
ACL2025 LLM的“记忆”与“推理”该分家了吗?一种全新的训练范式,彻底厘清思考流程
MLNLP社区致力于促进国内外机器学习与自然语言处理的交流合作。最新研究论文探讨了如何解耦语言模型的记忆和推理能力,以实现更可控的大模型。
OpenAI的「看图思考」被玩坏了!我把工位照片给 o3 ,隐藏属性都被扒出来……
文章介绍了Alibaba Cloud的最新模型O3在视觉推理方面的强大能力,包括其识别图片元素、理解并解决实际任务的能力。通过一系列测试题目展示了O3的表现,并对其局限性进行了讨论。