推理能力归档

字节推豆包1.5深度思考模型，PK阿里QWQ-32、Deepseek R1结果如何？

下午2时 2025/04/18 作者 AI先锋官

近日，字节跳动发布豆包1.5深度思考模型，该模型在推理能力、速度和多模态方面实现了突破性升级。其参数量为200B，激活参数仅为20B，具有低延迟（<20ms）的优势。通过多项权威基准测试，该模型在数学推理和编程竞赛方面表现出色，并展示了其对图片的视觉推理能力。

下午4时 2025/04/14 作者机器之心

化学习）、异常检测。在TAI、TASE、ICCV等期刊和顶会发表论文。
近年来，随着大型语言模型（L

MLNLP学术Talk邀请西湖大学鲍光胜博士分享AI与人类的差异，包括AI推理过程的表面模仿和生成文本的分布差异。报告聚焦大语言模型内在因果图结构、白盒方法检测LLM生成文本等方面。

下午4时 2025/04/01 作者财联社AI daily

北京时间4月1日，OpenAI宣布将在未来几个月内发布一个‘强大且具备推理能力的新开放权重模型’，这是GPT-2发布以来的首次新模型计划。尽管OpenAI曾以’开放’命名，但其模型近年来大多采用了封闭策略。此次开放模型旨在为开发者、企业和政府提供更好的部署和使用体验，但仍会保留部分关键组件。

下午11时 2025/03/29 作者 APPSO

多个新发布的模型如Qwen、Gemini在推理能力上有所增强，能够处理多模态理解。文章通过打游戏的方式测试了Qwen和Gemini的性能，并讨论了它们在不同场景下的表现及其对未来应用的意义。

下午4时 2025/03/27 作者机器之心

I，抢在 OpenAI 开直播之前，谷歌上线了最强大的推理模型 Gemini 2.5 Pro。
谷歌

上午11时 2025/03/26 作者硅星人Pro

DeepSeek发布V3-0324版本升级，强调推理能力、前端开发能力、中文写作能力和搜索能力提升。此次更新注重实用性和用户需求，特别是代码生成和前端视觉设计能力显著增强，模型免费使用且参数较小。