32B 稠密模型推理能力超越 R1?中国秘密 AI 团队发布推理小模型 AM-Thinking-v1
业研究人员。
社区的愿景
是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进
业研究人员。
社区的愿景
是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进
智谱把最新的GLM全系列模型开源了,包括9B和32B两种尺寸的模型。GLM-Z1-32B-0414推理模型性能超过671B庞然大物,支持SVG生成、artifacts预览等功能,并且提供多种定价策略的API服务。
智谱发布首个免费、具备深度研究和操作能力的AI Agent产品AutoGLM沉思及开源GLM-Z1-Air。前者性能比肩DeepSeek-R1,后者参数规模达32B(320亿)。张鹏称2025年是AI Agent爆发之年,智谱将研发Agentic GLM技术以推动智能体技术快速发展。
阿里通义千问团队发布新模型Qwen2.5-VL-32B,相比前代模型提升回复符合人类偏好、数学推理能力及图像细粒度理解与推理。
Light-R1是首个从零复现DeepSeek-R1的工作,开源了模型、数据和代码;包括32B版本和基于Distill-Qwen-32B的改进版;在14B上首次实现强化学习效果。
阿里云开源全新推理模型通义千问 QwQ-32B,在多项基准测试中表现出色。该模型参数量达到32B,性能强劲且成本低廉。通过两阶段强化学习和答案验证机制提升模型能力。HyperAI超神经提供教程与部署指南,用户可免费试用4小时RTX 4090或5小时CPU资源。
阿里巴巴团队开源了最新研发的大模型QwQ-32B,该模型在数学推理、代码生成和逻辑分析等领域表现出色,性能媲美DeepSeek-R1。其轻量化部署特性使其成为中小团队的理想选择。
全球首个32B开源模型发布,引发技术服务商思考。阿里发布的Qwen模型参数仅为DeepSeek R1的一半却达到同等效果,引起技术服务行业关注与挑战。文章探讨了不同利益相关者可能的应对策略及AI人才需求变化。
阿里云发布QwQ-32B推理模型,参数量为32B,性能媲美DeepSeek-R1,在数学和编程能力上与之相当,并可在消费级显卡上部署。该模型开源用于商业和研究用途,已吸引大量关注。