智谱CEO张鹏:开源不等于真的免费,我们还在做预训练|
智谱发布首个免费、具备深度研究和操作能力的AI Agent产品AutoGLM沉思及开源GLM-Z1-Air。前者性能比肩DeepSeek-R1,后者参数规模达32B(320亿)。张鹏称2025年是AI Agent爆发之年,智谱将研发Agentic GLM技术以推动智能体技术快速发展。
智谱发布首个免费、具备深度研究和操作能力的AI Agent产品AutoGLM沉思及开源GLM-Z1-Air。前者性能比肩DeepSeek-R1,后者参数规模达32B(320亿)。张鹏称2025年是AI Agent爆发之年,智谱将研发Agentic GLM技术以推动智能体技术快速发展。
阿里通义千问团队发布新模型Qwen2.5-VL-32B,相比前代模型提升回复符合人类偏好、数学推理能力及图像细粒度理解与推理。
Light-R1是首个从零复现DeepSeek-R1的工作,开源了模型、数据和代码;包括32B版本和基于Distill-Qwen-32B的改进版;在14B上首次实现强化学习效果。
阿里云开源全新推理模型通义千问 QwQ-32B,在多项基准测试中表现出色。该模型参数量达到32B,性能强劲且成本低廉。通过两阶段强化学习和答案验证机制提升模型能力。HyperAI超神经提供教程与部署指南,用户可免费试用4小时RTX 4090或5小时CPU资源。
阿里巴巴团队开源了最新研发的大模型QwQ-32B,该模型在数学推理、代码生成和逻辑分析等领域表现出色,性能媲美DeepSeek-R1。其轻量化部署特性使其成为中小团队的理想选择。
全球首个32B开源模型发布,引发技术服务商思考。阿里发布的Qwen模型参数仅为DeepSeek R1的一半却达到同等效果,引起技术服务行业关注与挑战。文章探讨了不同利益相关者可能的应对策略及AI人才需求变化。
阿里云发布QwQ-32B推理模型,参数量为32B,性能媲美DeepSeek-R1,在数学和编程能力上与之相当,并可在消费级显卡上部署。该模型开源用于商业和研究用途,已吸引大量关注。
通义千问团队发布推理模型QwQ,参数量32B,在GPQA等数据集上击败o1-mini,并开源。但其回答较长且冗余,后续需改进简洁度。