阿里QwQ-Max 以及 Qwen2.5-Max即将开源
阿里发布Qwen Chat中的新模型’思考(QwQ)’,基于Qwen2.5-Max的推理模型,支持思考、联网和Agent工具。预览版本在数学理解、编程和代理方面表现优异,计划于近期开放源代码并发布正式版APP。
阿里发布Qwen Chat中的新模型’思考(QwQ)’,基于Qwen2.5-Max的推理模型,支持思考、联网和Agent工具。预览版本在数学理解、编程和代理方面表现优异,计划于近期开放源代码并发布正式版APP。
今天是DeepSeek开源周的第二天,Alibaba的QwQ-Max预览版引起了关注。DeepEP项目在GPU上实现了显著性能提升,并且已获1000+ GitHub星。DeepSeek强调硬件效率和低延迟通信,其新开源技术让数据传输和计算实现重叠。
阿里巴巴宣布未来三年投入超3800亿元用于云和AI基础设施建设,目标是实现AGI,并在AI基础设施、基础模型平台及AI原生应用等方面加大投入。
在AI领域蓬勃发展的当下,各企业争相争夺人才。阿里近期大幅招聘数百人至AI与云计算业务,包括多模态基础模型及Agents相关研究岗位;小米挖角DeepSeek天才少女罗福莉;字节跳动吴永辉加入。阿里已与苹果达成合作,未来可能采用多供模式引入更多大模型服务商。
阿里的股价在一个月内从78.1港元涨到124.1港元,涨幅超过50%,带动恒生科技指数上涨30%以上。阿里作为AI浪潮中的领军者,在多个方面表现出色,包括投资布局、自有模型和云服务市场份额等方面。这一波行情背后的原因有外资重新定价中国AI资产、政策环境的积极变化以及DeepSeek的成功出圈等。
华为、阿里等纷纷接入DeepSeek,带动了云服务和应用的激烈竞争。文章总结了44家已经接入DeepSeek并向大众提供服务的平台,并分析了云服务平台的价格战和大厂的加班内卷现象。
阿里巴巴发布新视觉多模态模型Qwen2.5-VL,支持AI Agent功能并能自动化操作电脑、手机。Qwen2.5-VL具备强大的图像识别能力及超长视频理解能力,已在Hugging Face和GitHub开源,并提供在线体验。
阿里发布通义万相2.1及通义灵码AI程序员;昆仑万维上线天工大模型4.0 o1和4o版;Anthropic计划融资20亿美元;微软开源小模型Phi-4,谷歌Gemini团队并入DeepMind。