阿里QwQ-Max-Preview:AI推理模型的“新标杆”
阿里巴巴Qwen团队发布了深度推理模型QwQ-Max-Preview,其在数学、编程及通用任务中表现出色,并支持联网搜索和思维链展示。该模型将开源,并推出Android和iOS应用程序,促进AI技术在全球范围内的传播和应用。
阿里巴巴Qwen团队发布了深度推理模型QwQ-Max-Preview,其在数学、编程及通用任务中表现出色,并支持联网搜索和思维链展示。该模型将开源,并推出Android和iOS应用程序,促进AI技术在全球范围内的传播和应用。
Qwen系列的新进展QwQ-Max-Preview专注于深层推理和多领域问题解决,未来将开源。FlashMLA是一款针对Hopper GPU优化的高效MLA解码内核,支持可变长度序列处理。Claude Code是一个终端编码工具,帮助开发者执行代码任务。EasyR1是高效、可扩展的多模态强化学习训练框架,支持视觉语言模型。GibberLink演示了会话AI在意识到彼此都是AI代理时从人类语言切换到音频协议的过程。
PySpur 是一个轻量级的可视化 AI 智能体工作流构建器,提供拖拽式构建、循环迭代等10余种功能,适用于设计师、建筑师等非技术人员快速创建智能应用。
DeepSeek开源首个项目FlashMLA,针对英伟达Hopper GPU优化MLA解码内核,提升LLM模型在H800上的性能。
阶跃星辰在2025年生态开放日上回应DeepSeek,宣布开源两款多模态模型,并提出AGI的下一个阶段应为多模态推理及AI Agent。
蔡崇信在迪拜世界政府峰会上讨论了AI竞赛的观点,并强调AI应优先应用于解决现实问题。他提到了DeepSeek的成本节约创新以及开源AI对民主化的重要性。他还提到了阿里巴巴与中国Apple的合作,指出智能手机需要高效的小型AI模型。
吉利汽车集团与阶跃星辰联合宣布,将Step系列多模态大模型向全球开发者开源。包括参数量最大的视频生成模型和首款语音交互大模型。阶跃Step-Video-T2V可直接生成高质量视频,而阶跃Step-Audio是业内首个产品级的开源语音交互模型。