一键部署丨DeepSeek-R1 新版本小幅升级便登顶开源王座,多项评测超越 Qwen3
近日,DeepSeek-R1-0528版本发布,通过提升配置优化算法显著提升了推理能力,并在多个基准测试中超越了Qwen3-235B和DeepSeek-R1。HyperAI超神经已上线一键部署教程,欢迎体验。
近日,DeepSeek-R1-0528版本发布,通过提升配置优化算法显著提升了推理能力,并在多个基准测试中超越了Qwen3-235B和DeepSeek-R1。HyperAI超神经已上线一键部署教程,欢迎体验。
清华大学和上海人工智能实验室提出测试时强化学习(TTRL),通过在无标签数据上利用多数投票等方法估计奖励信号来提升大规模语言模型性能。
南加州大学团队利用LoRA+强化学习在AIME 24数学基准测试上实现超过20%的性能提升,成本仅为9美元。研究发现LoRA模型中减少计算反而能带来更好的性能。
就在今天凌晨,OpenAI发布了满血版o3和o4-mini模型,实现了图像思考能力。两款新模型在数学竞赛及编程任务中表现优异,视觉推理功能增强,支持Python分析、网络搜索等工具协同工作,有望改写专业岗位角色。
智谱宣布其核心技术链路完全开源,包括基座模型、推理模型和沉思模型等。新发布的GLM-4-32B-0414与GLM-Z1-32B-0414均以32亿参数量媲美更大规模的主流模型,并在工具调用、联网搜索、代码智能体任务等方面表现优异。同时,小尺寸的9B系列模型也开源了。智谱持续推动AI生态建设,为企业提供模型即服务(MaaS)解决方案。