国产模型炸裂登场,国外赞不绝口!OpenAI-o1级性能,免费使用
专注AIGC领域的专业社区报道了国产大模型DeepSeek发布的全新推理模型DeepSeek-R1-Lite预览版。其最大特色是深度思维链推理,在数学和代码任务中表现出色,并在美国竞赛数据中击败OpenAI的o1预览版。
news
专注AIGC领域的专业社区报道了国产大模型DeepSeek发布的全新推理模型DeepSeek-R1-Lite预览版。其最大特色是深度思维链推理,在数学和代码任务中表现出色,并在美国竞赛数据中击败OpenAI的o1预览版。
阶跃星辰自研万亿参数语言大模型Step-2位列全球第五,成绩逼近OpenAI。其表现突出的IF Average指标超越了包括GPT-4在内的所有国内外模型。
上周有学习者希望学习多模态大模型的部署与微调,Datawhale妙妙屋提供教程开源地址。同时,Qwen2.5-Coder因朋友圈刷屏引发热议,并开源了相关教程。
微软在Ignite大会上展示了其强大的企业级AI Agent生态系统,包括5款预构建Agent和超过1800个模型的选择,以及新的Copilot Studio平台支持用户创建自主Agent。Magnetic-One系统展示了复杂的Agent等级结构,未来或实现数百万AI Agent的无缝协作。
国产大模型阶跃星辰Step-2在指令跟随类别中以86.57的高评分排名第一。团队创新研发了从头开始训练的万亿参数MoE架构,提升了综合能力近50%,覆盖语言、多模态等全面能力。
国产万亿参数模型Step-2在国际权威榜单LiveBench中杀入全球前五,并超越多项国际主流模型。它在语言生成、知识理解和指令遵循等方面表现出色,引起了外国网友的热议。
华中科技大学提出MoE Jetpack框架,利用密集激活模型权重微调出混合专家(MoE)模型,大幅提升了精度和收敛速度,解决MoE预训练需求高问题。