超越DeepSeek V3!Ai2再祭开源杀器Tülu 3,强化学习打破性能瓶颈
艾伦人工智能研究所推出的新模型Tülu 3 405B在多项基准测试中超越Deepseek v3和GPT-4,采用全新后训练框架,并提供完全开源的数据、评估、训练代码及开发配方。
艾伦人工智能研究所推出的新模型Tülu 3 405B在多项基准测试中超越Deepseek v3和GPT-4,采用全新后训练框架,并提供完全开源的数据、评估、训练代码及开发配方。
人形机器人Figure与OpenAI终止合作,创始人表示将在未来发布前所未有的机器人技术。Figure 02已具备进入宝马工厂工作的能力,Adcock称Figure未来四年将交付10万台人形机器人。
纽约大学研究人员通过模拟攻击发现,仅少量虚假数据就能显著提高大型语言模型生成错误医疗信息的概率。该研究呼吁关注大模型在医疗领域的潜在风险及其应对策略。
国外网友发现o3-mini-high在思考过程中经常出现中文!有人猜测是否借鉴了DeepSeek。对此,网友纷纷质问奥特曼和OpenAI:究竟为何使用中文?专家认为这可能与模型处理语言的方式有关。不过目前「语言混杂」问题仍需解决。
潞晨科技与华为昇腾合作发布DeepSeek R1系列推理API及云镜像服务,基于国产910B算力实现高性能AI推理。该系列模型免费体验,支持多种算力和灵活选择模型大小,助力企业降本增效,加速智能业务落地。