DeepSeek R1 6百万美元训练成本是否真实?

中国团队DeepSeek仅花费550万美元训练出媲美GPT-4的模型引发全球关注。该团队表示投入远超此数字,包括GPU投资超过10亿美元、运营成本每年数亿美元以及约150位顶级研究员参与。团队展示了五大关键技术突破,并在多项评测中表现优异。DeepSeek还展示了其高效的市场策略和成本优势,美国用户只需7美元即可使用。

刚刚,阶跃星辰发布Step R-mini!推理模型从此不再文理偏科

阶跃星辰发布的Step Reasoner mini是首个推理模型,擅长逻辑推理、代码和数学问题,并能进行文学创作。该模型通过强化学习训练,实现文理兼修。它在AIME 2024和Math500测试中均表现出色,且具有较好的泛化性。