国际
接棒DeepSeek!阿里千问宣布开源百万Token上下文模型:主打闪电般的推理「附送详细技术报告」
阿里通义千问团队推出Qwen2.5-1M开源模型,支持百万Token上下文长度,并带来闪电般快速的推理框架。
太猛了!DeepSeek R1核心技术复现,30美元实现:小模型 RL Scaling 革命
来自加州伯克利大学的研究团队以极低的成本(低于30美元)成功复现了DeepSeek R1-Zero的关键技术,并在‘倒计时’游戏中展示了小型语言模型的强大自验证和搜索能力。
DeepSeek-R1、Kimi k1.5、豆包1.5 Pro、GLM,国产AI太燃了!AI Weekly『1月20-26日』
大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研