2025年1月28日23时

看DeepSeek R1的论文时，我突然想起了AlphaGo

MLNLP社区介绍了DeepSeek R1论文，并重点提到了基于规则的奖励模型和多阶段训练策略，作者通过与AlphaGo的对比分享了个人见解。文章还提及技术交流群邀请函和MLNLP社区介绍。

2025年1月28日22时作者 AI先锋官

DeepSeek在Hugging Face发布全新Janus-Pro 7B和1.5B版本，参数优化使其具备本地部署能力，并在文生图基准测试中超越DALL-E 3和Stable Diffusion 3-Medium。

MLNLP社区致力于推动国内外机器学习与自然语言处理领域的交流合作。DeepSeek公司发布的开源大模型R1引起了市场波动，英伟达股价大幅下跌。DeepSeek以其成本优势和性能优越吸引了广泛关注。该社区强调通过算法优化而非单纯依赖算力提升模型效果，为AI产业发展提供新思路。

MLNLP
社区是国内外知名的机器学习与自然语言处理社区，受众覆盖国内外NLP硕博生、高校老师以及企

MLNLP
社区是国内外知名的机器学习与自然语言处理社区，受众覆盖国内外NLP硕博生、高校老师以及企