日期: 2025 年 1 月 28 日
看DeepSeek R1的论文时,我突然想起了AlphaGo
MLNLP社区介绍了DeepSeek R1论文,并重点提到了基于规则的奖励模型和多阶段训练策略,作者通过与AlphaGo的对比分享了个人见解。文章还提及技术交流群邀请函和MLNLP社区介绍。
除夕无休! DeepSeek 推多模态大模型Janus-Pro,实测生图效果一般
DeepSeek在Hugging Face发布全新Janus-Pro 7B和1.5B版本,参数优化使其具备本地部署能力,并在文生图基准测试中超越DALL-E 3和Stable Diffusion 3-Medium。
央视新闻:DeepSeek火爆全网,“神秘东方力量”冲击美股!
MLNLP社区致力于推动国内外机器学习与自然语言处理领域的交流合作。DeepSeek公司发布的开源大模型R1引起了市场波动,英伟达股价大幅下跌。DeepSeek以其成本优势和性能优越吸引了广泛关注。该社区强调通过算法优化而非单纯依赖算力提升模型效果,为AI产业发展提供新思路。