无监督学习归档

Unsloth 发布了 GRPO 的新互动教程 (ipynb notebook)

2025年5月15日8时作者 NLP工程化

Unsloth 发布了GRPO的新互动教程，用户可以轻松微调Qwen3-Base并开启其思考模式，实现几乎无监督学习。

2025年4月17日8时作者 AIGC开放社区

今天凌晨
1点，
OpenAI发布了最强、最智能模型o4-mini和满血版o3。
o4-mini在AIME2024和2025中分别达到了93.4%和92.7%，比满血版o3还强。同时具备多模态处理能力，可以调用工具辅助推理。

2025年4月14日23时作者 Founder Park

人员进行了一场 45 分钟的高信息量对谈，首次披露了这款模型
研发耗时严重超期
、
计算集群频繁故障