复杂性和不确定性归档 - 每时AI

OpenAI：强化学习确实可显著提高LLM性能，DeepSeek R1、Kimi k1.5发现o1的秘密

2025年2月19日23时作者机器之心

IOI 上达到了金牌水平，并且在 CodeForces 上获得了与精英级人类相当的得分。
他们是怎