数学理解归档

被《经验时代》刷屏之后，剑桥博士长文讲述RL破局之路

2025年4月24日16时作者机器之心

归来的姿态在 LLM 的后训练时代证明了其巨大价值，Sutton 和 Barto 拿了图灵奖，Dav

2025年2月27日16时作者 NLP工程化

Qwen发布了QwQ-Max-Preview模型，该模型基于Qwen2.5-Max推理模型，具有更强的数学理解、编码和代理能力。即将发布QwQ-Max正式版，并在Apache 2.0下开放源代码。