响应长度归档 - 每时AI

DeepSeek-R1-Zero不存在顿悟时刻？华人团队揭秘真相：或只因强化学习

2025年2月8日23时作者新智元

ek-R1-Zero的「顿悟时刻」，可能并不存在。类似复现实验中之所以出现响应变长现象，或许只是因为

华人研究团队揭秘：DeepSeek-R1-Zero或许并不存在「顿悟时刻」

2025年2月7日16时作者机器之心

有时对模型性能的助益不大。
在过去这半个月里，关于 DeepSeek 的一切都会迅速成为焦点。
一项