PRMs归档 - 每时AI

过程级奖励模型遭遇“信任危机”？PRMBench精细化基准揭示LLM强大推理幕后功臣的潜在缺陷

上午8时 2025/01/14 作者 PaperWeekly

©PaperWeekly 原创 · 作者 |
宋明阳
单位 |
复旦大学博士生
研究方向 |
VLM