清华提出Test-Time RL,无需标注,模型自学,正确率飙升159%,实现终身学习

MLNLP社区致力于促进国内外机器学习与自然语言处理的交流合作。论文介绍了一种无需标注数据的新方法TTRL,展示了其在数学推理任务上的显著提升效果。

提示工程,被谷歌这份69页白皮书彻底讲明白了(附原文+拆解)

谷歌发布《Prompt Engineering》白皮书,详细讲解提示词工程化策略和参数调优技巧。文档涵盖底层机制、调用参数、采样逻辑等,提供代码配置、输出范式等工程师内部使用的内容,旨在帮助开发者优化LML模型表现。