微调归档 - 第2页共3页

首个大模型后训练方法综述

上午8时 2025/03/14 作者 NLP工程化

国内外研究者综述了LLM的后训练方法进展及五种范式（微调、对齐、推理、效率和集成适应），并介绍了相关数据集与应用场景，同时讨论了当前面临的伦理问题及未来方向。

下午11时 2025/03/09 作者机器之心

。
传统上，困惑度（Perplexity, PPL）被视为衡量模型语言理解与生成质量的标准指标——困

下午12时 2025/03/02 作者机器之心

ive Policy Optimization）是 DeepSeek-R1 成功的基础技术之一，我们

下午12时 2025/02/13 作者硅星人Pro

出色，但“幻觉”问题依然是它面临的一大挑战。
在Vectara HHEM人工智能幻觉测试（行业权威测

下午2时 2025/02/11 作者 AI技术研习社

据的主导地位。
最令人兴奋的是，这些革命性的模型完全免费使用，没有任何限制，任何人都可以随时访问并利

MLNLP
社区是国内外知名的机器学习与自然语言处理社区，受众覆盖国内外NLP硕博生、高校老师以及企