文本分类任务归档

“是我创造了第一个LLM”！Kaggle前首席科学家一句话引发AI学术圈考古行动

下午4时 2025/04/08 作者量子位

Jeremy Howard因其发表的论文ULMFiT，使用非监督预训练-微调范式达到当时NLP领域的SOTA，被认为是第一个大语言模型。此观点得到了同行认可和考据支持。

下午8时 2024/12/15 作者量子位

vivo AI Lab提出数据质量提升(DQE)方法，通过更少的数据获得更高的文本分类任务准确率。实验表明，在多个数据集中DQE选择的数据比全量数据表现出显著的性能提升，并有效提升了大语言模型指令跟随能力。