论文链接:
随着互联网平台的多元化和用户及物品数量的指数级增长,推荐系统中的冷启动问题(Cold-Start Recommendation, CSR)愈发凸显。
冷启动问题主要涉及新用户或新物品的准确建模,由于缺乏足够的历史交互数据,这些新实体的推荐效果往往难以令人满意。随着大语言模型(Large Language Models, LLMs)的崛起,其强大的语义理解和生成能力为冷启动推荐系统带来了新的机遇。
在此背景下,UIC、浙大等十余机构联合对近 300 篇文献进行全面调研,发布了《Cold-Start Recommendation towards the Era of Large Language Models (LLMs): A Comprehensive Survey and Roadmap》的调研综述。
背景
冷启动问题是推荐系统和信息检索长期面临的挑战之一。在冷启动场景下,新用户或新物品缺乏足够的历史交互数据,导致系统难以准确建模其偏好或特征。随着互联网的快速发展,新用户和新商品日益增加,冷启动问题愈发突出,不仅影响用户体验,还可能导致平台的用户流失。
近年来,大语言模型在自然语言处理领域取得了巨大成功,其强大的语义理解能力为冷启动推荐提供了新的解决方案。
这篇综述论文通过近 300 篇相关工作系统地回顾了冷启动推荐领域的研究进展,涵盖了从内容特征(Content Features)、图关系(Graph Relations)、域信息(Domain Information)到大语言模型的世界知识(World Knowledge from LLMs)的发展路线图。作者详细分析了近年来该领域的关键技术,并提出了未来的潜力研究方向。

▲ 图1. 综述中讨论的知识范围的示意
综述体系与路线图
论文系统地回顾了冷启动推荐领域的研究进展,并提出了一个面向未来的研究路线图。以下是论文的综述体系和路线图的详细介绍:
▲ 图2.综述体系
3.1 内容特征(Content Features)
-
数据不完全学习(Data-Incomplete Learning):针对严格冷启动场景,仅依赖内容信息进行建模的方法,如鲁棒协同训练、知识对齐、冷探索和特征相似性测量。
-
数据高效学习(Data-Efficient Learning):针对有限交互数据的冷启动场景,通过元学习优化、元任务利用、元嵌入初始化和序贯元学习等方法提升性能。
3.2 图关系(Graph Relations)
-
交互图增强(Interaction Graph Enhancement):通过补充图关系信息(如补充图关系和同质性网络关系)为冷启动节点提供更多图信息。
-
图关系扩展(Graph Relation Extension):通过扩展原始交互图(如异构图关系、属性图关系和知识图关系)传递相关图信息。
-
图聚合器改进(Graph Aggregator Improvement):通过扩展聚合范围和增强信息聚合器的功能,从有限的结构化数据中提取更多信息。
3.3 域信息(Domain Information)
-
域知识迁移(Domain Knowledge Transfer):通过嵌入映射、异构连接和学习过程将源领域的知识迁移到目标领域。
-
域分布对齐(Domain Distribution Alignment):通过协同过滤对齐、辅助特征对齐等方法减少源域和目标域之间的分布差异。
-
域不变表示学习(Domain-Invariant Representation Learning):通过解耦表示和融合表示学习跨领域的通用特征空间。
-
LLM 作为推荐系统(LLM as the Recommender System):通过提示策略(如直接提示、多步提示和检索增强推荐)和模型微调(如指令微调和微调)利用 LLM 进行冷启动推荐。
-
LLM 作为知识增强器(LLM as the Knowledge Enhancer):通过 LLM 增强表示(如多模态增强表示和领域增强表示)和关系增强(如行为模拟和外部关系补充)提升冷启动推荐性能。
总结
此综述通过凝练近 300 篇相关工作,为冷启动推荐系统领域提供了全面的研究回顾,总结了未来的潜力发展方向。随着大语言模型的不断发展和应用,冷启动推荐技术将有望取得更大的突破,为用户和平台带来更好的体验和价值。
感兴趣的读者可以通过以下链接查看论文全文以及作者所整理的资料库:
冷启动推荐系统相关资料库:
(文:PaperWeekly)