思维链数据归档

R1-GRPO强化范式用在KG抽取的粗暴实现：兼看RAG、推理加速等相关进展

下午2时 2025/02/11 作者老刘说NLP

今日文章介绍了R1和知识图谱结合的粗暴实现以及强化学习在知识图谱信息抽取中的进展。具体包括开源复现DeepSeek R1的文本到图谱抽取训练方案，并回顾了昨日技术社区的进展，涉及RAG webui、推理框架KTransformers等。