老刘说NLP
第一批抓住DeepSeek风口的研究生已经论文自由了
文章介绍了科研过程中的重要性,并强调了执行力和扎实工作的重要性。文中还推荐了《顶会顶刊12节论文写作课》,并提到了研梦非凡的论文辅导方案,指出好的idea是靠实干产生的。
LLM从构建到应用工具全集:推理大模型Github索引梳理
2025年3月17日文章总结:介绍了两个关于LLM和推理大模型的GitHub汇总项目。第一个涵盖数据处理、训练、部署等多个方面,第二个专注于语言模型及多模态推理技术,并提供相关论文、代码库等资源。
RAG中的chunk质量如何评分?HiRAG对GraphRAG的改进思路及推理大模型用于机器翻译
2025年3月17日的文章介绍了RAG相关进展的三方面内容:推理模型在机器翻译中的应用、量化文本分块的有效性方法,以及通过引入层级结构解决局部信息与全局信息间的差距问题。
GDELT情报分析遇见GraphRAG:兼看视频多模态RAG记忆增强检索实现思路
2025年3月15日北京下雪。文章介绍了视频多模态RAG记忆增强检索和GDELT事件知识图谱构建及与RAG效果评估,讨论了不同方法的优缺点及其在问答任务中的应用。
Light-R1-32B之R1复现认识:兼看R1蒸馏模型所用800K数据细节问题
今天是2025年3月14日,星期五,北京天气晴。Light-R1-32B复现了R1的效果,但限定于数学领域AIME24、AIME25、GPQA Diamond等数据集;同时指出R1蒸馏模型所用800K数据是否来自训练还是由R1生成尚存争议。
R1-GRPO用于多模态、ChatBI、Gemma3等前沿进展:兼看KTransformers技术分享回顾
enManus-RL增强Agent规划能力训练框架》,https://mp.weixin.qq.co