LLM从构建到应用工具全集:推理大模型Github索引梳理
2025年3月17日文章总结:介绍了两个关于LLM和推理大模型的GitHub汇总项目。第一个涵盖数据处理、训练、部署等多个方面,第二个专注于语言模型及多模态推理技术,并提供相关论文、代码库等资源。
2025年3月17日文章总结:介绍了两个关于LLM和推理大模型的GitHub汇总项目。第一个涵盖数据处理、训练、部署等多个方面,第二个专注于语言模型及多模态推理技术,并提供相关论文、代码库等资源。
2025年3月17日的文章介绍了RAG相关进展的三方面内容:推理模型在机器翻译中的应用、量化文本分块的有效性方法,以及通过引入层级结构解决局部信息与全局信息间的差距问题。
2025年3月15日北京下雪。文章介绍了视频多模态RAG记忆增强检索和GDELT事件知识图谱构建及与RAG效果评估,讨论了不同方法的优缺点及其在问答任务中的应用。
今天是2025年3月14日,星期五,北京天气晴。Light-R1-32B复现了R1的效果,但限定于数学领域AIME24、AIME25、GPQA Diamond等数据集;同时指出R1蒸馏模型所用800K数据是否来自训练还是由R1生成尚存争议。
enManus-RL增强Agent规划能力训练框架》,https://mp.weixin.qq.co
2025年3月8日星期六,北京天气晴朗。本文继续探讨RAG的优化工作SAGE,并观察了技术落地的新现象。介绍了三个主要问题及解决思路。同时讨论了技术规范和MCP协议的发展趋势及其对通用Agent的认知影响。
在2025年3月7日的周五,文章探讨了AI内容的影响范围及R1复现基座的一些解释,并介绍了多模态语音大模型在R1方面的尝试。