LLM从构建到应用工具全集:推理大模型Github索引梳理

2025年3月17日文章总结:介绍了两个关于LLM和推理大模型的GitHub汇总项目。第一个涵盖数据处理、训练、部署等多个方面,第二个专注于语言模型及多模态推理技术,并提供相关论文、代码库等资源。

RAG中的chunk质量如何评分?HiRAG对GraphRAG的改进思路及推理大模型用于机器翻译

2025年3月17日的文章介绍了RAG相关进展的三方面内容:推理模型在机器翻译中的应用、量化文本分块的有效性方法,以及通过引入层级结构解决局部信息与全局信息间的差距问题。

Light-R1-32B之R1复现认识:兼看R1蒸馏模型所用800K数据细节问题

今天是2025年3月14日,星期五,北京天气晴。Light-R1-32B复现了R1的效果,但限定于数学领域AIME24、AIME25、GPQA Diamond等数据集;同时指出R1蒸馏模型所用800K数据是否来自训练还是由R1生成尚存争议。