ThinkLLM:大语言模型算法与组件实现 上午8时 2025/03/25 作者 NLP工程化 ThinkLLM是一个开源项目,包含了Transformer核心算法、模型训练与优化算法、高效推理与部署算法、长序列处理算法等,帮助开发者和研究者深入理解大模型的底层机制。
大模型SFT负责记忆、RL负责泛化:兼看多模态GraphRAG之Video方案 下午2时 2025/02/05 作者 老刘说NLP 今天是2025年02月05日,星期三,北京,天气晴。 今天是大年初八,正式开工,大家开工大吉,今年多