量化技术归档

一份系统性的 LLM 微调实战指南：FineTuningLLMs

2025年7月9日8时作者 NLP工程化

详细介绍了量化、LoRA 适配器、数据格式化等核心技术，并分享了在单个 GPU 上高效微调大语言模型的方法和实践案例。

2025年6月26日14时作者小兵的AI视界

MiniCPM 4.0
端侧大模型
，以其极致高效的性能和灵活的部署能力
，为这一问题提供了全新的解

2025年5月29日16时作者新智元

EfficientLLM项目聚焦LLM效率，提出三轴分类法和六大指标，实验包揽全架构、多模态、微调技术，为研究人员提供清晰的导航图。

2025年4月17日23时作者极市干货

0
字，1
0篇参考文献
，内容涵盖了
语言建模
、
预训练
面临的挑战、
量化技术
、
分布式训练

2025年4月8日16时作者 AI前线

rew Rossignol 成功在一台“古董”老笔记本 PowerBook G4 上运行了生成式 A

2025年3月7日12时作者机器之心

近期研究提出COAT方法利用FP8量化技术，通过动态范围扩展和混合粒度精度流优化大型模型训练中的内存占用和加速速度，保持模型精度的同时显著减少显存使用并提升训练效率。

2025年2月24日16时作者量子位

研究人员提出MHA2MLA方法，通过微调预训练模型减少KV缓存大小90%，保持甚至提升性能。该技术利用低秩联合压缩键值技术和分组查询注意力策略，降低推理成本的同时维持精度。

2025年2月19日23时作者极市干货

.9和9.11谁大更考验Reasoning模型, 似乎很多大模型的答案都做的不好. DeepSeek

2025年2月19日14时作者 AI先锋官

近日英伟达联合北京大学和Hedra Inc开源了Magic 1-For-1 AI视频生成模型，其特点是生成速度快且开源，并通过量化技术将模型体积从32GB压缩至16GB。该模型支持多模态输入、扩散步骤蒸馏等技术。缺点在于高速运动场景的处理能力有限，以及视频分辨率较低。