优化效果归档

DeepSeek开源放大招：FlashMLA让H800算力狂飙！曝光低成本秘笈

2025年2月24日12时作者新智元

DeepSeek发布FlashMLA开源库，支持英伟达Hopper GPU。FlashMLA针对变长序列进行优化，显著提高推理速度和性能。

2025年2月12日23时作者极市干货

eQuant的后训练量化（PTQ）方法，通过引入等价的仿射变换扩展了优化范围，显著降低了量化误差，尤

2024年12月20日14时作者 AI探索时代

RAG系统中检索环节存在问题包括数据质量问题、向量化表示、检索方法与算法等多方面因素，文章提出优化建议以提升其性能，如使用高质量嵌入模型、定期更新数据库及调整相似度度量参数等。