Kimi开源底层推理框架,1小时GitHub揽星1.2k 下午8时 2024/11/28 作者 量子位 月之暗面Kimi联合清华大学等机构开源大模型推理架构Mooncake,采用分阶段方式逐步实现高性能KVCache多级缓存的开源。该架构提升了Kimi用户体验,降低了成本,并为处理长文本和高并发需求提供了解决方案。