Mooncake
月之暗面Kimi与清华大学发布Mooncake开源项目,阿里发布QwQ-32B-Preview模型,推理能力强劲
Mooncake是专为大规模语言模型服务的分散架构平台;QwQ致力于推进人工智能推理能力,并在各种基准测试中表现优异;Next.js AI Chatbot x Supabase提供高效的聊天功能与数据存储解决方案;Insight-V是一个早期探索长链视觉推理的多模态大语言模型;《AGI之路》深入探讨了大模型构建与应用的关键技术。
Kimi开源底层推理框架,1小时GitHub揽星1.2k
月之暗面Kimi联合清华大学等机构开源大模型推理架构Mooncake,采用分阶段方式逐步实现高性能KVCache多级缓存的开源。该架构提升了Kimi用户体验,降低了成本,并为处理长文本和高并发需求提供了解决方案。