谷歌轻量级、高性能的Gemma3开源模型,最大的 Gemma 3 27B 仅需单个 GPU
谷歌发布Gemma 3开源模型,提供多种尺寸支持,性能强劲且具备多语言处理能力,已在LMArena排行榜上获得好成绩。
谷歌发布Gemma 3开源模型,提供多种尺寸支持,性能强劲且具备多语言处理能力,已在LMArena排行榜上获得好成绩。
香港大学提出MiniRAG,一种专为极简和高效设计的新型RAG系统,解决SLMs在语义理解和文本处理上的局限性。通过引入语义感知的异构图索引机制和轻量级拓扑增强检索方法,MiniRAG在使用SLMs时与基于LLM的方法性能相当,同时节省25%存储空间。
AWS 推出了 Nova 多模态生成 AI 模型系列,包括 Micro、Lite、Pro 和 Premier 四种文本生成模型,支持 15 种语言。Nova 型号是同类中速度最快之一,并且成本最低。
本文介绍了一种名为MemoryFormer的新型Transformer模型,通过使用存储空间替代传统全连接层来降低推理时计算复杂度。MemoryFormer利用哈希算法和局部敏感哈希索引方法,在保持性能的同时大幅减少了模型的计算量,为大模型高效推理提供了新解决方案。