UMbreLLa:让大型语言模型在普通设备上也能高效运行的工具 上午8时 2025/01/25 作者 NLP工程化 UMbreLLa:让大型语言模型在普通设备上也能高效运行的工具,通过独特的技术组合,让70B级别的模型在RTX 4070Ti上达到类似人类阅读速度的性能,特别擅长处理编程任务。 参考文献:[1] https://github.com/Infini-AI-Lab/UMbreLLa (文:NLP工程化) 欢迎分享