计算效率提升
矩阵乘法可以算得更快了!港中文10页论文证明:能源、时间均可节省
香港中文大学提出了一种名为RXTX的新算法,通过结合机器学习搜索方法和组合优化技术,显著提升了XXt的计算效率。与原算法相比,RXTX的设计使得递归关系式为R(n)=8R(n/4) + 26M(n/4),比基Strassen的递归分治方法降低了约5%的渐近乘法常数。
微软1bit LLM新研究:原生4bit激活值量化,可充分利用新一代GPU对4bit计算的原生支持
微软发布BitNet v2框架,通过引入H-BitLinear模块实现原生4 bit激活值量化,充分利用新一代GPU对4 bit计算的原生支持能力,并显著减少内存带宽和提升计算效率。