CUTLASS CuTe GEMM细节分析(三)——Swizzle模板参数的取值

本文探讨了如何为新的共享内存逻辑Layout选择Swizzle模板参数B、M和S。通过简化分析,确定了M、S与PTX指令和GPU共享内存多Bank结构之间的关系,并基于实例推导出合适的B值,以避免Bank Conflict。