无需训练,即插即用,2倍GPU端到端推理加速——视频扩散模型加速方法DraftAttention 2025年6月28日16时 作者 机器之心 ASIC 等多种硬件平台上实现大模型的高效部署与加速。第二作者为香港中文大学的韩晨夏,研究方向聚焦