轻松理解百万Token!清华等提出全新位置编码方法,突破模型长上下文能力新边界 上午8时 2025/01/24 作者 PaperWeekly 随着语言大模型的成功,视觉 – 语言多模态大模型 (Vision-Language Multimod
回顾PyTorch Eager Mode 量化 TensorRT 加速 下午8时 2024/12/15 下午11时 2024/11/21 作者 极市干货 本文介绍了如何使用TensorRT加速通过PyTorch Eager Mode量化接口生成的量化模型,包括量化步骤、修复ONNX模型图以及构建和验证TensorRT引擎等内容。