ONNX
GenAI 转型的下一篇章 – AI Agent |Post Microsoft Ignite 2024
Microsoft Ignite 2024 在北京举办,涵盖AI、开发者工具及安全领域的最新发布与创新方案。活动邀请多位专家分享新技术应用与实践经验。
回顾PyTorch Eager Mode 量化 TensorRT 加速
本文介绍了如何使用TensorRT加速通过PyTorch Eager Mode量化接口生成的量化模型,包括量化步骤、修复ONNX模型图以及构建和验证TensorRT引擎等内容。