分享
MMRel:多模态大模型时代的评测物体间关系理解新基准
MMRel是首个大规模、高质量的物体间关系理解数据集,用于评估和提升多模态大模型能力。包含超过22K问答对,覆盖三个领域与三种关系类型,通过半自动流程生成并提供高难度子集测试极限性能。
体验完Vidu划时代的新功能,我觉得可以正式抛弃3D渲染了。
近日发现一款优秀的2D动漫AI视频工具Vidu,其最新版本1.5引入了多主体一致性功能,实现了风格、角色和场景的一致性。用户可通过上传最多三张图片来生成一致性的视频内容,显著提高了AI视频的制作效率和效果。
NeurIPS 2024|收敛速度最高8倍,准确率提升超30%!华科发布MoE Jetpack框架
华中科技大学提出MoE Jetpack框架,利用密集模型预训练权重微调为混合专家模型,显著提升精度和收敛速度。
支持20+视觉任务,多项SOTA!可扩展多任务视觉基础模型LaVin-DiT:融合时空VAE与DiT
↑ 点击
蓝字
关注极市平台
作者丨AI生成未来
来源丨AI生成未来
编辑丨极市平台
极市导读
模型
回顾PyTorch Eager Mode 量化 TensorRT 加速
本文介绍了如何使用TensorRT加速通过PyTorch Eager Mode量化接口生成的量化模型,包括量化步骤、修复ONNX模型图以及构建和验证TensorRT引擎等内容。
一篇小型语言模型技术最新全面综述
小型语言模型因其低延迟、成本效益等优势受到青睐,特别适用于资源受限的环境和领域知识获取。介绍了构建SLMs的基础概念及技术,如架构、训练技术和从大型语言模型(LLMs)获取SLMs的方法,包括剪枝、知识蒸馏和量化。分析了SLMs在问答、编程、推荐系统等领域的应用,并讨论了在移动设备上的部署策略。