
©作者 | iMoon-Lab
单位 | 清华大学
来源 | 新智元
©作者 | iMoon-Lab
单位 | 清华大学
来源 | 新智元
论文地址:
项目地址:
零代码平台:

使用超图计算结合 YOLO,性能在各种规模模型中都达到顶尖,在 COCO 数据集上的表现明显优于其他模型,尤其是对中小目标提升更加显著。其中,相比于最新的 YOLOv9-T、YOLO11-S,同规模的 Hyper-YOLO 分别实现了 2% 和 1% 的平均精度提升。
目标检测的困境

然而,随着应用场景的复杂化,现有的YOLO模型在处理跨层次特征融合和高阶特征关系时暴露出了一定的局限性。

因而,不同目标间的高阶语义关联推理限制了目标检测的性能。
高阶关联的建模方法

超图覆盖了多种关联,是复杂关联计算的有效方法。在 Hyper-YOLO 中,作者首次将超图计算引入目标检测领域,以实现视觉高阶语义关联的建模与学习。
模型效果
该工作在 COCO 数据集上进行了丰富的实验。Hyper-YOLOv1.1 提供了 3 种规模的版本(Tiny, Small , Medium),在对比实验中,均明显优于最新的 YOLO 模型。
其中,Tiny 版本的平均精度(mAP)指标相比于 YOLOv8、YOLOv9、YOLO11 的同规模版本分别提升 3.0%、2.0%、0.8%;Small 版本的 mAP 指标相比于 YOLOv8、YOLOv9、YOLO11 的同规模版本分别提升 3.1%、1.2%、1.0%。此外,对于骨干网络、Kernel 大小、特征增强策略、超图构建策略的消融实验证明了所提出的方法的先进性。

下图为使用高阶关联学习对特征图增强前后的可视化图(通过 HyperC2Net 前后的特征图)。
Hyper-YOLO零代码平台


方法概述
超图计算
超图是图的推广形式,是一种高效的特征表示学习方法。在超图中,一条超边可以连接多个顶点,从而表示对象之间的高阶关联。超图神经网络作为超图计算的核心方法,通常包含以下几个步骤:
1. 从原始数据构建超边
2. 从顶点到超边的消息聚合(超边卷积)
3. 从超边到顶点的消息分发(节点卷积)
超图神经网络由于其灵活性和丰富的表达能力,广泛应用于社交网络分析、生物信息学、推荐系统等领域,能够更有效地建模和分析复杂的多层次数据关联。
Hyper-YOLO整体架构

基于超图的跨层次和跨位置表示网络
在传统 YOLO 模型中,颈部为连接骨干网络和预测头之间的部分,通常采用类似 PANet 的结构,承担多尺度特征提取与融合的功能。虽然这类结构能够进行一定的多尺度特征融合,但直接的信息交互局限在相邻层之间。
而基于超图的跨层次跨位置表示网络(Hypergraph-Based Cross-Level and Cross-Position Representation Network, HyperC2Net)则突破了这一瓶颈,主要过程如下:

总结
Hyper-YOLO 通过引入超图计算方法,突破了传统 YOLO 模型在多尺度特征融合上的局限。超图的高阶关联建模能力使得 HyperC2Net 能够在跨层次和跨位置的信息传播中表现出色,不仅在特征点之间实现高效的信息聚合和分发,还通过跨层次的消息传递显著提升了目标检测性能,尤其在处理复杂场景和多目标检测任务中表现优异。
(文:PaperWeekly)