↑ 点击蓝字关注极市平台

来源丨CVer

编辑丨极市平台

极市导读

一种高效的多视角目标跟踪方法MITracker，它通过融合多视角特征解决了传统单视角跟踪中的遮挡和目标丢失问题，并通过构建大规模多视角跟踪数据集MVTrack推动了该领域的发展。 >>加入极市CV技术交流群，走在计算机视觉的最前沿

Title: MITracker: Multi-View Integration for Visual Object Tracking

论文: https://arxiv.org/abs/2502.20111

主页: mii-laboratory.github.io/MITracker/

动机：

视觉目标跟踪是计算机视觉领域的核心任务之一，广泛应用于增强现实、自动驾驶等场景。然而，传统的单视角跟踪方法在面对遮挡、目标丢失等挑战时表现不佳。尽管多视角跟踪（MVOT）通过多视角信息的互补性提供了潜在的解决方案，但该领域的发展受到以下限制：

为了解决这些问题，我们提出了一个新的多视角跟踪数据集 MVTrack 和一个高效的多视角跟踪方法 MITracker，旨在通过多视角信息的融合提升跟踪的鲁棒性和准确性。

本文贡献：

MVTrack数据集：我们构建了一个大规模的多视角跟踪数据集，包含234K高质量标注帧，涵盖27个不同类别的物体和9种具有挑战性的跟踪属性（如遮挡、变形等）。MVTrack是首个支持类无关多视角跟踪训练和评估的综合性数据集。
MITracker方法：我们提出了一种新颖的多视角跟踪方法MITracker，通过将2D图像特征转换为3D特征体积，并利用鸟瞰图（BEV）引导的多视角信息融合机制，显著提升了跟踪的稳定性和准确性。
性能提升：MITracker在MVTrack和GMTD数据集上均达到了最先进的性能，特别是在遮挡和目标丢失等复杂场景下，恢复率从56.7%提升至79.2%。

我们在MVTrack和GMTD数据集上进行了广泛的实验，MITracker在多个评估指标上均达到了最先进的性能。特别是在多视角场景下，MITracker的表现显著优于现有的单视角跟踪方法，展示了其在复杂场景下的强大鲁棒性。

我们计划进一步扩展MVTrack数据集，增加室外场景和更多类别的物体，以提升模型的泛化能力。同时，我们也将探索减少对相机校准的依赖，使MITracker在更多实际场景中应用。

MITracker通过多视角信息的有效融合，解决了传统单视角跟踪中的遮挡和目标丢失问题，为多视角视觉目标跟踪领域提供了新的解决方案。我们相信，MVTrack数据集和MITracker方法将为未来的研究提供强有力的支持，推动视觉目标跟踪技术的进一步发展。

（文：极市干货）