项目简介
基于SAM 2的一个零样本视觉跟踪项目:samurai,它增加了运动感知记忆来提高跟踪的准确性实时视觉跟踪,在处理拥挤场景、快速运动物体和自遮挡等复杂动态环境中,能保持稳定的追踪性能。
该存储库是 SAMURAI 的官方实现:使用运动感知内存调整分段任意模型进行零镜头视觉跟踪
入门
SAMURAI安装
使用前需先安装 SAM 2。该代码需要python>=3.10
,以及torch>=2.3.1
和torchvision>=0.18.1
。请按照此处的说明安装 PyTorch 和 TorchVision 依赖项。您可以使用以下命令在 GPU 计算机上安装SAMURAI 版本的 SAM 2:
cd sam2
pip install -e .
pip install -e ".[notebooks]"
请参阅原始 SAM 2 存储库中的INSTALL.md ,了解有关潜在问题和解决方案的常见问题解答。
安装其他要求:
pip install matplotlib==3.7 tikzplotlib jpeg4py opencv-python lmdb pandas scipy loguru
SAM 2.1 检查点下载
cd checkpoints && \
./download_ckpts.sh && \
cd ..
数据准备
请按照以下格式准备数据:
data/LaSOT
├── airplane/
│ ├── airplane-1/
│ │ ├── full_occlusion.txt
│ │ ├── groundtruth.txt
│ │ ├── img
│ │ ├── nlp.txt
│ │ └── out_of_view.txt
│ ├── airplane-2/
│ ├── airplane-3/
│ ├── ...
├── basketball
├── bear
├── bicycle
...
├── training_set.txt
└── testing_set.txt
主要推论
python scripts/main_inference.py
自定义视频演示
要使用自定义视频或帧目录运行演示,请使用以下示例:
注意: .txt
文件包含一行,其中第一帧的边界框采用x,y,w,h
格式。
输入是视频文件
python scripts/demo.py --video_path <your_video.mp4> --txt_path <path_to_first_frame_bbox.txt>
输入是框架文件夹
# Only JPG images are supported
python scripts/demo.py --video_path <your_frame_directory> --txt_path <path_to_first_frame_bbox.txt>
项目链接
https://github.com/yangchris11/samurai
https://yangchris11.github.io/samurai/
扫码加入技术交流群,备注「开发语言-城市-昵称」
合作请注明
关注「GitHubStore」公众号
(文:GitHubStore)