图像分割与U-Net系列模型解析
基于Transformer的detr目标检测算法思路分析
[YOLO系列④] YOLOv5模型训练与流程解析
[YOLO系列③] YOLOv3和YOLOv4优化策略
[YOLO系列②] YOLOv2十大改进点解析
[YOLO系列①] 物体检测评估指标和YOLO-v1实现思路
OpenCV之目标追踪
1.目标追踪
目标追踪(Object Tracking)是指在视频序列中持续追踪目标的位置,这是计算机视觉中的核心难点,其核心挑战包括遮挡、光照变化和快速运动。在视频分析、自动驾驶、智能监控、人机交互等领域中应用广泛。
1.按任务类型分类
- 单目标追踪(SOT, Single Object Tracking):只追踪一个初始帧中给定的目标,典型方法如:
- Siamese-based Tracking(孪生网络)
- Transformer-based Tracking
- 多目标追踪(MOT, Multi-Object Tracking):同时追踪多个目标,通常包括目标检测与数据关联两个阶段,典型方法如:
- 基于检测的跟踪(Tracking-by-Detection)
- 端到端方法
- 多摄像头追踪(MTMC, Multi-Camera Multi-Object Tracking):跨视角数据关联,更复杂的特征匹配,常结合ReID、时空建模、图神经网络等
2.传统目标追踪算法
除了基于深度学习的追踪算法,还有依赖传统的机器学习的目标追踪算法,它们适用于某些轻量级、实时或资源受限的场景(如嵌入式设备)。
OpenCV之停车场车位识别
1.实现流程
- 训练基于VGG16的迁移学习图像分类模型,使其能够分类每个车位有车或者没车
- 通过OpenCV处理停车场图片,分割成单个车位图像数据
- 基于训练模型识别并绘制出空车位
2.模型训练
1.VGG16
VGG16 是由牛津大学 Visual Geometry Group(VGG)在 2014 年提出的经典卷积神经网络(CNN)模型,主要用于图像分类任务。其核心特点是:
- 结构简单但深度大:由 16 层(13 个卷积层 + 3 个全连接层)组成,使用 3x3 小卷积核堆叠(通过多层小卷积核模拟大感受野)。
- ImageNet 竞赛的里程碑:在 2014 年 ImageNet 大规模视觉识别挑战赛(ILSVRC)中取得第二名(Top-5 错误率 7.3%),证明了深度网络对视觉任务的重要性。
- 标准化设计:所有卷积层使用相同配置(3x3 卷积核,步长 1,填充 same),全连接层统一为 4096 个神经元。