视频目标跟踪综述学习笔记

微醺的水 2024-07-26 原文

目标跟踪综述论文阅读心得

1、目标跟踪任务是什么？

目标跟踪是计算机视觉领域的一个重要分支。目标跟踪就是在一段视频序列中定位感兴趣的运动目标，得到目标完整的运动轨迹。给定图像第一帧目标的位置，预测下一帧图像中目标的位置。

2、目标跟踪的主要部分：

运动模型（Motion Model）：如何产生众多的候选样本。

	生成候选样本的速度与质量直接决定了跟踪系统表现的优劣。常见的有粒子滤波（Particle Filter） 滑动窗口（Sliding Window） 半径滑动窗口（Radius Sliding Window）。

论文中的结论：通常情况下，运动模型对性能的影响较小。然而，在尺度变化和快速运动的情况下，正确设置参数仍然是获得良好性能的关键

特征提取（Feature Extractor）：利用何种特征表示目标。

	鉴别性的特征表示是目标跟踪的关键之一。常用的特征被分为两种类型：手工设计的特征（Hand-crafted feature）和深度特征（Deep feature）。
	常用的手工设计的特征有灰度特征（Gray），方向梯度直方图（HOG），哈尔特征（Haar-like），尺度不变特征（SIFT）等。
	与人为设计的特征不同，深度特征是通过大量的训练样本学习出来的特征，它比手工设计的特征更具有鉴别性。因此，利用深度特征的跟踪方法通常很轻松就能获得一个不错的效果。
	
	论文中的结论：最佳方案(HOG +原始颜色)优于基本模型(原始灰度)20%以上。因此特征提取器是跟踪器最重要的组成部分。使用适当的特征可以显著提高跟踪性能。

观测模型（Observation Model）：如何为众多候选样本进行评分。

	大多数的跟踪方法主要集中在这一块的设计上。根据不同的思路，观测模型可分为两类：生成式模型（Generative Model）和判别式模型（Discriminative Model）。
	生成式模型通常寻找与目标模板最相似的候选作为跟踪结果。判别式模型通过训练一个分类器去区分目标与背景，选择置信度最高的候选样本作为预测结果。
	判别式方法已经成为目标跟踪中的主流方法，因为有大量的机器学习方法可以利用。常用的理论方法包括：逻辑回归，岭回归，支持向量机，多示例学习，相关滤波等。
	
	论文中的结论:当特征较弱时，不同的观察模型确实会影响性能。然而，当功能足够强大时，性能差距就会缩小。

模型更新（Model Updater）: 如何更新观测模型使其适应目标的变化。

主要采用两种方法：
	1.第一种方法是每当目标的置信度低于阈值时更新模型。这样做可以确保目标始终有很高的信心。这是我们基本模型中使用的默认更新程序。
	2. 第二种方法是每当目标和背景示例的置信度之间的差异低于阈值时更新模型。这种策略只是在正面和负面例子之间保持足够大的差距，而不是强迫目标具有高度的信心。当目标被遮挡或消失时，它可能会有帮助。

	论文中的结论:尽管在论文中，模型更新程序的实现通常被视为工程技巧，特别是对于区分性跟踪器，但它们对性能的影响通常非常显著，因此值得研究。

集成方法（Ensemble Method）：如何融合多个决策获得一个更优的决策结果。

	集成方法有利于提高模型的预测精度，也常常被视为一种提高跟踪准确率的有效手段。可以把集成方法笼统的划分为两类：在多个预测结果中选一个最好的，或是利用所有的预测加权平均。
	
	论文中的结论:集成后处理器可以显着提高性能，特别是当跟踪器具有高多样性时。

总结：

首先，特征提取器是跟踪器中最重要的部分。第二，如果特征足够好，观察模型就不那么重要了。第三，模型更新程序可以显著地影响结果，但目前实现该组件的原则性方法不多。最后，集成后处理器是非常通用和有效的。

3、目标跟踪的主要流程：

输入—目标初始化—特征提取—目标模型—目标搜索—输出

4、目标跟踪算法的分类：

1. 据其观测模型，我们将其分为生成式模型和鉴别式模型两种：

生成式模型： 在原始影像帧中对目标按指定的方法建立目标模型，然后在跟踪处理帧中搜索对比与目标模型相似度最高的区域作为目标区域进行跟踪。如光流法，粒子滤波，Meanshift 算法、 Camshift算法等。

判别式模型：（图像特征+机器学习）通过对原始影像帧，对目标及背景信息进行区分建立判别模型，通过对后续影像帧搜索目标进行判别是目标或背景信息进而完成目标跟踪。主要就是相关滤波和深度学习。

早期目标跟踪算法：

（1）光流法

（2）Kalman滤波

（3）核方法

基于相关滤波跟踪方法：

（1）MOSSE

（2）CSK

（3）KCF/DCF

（4）CN

（5）DSST

基于深度学习的跟踪算法：

（1）MDNet

（2）TCNN

（3）GOTURN

深度学习和相关滤波相结合：

（1）DeepSRDCF

（2）C-COT

（3）ECO（2017）

（4）SiamFC

（5）Siamese Net大爆发（2018，SiamRPN, SA-Siam-R）

（6）SiamMask（CVPR，2019）

（7）UPDT(2018,DCF+CNN)

总结：相关滤波方法实时性好，深度学习准确性好，目前的研究方向朝着二者融合的方向靠拢。

5、目标跟踪任务的挑战：

遮挡（Occlusion）是目标跟踪中最常见的挑战因素之一：遮挡又分为部分遮挡（Partial Occlusion）和完全遮挡（Full Occlusion）。解决部分遮挡通常有两种思路：
形变（Deformation）也是目标跟踪中的一大难题：目标表观的不断变化，通常导致跟踪发生漂移（Drift）。
背景杂斑（Background Clutter）：指得是要跟踪的目标周围有非常相似的目标对跟踪造成了干扰，
解决这类问题常用的手段是利用目标的运动信息，预测运动的大致轨迹，防止跟踪器跟踪到相似的其他目标上，或是利用目标周围的大量样本框对分类器进行更新训练，提高分类器对背景与目标的辨别能力。
尺度变换（Scale Variation）：是目标在运动过程中的由远及近或由近及远而产生的尺度大小变化的现象。预测目标框的大小也是目标跟踪中的一项挑战，如何又快又准确的预测出目标的尺度变化系数直接影响了跟踪的准确率。
通常的做法有：在运动模型产生候选样本的时候，生成大量尺度大小不一的候选框，或是在多个不同尺度目标上进行目标跟踪，产生多个预测结果，选择其中最优的作为最后的预测目标。

综述笔记 xff xff0c xff0 计算机视觉目标跟踪

有关视频目标跟踪综述学习笔记的更多相关文章

LC滤波器设计学习笔记（一）滤波电路入门 - 2
目录前言滤波电路科普主要分类实际情况单位的概念常用评价参数函数型滤波器简单分析滤波电路构成低通滤波器RC低通滤波器RL低通滤波器高通滤波器RC高通滤波器RL高通滤波器部分摘自《LC滤波器设计与制作》，侵权删。前言最近需要学习放大电路和滤波电路，但是由于只在之前做音乐频谱分析仪的时候简单了解过一点点运放，所以也是相当从零开始学习了。滤波电路科普主要分类滤波器：主要是从不同频率的成分中提取出特定频率的信号。有源滤波器：由RC元件与运算放大器组成的滤波器。可滤除某一次或多次谐波，最普通易于采用的无源滤波器结构是将电感与电容串联，可对主要次谐波（3、5、7）构成低阻抗旁路。无源滤波器：无源滤波器，又称
CAN协议的学习与理解 - 2
最近在学习CAN，记录一下，也供大家参考交流。推荐几个我觉得很好的CAN学习，本文也是在看了他们的好文之后做的笔记首先是瑞萨的CAN入门，真的通透；秀！靠这篇我竟然2天理解了CAN协议！实战STM32F4CAN！原文链接：https://blog.csdn.net/XiaoXiaoPengBo/article/details/116206252CAN详解（小白教程）原文链接：https://blog.csdn.net/xwwwj/article/details/105372234一篇易懂的CAN通讯协议指南1一篇易懂的CAN通讯协议指南1-知乎(zhihu.com)视频推荐CAN总线个人知识总
深度学习部署：Windows安装pycocotools报错解决方法 - 2
深度学习部署：Windows安装pycocotools报错解决方法1.pycocotools库的简介2.pycocotools安装的坑3.解决办法更多Ai资讯：公主号AiCharm本系列是作者在跑一些深度学习实例时，遇到的各种各样的问题及解决办法，希望能够帮助到大家。ERROR:Commanderroredoutwithexitstatus1:'D:\Anaconda3\python.exe'-u-c'importsys,setuptools,tokenize;sys.argv[0]='"'"'C:\\Users\\46653\\AppData\\Local\\Temp\\pip-instal
动漫制作技巧如何制作动漫视频 - 2
动漫制作技巧是很多新人想了解的问题，今天小编就来解答与大家分享一下动漫制作流程，为了帮助有兴趣的同学理解，大多数人会选择动漫培训机构，那么今天小编就带大家来看看动漫制作要掌握哪些技巧？一、动漫作品首先完成草图设计和原型制作。设计草图要有目的、有对象、有步骤、要形象、要简单、符合实际。设计图要一致性，以保证制作的顺利进行。二、原型制作是根据设计图纸和制作材料，可以是手绘也可以是3d软件创建。在此步骤中，要注意的问题是色彩和平面布局。三、动漫制作制作完成后，加工成型。完成不同的表现形式后，就要对设计稿进行加工处理，使加工的难易度降低，并得到一些基本准确的概念，以便于后续的大样、准确的尺寸制定。四、
python ffmpeg 使用 pyav 转换一组图像到视频 - 2
2022/8/4更新支持加入水印水印必须包含透明图像，并且水印图像大小要等于原图像的大小pythonconvert_image_to_video.py-f30-mwatermark.pngim_dirout.mkv2022/6/21更新让命令行参数更加易用新的命令行使用方法pythonconvert_image_to_video.py-f30im_dirout.mkvFFMPEG命令行转换一组JPG图像到视频时，是将这组图像视为MJPG流。我需要转换一组PNG图像到视频，FFMPEG就不认了。pyav内置了ffmpeg库，不需要系统带有ffmpeg工具因此我使用ffmpeg的python包装p
TimeSformer：抛弃CNN的Transformer视频理解框架 - 2
Transformers开始在视频识别领域的“猪突猛进”，各种改进和魔改层出不穷。由此作者将开启VideoTransformer系列的讲解，本篇主要介绍了FBAI团队的TimeSformer，这也是第一篇使用纯Transformer结构在视频识别上的文章。如果觉得有用，就请点赞、收藏、关注！paper:https://arxiv.org/abs/2102.05095code(offical):https://github.com/facebookresearch/TimeSformeraccept:ICML2021author:FacebookAI一、前言Transformers(VIT)在图
ruby - 我正在学习编程并选择了 Ruby。我应该升级到 Ruby 1.9 吗？ - 2
我完全不是程序员，正在学习使用Ruby和Rails框架进行编程。我目前正在使用Ruby1.8.7和Rails3.0.3，但我想知道我是否应该升级到Ruby1.9，因为我真的没有任何升级的“遗留”成本。缺点是什么？我是否会遇到与普通gem的兼容性问题，或者甚至其他我不太了解甚至无法预料的问题？最佳答案你应该升级。不要坚持从1.8.7开始。如果您发现不支持1.9.2的gem，请避免使用它们(因为它们很可能不被维护)。如果您对gem是否兼容1.9.2有任何疑问，您可以在以下位置查看:http://www.railsplugins.or
ruby - 我如何学习 ruby 的正则表达式？ - 2
如何学习ruby的正则表达式？(对于假人) 最佳答案 http://www.rubular.com/在Ruby中使用正则表达式时是一个很棒的工具，因为它可以立即将结果可视化。关于ruby-我如何学习ruby的正则表达式？，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/1881231/
ruby - 如何更改此正则表达式以从未指定 v 参数的 Youtube URL 获取 Youtube 视频 ID？ - 2
目前我正在使用这个正则表达式从YoutubeURL中提取视频ID:url.match(/v=([^&]*)/)[1]我怎样才能改变它，以便它也可以从这个没有v参数的YoutubeURL获取视频ID:http://www.youtube.com/user/SHAYTARDS#p/u/9/Xc81AajGUMU感谢阅读。编辑:我正在使用ruby1.8.7 最佳答案对于Ruby1.8.7，这就可以了。url_1='http://www.youtube.com/watch?v=8WVTOUh53QY&feature=feedf'url
深度学习12. CNN经典网络 VGG16 - 2
深度学习12.CNN经典网络VGG16一、简介1.VGG来源2.VGG分类3.不同模型的参数数量4.3x3卷积核的好处5.关于学习率调度6.批归一化二、VGG16层分析1.层划分2.参数展开过程图解3.参数传递示例4.VGG16各层参数数量三、代码分析1.VGG16模型定义2.训练3.测试一、简介1.VGG来源VGG（VisualGeometryGroup）是一个视觉几何组在2014年提出的深度卷积神经网络架构。VGG在2014年ImageNet图像分类竞赛亚军，定位竞赛冠军；VGG网络采用连续的小卷积核（3x3）和池化层构建深度神经网络，网络深度可以达到16层或19层，其中VGG16和VGG

视频目标跟踪综述学习笔记

目标跟踪综述论文阅读心得

有关视频目标跟踪综述学习笔记的更多相关文章

随机推荐