computer-vision

c++ - 改进open cv中的camshift算法

我正在使用opencv的camshift算法进行对象跟踪。输入是从网络摄像头获取的，并且在连续帧之间跟踪对象。我怎样才能使跟踪更强？如果我快速移动物体，跟踪就会失败。此外，当对象不在框架中时，也会出现错误检测。我该如何改进？最佳答案对象跟踪是计算机视觉中的一个活跃研究领域。有很多算法可以做到这一点，但没有一种算法100%有效。如果您需要实时跟踪，那么您需要简单快速的东西。我假设你有办法从背景中分割出一个移动的物体。然后您可以计算对象的表示，例如颜色直方图，并将其与您在下一帧中找到的对象进行比较。您还应该检查对象在帧之间没有移动太

c++ - 一种无需最大化内存即可实时缓冲高清视频的有效方法

我正在编写一个程序，涉及使用OpenCV实时处理来自网络摄像机的视频。我希望能够捕获(在处理过程中的任何时间)以前的图像(例如，十秒的值(value))并保存到视频文件中。我目前正在使用队列作为缓冲区(以推送“cv::Mat”数据)来执行此操作，但这显然效率不高，因为几秒钟的图像很快就会用完所有电脑内存。我尝试使用“cv::imencode”压缩图像，但使用PNG并没有太大区别，我需要一个使用硬盘驱动器内存且实时操作高效的解决方案。谁能提出一个非常简单有效的解决方案？编辑:只是为了让大家明白我此刻在做什么；这是10秒缓冲区的代码:voidrun(){cv::VideoCaptureca

c++ - opencv:执行夜视

首先，我不是在谈论真正的夜视。我说的是在光线条件不佳时用于提高画面亮度/光线的技术。您可以在智能手机中完美地看到这种技术，在平板手机中表现出色。我知道这里使用的技术，得到现有的光并用它来使图片清晰。但是如何在opencv中做到这一点？有什么方法或步骤吗？最佳答案基本上有两种方法可以使图像变亮:在相机中获取更多光子赋予每个光子更多的“权重”对于方法1，假设您无法控制照明，那么获得更多光子的唯一方法是将传感器暴露更长时间。这假设您可以更改相机的积分时间。这种方法的缺点是您可以获得更多的运动模糊。对于方法2，这相当于对输入图像应用倍增

c++ - 将 unsigned char * 图像转换为 OpenCV Mat 的问题

我在将来自图像采集卡的图像数据解析为OpenCVMat格式时遇到问题。我可以从我的EDT图像采集卡中获取图像数据作为无符号字符指针，并将其传递给新创建的Mat，但我在此过程中丢失了有值(value)的数据，并且不确定如何修复它。我的相机是红外相机，输出12位320x256拜耳图像。我相当有信心我对EDT的API的使用是正确的。使用EDT的软件“pdvshow”，我可以按预期查看图像数据，但是当我将返回的帧从EDT的API转换为OpenCVMat并显示它时，我丢失了大量数据。当我将Mat设置为CV16UC1时，框架接近黑色，当Mat设置为CV8UC1时，框架显示大部分数据但看起来非常颗粒

c++ - 根据标记点对齐 2 张人脸图像

我正在使用opencv和C++。我有2张面部图像，其中包含标记点。我已经找到了标记点的坐标。现在我需要根据这些坐标对齐这两张人脸图像。这两张图片可能不一定高度相同，这就是为什么我不知道如何开始对齐它们，应该做什么等等。最佳答案在您的情况下，您不能应用基于单应性的对齐程序。为什么不？因为它不适合这个用例。它旨在对齐平面。具有不同位置和深度标记的面(3D对象)显然不是平面。相反，您可以:尝试匹配图像之间的标记，然后插入其他像素的位移场。经典的做法包括movingleastsquares插值或RBF的；否则，一种更“面部处理”的方法是

c++ - 创建多个 Caffe 实例 - C++

我想在单个C++程序中创建多个Caffe实例，以便我可以使用多个GPU，但Caffe似乎是一个单例实例。我可以运行使用Caffe的单独程序，并为每个程序分配一个唯一的GPU。多程序方法不像我从单个程序运行它们那样容易管理。最佳答案 @Apexdev，我正在处理类似的问题。我想在同一个数据集上测试多个模型。以前我曾经使用与您不同的脚本进行测试，现在我可以使用相同的脚本调用所有脚本。这是对我有用的解决方案......头文件:#include第1步:定义一个我们将传递给线程参数的结构Ex.structthread_Arguments{i

c++ - 使用 HTK(隐马尔可夫工具包)的 C/C++ 代码示例

我正在尝试开始使用HTK，我抓了一份，编译它，抓起这本书，一切都或多或少地顺利，偶尔会有一些小问题，但没什么大不了的。现在，在阅读这本书并在谷歌上搜索了一段时间之后，我没有看到任何关于我的重要部分的文档:HTKLib。所有HTK工具程序(可编写脚本的命令行界面工具)的所有内容都被描述为最小的细节，但我找不到如何实际调用库的单个示例或教程。谁能给我指明方向？包括了各个工具的源代码，但是必须通过阅读源代码来提取信誉良好的库的信息是相当麻烦的……我本来希望有更多的文档，但也许我只是忽略了它？非常感谢任何帮助，汤姆编辑:我试图将HTK用于计算机视觉目的，而不是NLP，为此我要求我可以链接它，并

c++ - 如何使用棋盘找到两个摄像机之间的旋转/平移

我正在将opencv与C一起使用，我正在尝试获取2个摄像头之间的外部参数(旋转和平移)。有人告诉我可以使用棋盘格图案进行校准，但我找不到任何好的样本。我该怎么做？编辑给出的建议是用棋盘标定单个相机。给定来自两个View的棋盘图像，您如何找到两个相机之间的旋转和平移？最佳答案我使用的代码来自http://www.starlino.com/opencv_qt_stereovision.html.它有一些有用的信息，作者的代码很容易理解和分析，它涵盖了两者——棋盘校准和从立体相机获取深度图像。我认为它基于thisOpenCVbook

c++ - Matlab/C++ : segmentation fault on parallel computing with C++ Mex persistent objects (cannot convert handle)

本帖引用:[1]http://www.mathworks.com/matlabcentral/newsreader/view_thread/278243“使C++对象在mex调用之间持久化，并且健壮。”[2]MATLABparforandC++classmexwrappers(copyconstructorrequired?)“MATLABparfor和C++类mex包装器(需要复制构造函数？)”我成功地实现了一个Matlab/C++接口(interface)，基于[1]上提出的方法。无论如何，我在尝试将系统与Matlab并行计算一起使用时遇到了麻烦。在MEX接口(interface)

c++ - 相机参数已知时的 OpenCV 图像拼接

我们从一架飞机飞过一个有50%重叠的区域拍摄的照片，并使用OpenCV拼接算法将它们拼接在一起。这适用于我们的版本1。在我们的下一次迭代中，我们想研究一些额外的东西，我可以对此发表一些评论。目前拼接算法估计相机参数。我们确实有相机参数和大量关于相机角度、位置(GPS)等的信息。与让算法根据匹配的特征点估计所有内容相比，我们是否能够从这些信息中受益？这些图像是高分辨率拍摄的，此时算法占用了大量RAM，这不是一个大问题，因为我们只是在云中启动大型机器。但我想在我们的下一次迭代中从下采样图像中提取单应性，然后将其应用于大图像。这也将为我们提供更多选项来操作和可视化原始图像上的其他信息，并能够