草庐IT

相机校准—外参矩阵

woshicver 2025-06-30 原文


在本文中,我们将探讨摄影机的外参,并通过Python中的一个实践示例来加强我们的理解。

相机外参

摄像头可以位于世界任何地方,并且可以指向任何方向。我们想从摄像机的角度来观察世界上的物体,这种从世界坐标系到摄像机坐标系的转换被称为摄像机外参。


那么,我们怎样才能找到相机外参呢?一旦我们弄清楚相机是如何变换的,我们就可以找到从世界坐标系到相机坐标系的基变换的变化。我们将详细探讨这个想法。

具体来说,我们需要知道相机是如何定位的,以及它在世界空间中的位置,有两种转换可以帮助我们:

  • 有助于确定摄影机方向的旋转变换。

  • 有助于移动相机的平移变换。

让我们详细看看每一个。

旋转

通过旋转改变坐标

让我们看一下将点旋转一个角度的变换。让我们举一个在ℝ²的简单例子,对点𝑃逆时针旋转角度𝜃 得到点𝑃′, 如下图所示:


𝑃的坐标是(𝑥,𝑦) 以及𝑃′的坐标是(𝑥′,𝑦′). 我们需要找到(𝑥′,𝑦′).

从图来看,
      sinα = y/r , cosα = x/r − [1]
⟹    xsinα = ycosα − [2]
同样的, x′ = rcos(θ+α)
⟹    x′ = (x/cosα) ∗ cos(θ+α) (from [1])
但,  cos(θ+α) = cosθcosα − sinθsinα
⟹    x′ = (x/cosα) ∗ (cosθcosα − sinθsinα)
⟹    x′ = xcosθ − xsinα ∗ (sinθ / cosα)
⟹    x′ = xcosθ − ycosα ∗ (sinθ / cosα) (from [2])
⟹    x′ = xcosθ − ysinθ

同样地,
      y′ = rsin(θ+α)
⟹    y′ = (y/sinα) ∗ sin(θ+α) (from [1])
但,  sin(θ+α) = sinθcosα + cosθsinα
⟹    y′ = (y/sinα) ∗ (sinθcosα + cosθsinα)
⟹    y′ = ycosθ + ycosα ∗ (sinθ / sinα)
⟹    y′ = ycosθ + xsinα ∗ (sinθ / sinα) (from [2])
⟹    y′ = ycosθ + xsinθ
⟹    y′ = xsinθ + ycosθ

因此我们有,
      x′ = xcosθ − ysinθ
      y′ = xsinθ + ycosθ

旋转是一种线性运算,上述方程可以表示为矩阵乘法:


这个操作是一个线性变换。

扩展到R3

我们可以很容易地将旋转变换扩展到𝐑³. 旋转的变换矩阵𝐑关于标准X轴、Y轴和Z轴,如下所示:

绕Z轴旋转:


绕X轴旋转:


绕Y轴旋转:


内参旋转与外参旋转

上述变换围绕标准轴执行旋转。轴将随时固定。这就是所谓的外参旋转。还有另一种类型的旋转称为内参旋转,我们在每一步都围绕其相对轴旋转对象,如下所示:


内参旋转很难用欧几里德代数来实现,我们将坚持外参旋转。

基变换

在基变换中,我们的目标是在新的基上找到点的坐标。

在下面的示例中𝑋𝑌 轴已经旋转了一个角度𝜃 得到𝑋′𝑌′. 给定在原有XY轴下点𝑃的坐标 , 我们的目标是找到在新轴𝑋′𝑌′下点𝑃的坐标 .


XY下点P的坐标是(x,y) ,新轴X'Y'下是(𝑥′, 𝑦′). 我们的目标是找到(𝑥′, 𝑦′).

从这个图来看,
      sinα = y′/r , cosα = x′/r − [1]
⟹    x′sinα = y′cosα − [2]
同样, x = rcos(θ+α)
⟹    x = (x′/cosα) ∗ cos(θ+α) (from [1])
但,  cos(θ+α) = cosθcosα − sinθsinα
⟹    x = (x′ / cosα) ∗ (cosθcosα − sinθsinα)
⟹    x = x′cosθ − xsinα ∗ (sinθ / cosα)
⟹    x = x′cosθ − y′cosα ∗ (sinθ / cosα) (from [2])
⟹    x = x′cosθ − y′sinθ

同样地,
      y = rsin(θ+α)
⟹    y = (y′/sinα) ∗ sin(θ+α) (from [1])
但,  sin(θ+α) = sinθcosα + cosθsinα
⟹    y = (y′/sinα) ∗ (sinθcosα + cosθsinα)
⟹    y = y′cosθ + y′cosα ∗ (sinθ / sinα)
⟹    y = y′cosθ + x′sinα ∗ (sinθ / sinα) (from [2])
⟹    y = y′cosθ + x′sinθ
⟹    y = x′sinθ + y′cosθ

因此我们有,
      x = x′cosθ − y′sinθ
      y = x′sinθ + y′cosθ

上述方程式可以矩阵形式表示为:


我们的目标是找到(𝑥′,𝑦′). 因此,我们将矩阵移到另一侧,取其逆:


理解线性变换和基变换变化之间的区别非常重要。

接下来我们将看到这两种转换是如何关联的。

线性变换与基变换的关系

如果你观察,基矩阵的变化是线性变换矩阵的逆。这意味着,如果我们知道摄像机变换矩阵,即在世界上负责旋转和移动摄像机的矩阵,我们可以取其逆矩阵,这可以帮助我们找到摄像机上点的坐标。

平移

通过平移改变坐标

平移的想法很简单——只要有一点𝑃, 我们移动它一个偏移量来得到点𝑃′ 如下图所示:


在这里,我们移动点𝑃 坐标(𝑥, 𝑦) ,偏移量为(−𝑎, 𝑏) ,得到点𝑃′ (𝑥′, 𝑦′).。我们的目标是找到(𝑥′, 𝑦′).

从这个图来看,
      x′ = x - a
      y′ = y + b

我们不能将上述方程表示为矩阵乘法——至少不能用它们当前的表示形式。

诀窍是增加一个额外的维度,然后我们可以将平移表示为线性变换,如下所示:


用额外维度表示的坐标称为齐次坐标。

为了从齐次坐标中得到欧几里德坐标,我们只需除以最后一个元素,如下所示:

[x, y, 1] ≅ [x/1, y/1] = [x, y]

通常,我们在齐次空间中执行所有操作,因为这很容易处理,最后,当我们完成时,我们转换回欧几里德空间。稍后我们将看到更多细节。

通过平移改变基

就像我们之前看到的,在基变换的变化中,我们变换轴而不是点。在下面的示例中,我们移动𝑋𝑌 坐标轴偏移以获得𝑋′𝑌′. 我们的目标是找到𝑋′𝑌′下的点𝑃的坐标.


旧轴XY下P的坐标是(x,y),新轴𝑋′𝑌′ 下P的坐标(𝑥′,𝑦′). 这里的偏移量是(𝑎, 𝑏).

从图上看,
      x′ = x - a
      y′ = y - b

同样,为了将上述方程表示为矩阵乘法,我们使用齐次坐标:


即使在平移中,线性变换和基变换的变化也是相反的。

摄像机外参矩阵

我们分别研究了旋转和平移;然而,我们可以使用如下所示的矩阵组合一次性执行这两个操作:


在这里𝑅 是旋转矩阵,形状是(3,3)和𝑂 是偏移量矩阵,形状是(3,1)。

通过求最终变换矩阵的逆,可以得到基矩阵的变化。我们称这个矩阵是摄像机外参矩阵E,形状是(4,4)

使用𝐸, 我们可以找到相机上任何一点的坐标。


自由度

相机外参矩阵自由度是6。三个旋转角度和沿X、Y、Z轴的三个偏移。

简化矩阵

我们可以看到相机外参矩阵的最后一行是0和1。它不会给转换增加任何价值,它的唯一目的是增加一个额外的维度——这意味着,正如我们将在下面的示例中看到的,我们可以删除最后一行。

实例

我们举一个实际操作的例子!

设置

包含所有代码的GitHub存储库可以在这里找到。

https://github.com/wingedrasengan927/Image-formation-and-camera-calibration

可以通过运行以下命令来设置环境:

# create a virtual environment in anaconda
conda create -n camera-calibration-python python=3.6 anaconda
conda activate camera-calibration-python

# clone the repository and install dependencies
git clone https://github.com/wingedrasengan927/Image-formation-and-camera-calibration.git
cd Image-formation-and-camera-calibration
pip install -r requirements.txt

注意:这假设你已经安装了anaconda。

我们将使用两个主要的库:

  • pytransform3d:这个库进行三维空间中的可视化和转换。

  • ipympl:它使matplotlib绘图具有交互性。

实例直觉

在本例中,我们将首先创建旋转和平移的变换矩阵,将它们组合成一个矩阵,并使用它来变换相机。

然后,我们将通过对变换矩阵求逆来创建基矩阵的变化,并将其应用于一个点,并将其坐标从世界帧更改为相机帧。

下面是示例的笔记本,也可以在存储库中找到。

https://github.com/wingedrasengan927/Image-formation-and-camera-calibration

%matplotlib widget

import matplotlib.pyplot as plt
from utils import *

创建转换矩阵

# rotate an angle of pi/4 along the standard Y axis
angles = [np.pi/4]
order = 'y'

# transalte by the given offset
offset = np.array([0, -8, 0])

# define parameters for the image plane
f = 2
img_size = (7, 7)
# create rotation transformation matrix
R = create_rotation_transformation_matrix(angles, order)
R_ = np.identity(4)
R_[:3, :3] = R

# create translation transformation matrix
T_ = create_translation_matrix(offset)
R_, T_
(array([[ 0.70710678,  0.        , -0.70710678,  0.        ],
        [ 0.        ,  1.        ,  0.        ,  0.        ],
        [ 0.70710678,  0.        ,  0.70710678,  0.        ],
        [ 0.        ,  0.        ,  0.        ,  1.        ]]),
 array([[ 1.,  0.,  0.,  0.],
        [ 0.,  1.,  0., -8.],
        [ 0.,  0.,  1.,  0.],
        [ 0.,  0.,  0.,  1.]]))

转换并绘制

# create an image grid
xx, yy, Z = create_image_grid(f, img_size)

# convert the image grid to homogeneous coordinates
pt_h = convert_grid_to_homogeneous(xx, yy, Z, img_size)

# transform the homogeneous coordinates
pt_h_transformed = R_ @ T_ @ pt_h

# convert the transformed homogeneous coordinates back to the image grid
xxt, yyt, Zt = convert_homogeneous_to_grid(pt_h_transformed, img_size)
# define axis and figure
fig = plt.figure(figsize=(6, 4))
ax = fig.add_subplot(111,projection='3d')

# set limits
ax.set(xlim=(-10, 5), ylim=(-15, 5), zlim=(0, 10))

# plot the global basis and the transformed camera basis
ax = pr.plot_basis(ax)
ax = pr.plot_basis(ax, R, offset)

# plot the original and transformed image plane
ax.plot_surface(xx, yy, Z, alpha=0.75)
ax.plot_surface(xxt, yyt, Zt, alpha=0.75)

ax.set_title("camera transformation")
ax.set_xlabel("X-axis")
ax.set_ylabel("Y-axis")
ax.set_zlabel("Z-axis")
Text(0.5, 0, 'Z-axis')


创建基的变换矩阵

E = np.linalg.inv(R_ @ T_)
# remove last row of E
E = E[:-1, :]

进行坐标变换

cw = np.array([-1/np.sqrt(2), -8, 1/np.sqrt(2), 1]) # homogeneous coordinates of the point wrt the world
cc = E @ cw.reshape(4, 1) # coordinates of the point wrt the camera
cc = cc.flatten()
cc
array([0., 0., 1.])

让我们一步一步地分解:

  • 首先,我们导入必要的库。utils.py文件包含所有必要的帮助函数。%matplotlib widget启用了ipympl后端,使我们能够使用绘图。

  • 接下来,我们定义必要的参数,如角度、旋转顺序、平移偏移、焦距和图像平面的大小。焦距和图像平面仅用于演示目的,我们将在下一篇文章中详细讨论它们。

  • 在这里,我们保持简单,关于标准Y轴旋转𝜋/4。然而,我们可以围绕任何轴进行任意数量的旋转。注意旋转的顺序。我们的平移偏移量是[0,-8,0],沿Y轴8个单位。

  • 使用这些参数,我们为旋转和平移创建变换矩阵。

  • 接下来,我们使用变换矩阵转换最初位于原点的相机并绘制它。多亏了ipympl,图表是互动的。试着摆弄一下图表,用不同的视角来观看。


  • 接下来,我们通过对变换矩阵求逆来创建基矩阵的变化,即相机外参矩阵。

  • 最后,我们取一个世界坐标[-1/√2, -8, 1/√2],然后应用基变换的变化,得到相机的坐标为[0, 0, 1]。这是有意义的,因为该点位于相机Z轴的正上方。

感谢阅读!

参考引用

计算机视觉导论——Udacity:https://classroom.udacity.com/courses/ud810

☆ END ☆

如果看到这里,说明你喜欢这篇文章,请转发、点赞。微信搜索「uncle_pn」,欢迎添加小编微信「 woshicver」,每日朋友圈更新一篇高质量博文。

扫描二维码添加小编↓

☆ END ☆

如果看到这里,说明你喜欢这篇文章,请转发、点赞。微信搜索「uncle_pn」,欢迎添加小编微信「 woshicver」,每日朋友圈更新一篇高质量博文。

扫描二维码添加小编↓

有关相机校准—外参矩阵的更多相关文章

  1. 旋转矩阵的几何意义 - 2

    点向量坐标矩阵的几何意义介绍旋转矩阵的几何含义之前,先介绍一下点向量坐标矩阵的几何含义点:在一维空间下就是一个标量,如同一条直线上,以任意某一个位置为0点,以一定的尺度间隔为1,2,3...,相反方向为-1,-2,-3...;如此就形成了一维坐标系,这时候任何一个点都可以用一个数值表示,如点p1=5,即即从原点出发沿着x轴正方向移动5个尺度;点p2=-3,负方向移动3个尺度;     在一维坐标系上过原点做垂直于一维坐标系的直线,则形成了二维坐标系,此时描述一个点需要两个数值来表示点p3=(3,2),即从原点出发沿着x轴正方向移动3个尺度,在此基础上沿着y轴正方向移动两个尺度的位置就是点p3。

  2. [工业相机] 分辨率、精度和公差之间的关系 - 2

    📢博客主页:https://blog.csdn.net/weixin_43197380📢欢迎点赞👍收藏⭐留言📝如有错误敬请指正!📢本文由Loewen丶原创,首发于CSDN,转载注明出处🙉📢现在的付出,都会是一种沉淀,只为让你成为更好的人✨文章预览:一.分辨率(Resolution)1、工业相机的分辨率是如何定义的?2、工业相机的分辨率是如何选择的?二.精度(Accuracy)1、像素精度(PixelAccuracy)2、定位精度和重复定位精度(RepeatPrecision)三.公差(Tolerance)四.课后作业(Post-ClassExercises)视觉行业的初学者,甚至是做了1~2年

  3. 华为OD机试真题 C++ 实现【带传送阵的矩阵游离】【2023 Q2 | 200分】 - 2

            所有题目均有五种语言实现。C实现目录、C++实现目录、Python实现目录、Java实现目录、JavaScript实现目录题目n行m列的矩阵,每个位置上有一个元素你可以上下左右行走,代价是前后两个位置元素值差的绝对值.另外,你最多可以使用一次传送阵(只能从一个数跳到另外一个相同的数)求从走上角走到右下角最少需要多少时间。输入描述:第一行两个整数n,m,分别代表矩阵的行和列。后面n行,每行m个整数,分别代表矩阵中的元素。输出描述:一个整数,表示最少需要多少时间。

  4. 欧拉角表示的姿态矩阵(313和312转序) - 2

    一、习惯约定图片来自PSINS(高精度捷联惯导算法)PSINS工具箱入门与详解.pptx二、基本旋转矩阵绕x轴逆时钟旋转α\alphaα角度Rx(α)=[ 1000cos⁡αsin⁡α0−sin⁡αcos⁡α]R_x(\alpha)=\begin{bmatrix}\1&0&0\\0&\cos\alpha&\sin\alpha\\0&-\sin\alpha&\cos\alpha\end{bmatrix}Rx​(α)=​ 100​0cosα−sinα​0sinαcosα​​绕y轴逆时钟旋转α\alphaα角度Ry(α)=[ cos⁡α0−sin⁡α010sin⁡α0cos⁡α]R_y(\alpha

  5. 欧拉角、旋转矩阵及四元数 - 2

    欧拉角、旋转矩阵及四元数1.简介2.欧拉角2.1欧拉角定义2.2右手系和左手系2.3转换流程3.旋转矩阵4.四元数4.1四元数与欧拉角和旋转矩阵之间等效变换4.2测试Matlab代码5.总结1.简介常用姿态参数表达方式包括方向余弦矩阵、欧拉轴/角参数、欧拉角、四元数以及罗德里格参数等。高分辨率光学遥感卫星主要采用欧拉角与四元数对姿态参数进行描述。这里着重讲解欧拉角、旋转矩阵和四元数。2.欧拉角2.1欧拉角定义欧拉角是表征刚体旋转的一种方法之一,由莱昂哈德·欧拉引入的三个角度,用于描述刚体相对于固定坐标系的方向。在摄影测量、空间科学或其它技术领域,一般用一组(三个)欧拉角描述两个空间坐标之间的旋

  6. ruby - 如何修改矩阵(Ruby std-lib Matrix 类)? - 2

    我理解RubystdlibMatrix是不可修改的,也就是说,例如。m=Matrix.zero(3,4)不会写m[0,1]=7但我非常想做...我可以用笨拙的编程来做,比如defmodify_value_in_a_matrix(matrix,row,col,newval)ary=(0...m.row_size).map{|i|m.rowi}.map(&:to_a)ary[row][col]=newvalMatrix[*ary]end...或者作弊,比如Matrix.send:[]=,0,1,7但我想知道,这一定是人们一直遇到的问题。有没有一些标准的、习惯的方法可以做到这一点,而不必使用

  7. 线性代数让我想想:快速求三阶矩阵的逆矩阵 - 2

    快速求三阶矩阵的逆矩阵前言一般情况下,我们求解伴随矩阵是要注意符号问题和位置问题的(如下所示)A−1=1[  ][−[  ]−[  ]−[  ]  −[  ]]=A−1=1[  ][   M11−[M12]   M13−[M21]   M22−[M23]     M31−[M32]   M33]⊤\begin{aligned}&A^{-1}=\frac{1}{[\\]}\left[\begin{array}{cccccc}&-[\\]&\\-[\\]&&-[\\]\\\\&-[\\]&\\\end{array}\right]=\\\\&A^{-1}=\frac{1}{[\\]}\left[\b

  8. 相机校准—外参矩阵 - 2

    在本文中,我们将探讨摄影机的外参,并通过Python中的一个实践示例来加强我们的理解。相机外参摄像头可以位于世界任何地方,并且可以指向任何方向。我们想从摄像机的角度来观察世界上的物体,这种从世界坐标系到摄像机坐标系的转换被称为摄像机外参。那么,我们怎样才能找到相机外参呢?一旦我们弄清楚相机是如何变换的,我们就可以找到从世界坐标系到相机坐标系的基变换的变化。我们将详细探讨这个想法。具体来说,我们需要知道相机是如何定位的,以及它在世界空间中的位置,有两种转换可以帮助我们:有助于确定摄影机方向的旋转变换。有助于移动相机的平移变换。让我们详细看看每一个。旋转通过旋转改变坐标让我们看一下将点旋转一个角度

  9. ruby - Ruby 中的有限矩阵 - 2

    为什么Matrix类没有方法来编辑它的向量和组件?似乎矩阵中的所有内容都可以读取但不能写入。我错了吗?是否有一些类似于Matrix的第三方优雅类允许我删除行并有意地编辑它们?如果没有这样的类(class),请通知我——我将停止搜索。 最佳答案 Matrix类的设计者一定是不可变数据结构和函数式编程的爱好者。是的,你是对的。无论如何,总有一个简单的解决方案可以满足您的需求。使用Matrix它可以做的事情,然后,只需使用.to_a来获得一个真正的数组。>>Matrix.identity(2).to_a=>[[1,0],[0,1]]另见N

  10. 有仰拍相机和俯拍相机时,俯拍相机中心和吸嘴中心的标定 - 2

    俯拍相机中心和吸嘴中心的标定文章目录俯拍相机中心和吸嘴中心的标定前言适用模型如下:一、使用一个标定片进行标定1.关键注意:2.标定步骤:二、使用一个L型的工件1.关键注意:2.标定步骤:总结前言在自动化设备领域,使用相机进行定位是很普遍存在的,而使用相机定位就必定会用到标定,本文介绍两种关于吸嘴上方的俯拍相机和吸嘴中心的标定方法(前提是带有仰拍相机和俯拍相机)。【还有很多相机的使用场景的标定方法将在以后的文章中进行阐述】适用模型如下:一、使用一个标定片进行标定1.关键注意:关键是使用两个相机的中心和识别偏差,得到两个相机的中心固定偏差。注:后续俯拍相机拍物料识别得到的偏差以吸嘴中心在俯拍相机中

随机推荐