卷积和转置卷积矩阵计算 convolution和deconvolution或者transposed_convolution

九是否随机的称呼 2023-04-04 原文

总的来说卷积计算是多对一，也就是多个input，和所有kernel进行multiply+add，通道channel方向也进行add，得到一个数字。转置卷积或者说是逆卷积，是一对多的关系，是一个input和所有kernel进行multiply，通道channel方向才进行add，得到kernel_size_width*kernel_size_height个数字

1d的卷积计算

即滑窗运算，卷积核kernel和Input的位置multiply然后add， K1*1 + K2*2+K3*3 = out1

Stride=2 K1*3+K2*4+K5*3 = out2

2d的卷积计算 padding = 0， stride=1

滑窗

CV computer vision里，卷积的运算通常使用滑窗的方式更好理解，像input等于3x3，stride=1，padding = 0, kernel_size = 2x2的卷积运算

输出大小计算方式是：

output_width = 1 + (width + 2 * padding_width - kernel_size_width)//stride

//是取整的意思

output_height = 1 + (height + 2 * padding_height - kernel_size_height)//stride

所以这里的输出大小是output_width = 1+(3+0*2-2)//1 = 2 output_height = 1+(3+0*2-2)//1 = 2 输出大小是2x2

滑窗的顺序和方向基本可以这样子，从左至右从上到下，在通道channel方向，输出是对应的location coordination进行累加运算，输入的通道数全部加完，就得到一个输出的特征图

矩阵

滑窗运算虽然好理解，但很多在加速运算的时候，不会使用这样的方式，主要的原因是内存不连续，导致不能并行计算，像caffe，卷积计算方式就是将卷积变到矩阵运算，而矩阵运算有很多库实现了快速计算，像mblas等

2d卷积的矩阵运算方式，矩阵是有规律可循的，但是滑窗是不规则的，内存上是不连续的，矩阵可以连续存储，所以矩阵的计算可以在内存上连续进行

以上说的卷积 input等于3x3，stride=1，padding = 0, kernel_size = 2x2

不妨令输出是["11", "12", "21", "22"]

要变到矩阵运算，先要将input变形，使用1d内存存储即可

然后根据参数stride、padding和kernel_size对kernel进行重排得到相应kernel_

4x16 16x1 -> 4x1

对kernel重排的方式，这里可以这样理解，使用output对Input进行求导数

虽说可以这样理解，但实际重排还是要根据stride、padding，所在行或者列来进行排列的

$[[\frac{\Delta11}{\Delta{I11}},\frac{\Delta11}{\Delta{I12}},\frac{\Delta11}{\Delta{I13}},\frac{\Delta11}{\Delta{I21}},\frac{\Delta11}{\Delta{I22}},\frac{\Delta11}{\Delta{I23}},\frac{\Delta11}{\Delta{I31}},\frac{\Delta11}{\Delta{I32}},\frac{\Delta11}{\Delta{I33}}],$

$[\frac{\Delta12}{\Delta{I11}},\frac{\Delta12}{\Delta{I12}},\frac{\Delta12}{\Delta{I13}},\frac{\Delta12}{\Delta{I21}},\frac{\Delta12}{\Delta{I22}},\frac{\Delta12}{\Delta{I23}},\frac{\Delta12}{\Delta{I31}},\frac{\Delta12}{\Delta{I32}},\frac{\Delta12}{\Delta{I33}}],$

$[\frac{\Delta21}{\Delta{I11}},\frac{\Delta21}{\Delta{I12}},\frac{\Delta21}{\Delta{I13}},\frac{\Delta21}{\Delta{I21}},\frac{\Delta21}{\Delta{I22}},\frac{\Delta21}{\Delta{I23}},\frac{\Delta21}{\Delta{I31}},\frac{\Delta21}{\Delta{I32}},\frac{\Delta21}{\Delta{I33}}],$

$[\frac{\Delta22}{\Delta{I11}},\frac{\Delta22}{\Delta{I12}},\frac{\Delta22}{\Delta{I13}},\frac{\Delta22}{\Delta{I21}},\frac{\Delta22}{\Delta{I22}},\frac{\Delta22}{\Delta{I23}},\frac{\Delta22}{\Delta{I31}},\frac{\Delta22}{\Delta{I32}},\frac{\Delta22}{\Delta{I33}}],]$

就可以得到

卷积padding = 1, stride = 2

滑窗

input等于3x3，stride=2，padding = 1, kernel_size = 2x2的卷积运算

根据前面的计算公式，这里的输出大小是output_width = 1+(3+1*2-2)//2 = 2 output_height = 1+(3+1*2-2)//2 = 2 输出大小是2x2

矩阵

由于stride = 2, padding=1, 所以kernel展开的时候要考虑所在的行或者列，以及padding和stride，此时的输入也变到了after padding的input_，计算的公式可以显示出最后的输出仍然是2x2，但计算经过完全不同了

4x25 25x1 -> 4 x1

多个channel的卷积矩阵运算

当不止一个channel进行卷积运算时，像input3x3x9，stride=1，padding = 0, kernel_size = 2x2x9

这里的9就是channel数

此时的滑窗方式就要在channel方向同时进行了，相同的location coordination进行累加即可

关于矩阵此时也可以使用，不过此时的矩阵长和宽都会大很多，主要是kernel矩阵进行了列扩充，以及input矩阵进行了行扩充，最后的输出仍然是2x2

kernel列方向扩充了kernel, 【kernel_channel1<->kernel_channel2<->kernel_channel3<->......】

input矩阵在行方向扩充了 $[input\_channel1, input\_channel2, input\_channel3, ......]^T$

转置卷积或者逆卷积 stride=1，padding = 0

transposed_convolution 2d or deconvolution，是一对多的关系，channel方向的计算仍然是累加

虽然是被叫做转置卷积，但并不能通过转置卷积得到先前的特征图，这里以上面的Output 2x2 作为转置卷积的输入

转置卷积要计算两次输出，一次是临时输出，另一次是去除掉padding以后的输出

第一次临时输出的大小计算公式：

tmp_out_width = (input_width - 1) * stride + kernel_width

tmp_out_height = (input_height - 1)*stride + kernel_height

实际输出的大小计算公式，也就是卷积计算公式的逆求解

out_width = tmp_out_width - 2*padding_width = (input_width - 1) * stride + kernel_width - 2*padding_width

out_height =tmp_out_height - 2*padding_height = (input_height - 1)*stride + kernel_height - 2*padding_height

input等于2x2，stride=1，padding = 0, kernel_size = 2x2

tmp_out_width = (2-1)*1+2 = 3; tmp_out_height = (2-1)*1+2=3

out_width = (2-1)*1+2-0*2=3; out_height = (2-1)*1+2-0*2=3;

这里的tmp_out_width和out_width，以及tmp_out_height和out_height，相等的原因是padding=0

这里首先进行内存malloc，大小是tmp_out_width X tmp_out_height，若是存在偏置bias, 则要进行初始化

这里令bias= 0 ,也就是不存在偏置，以0初始化临时输出

滑窗

这里的计算是一对多，由于stride= 1，所以累加的时候就会出现同个位置多个数值相加

padding = 0, 所以cut_padding的步骤可以省略，输出大小是3x3

矩阵

卷积的矩阵运算是Kernel x input = output，转置卷积顾名思义，将kernel进行转置然后multiply到右侧即可

也就是input = * output, 由于output作为这里的输入，所以可以写作output' = = * input'

这里的转置卷积运算的左侧矩阵是卷积运算左侧矩阵的转置，所以叫做转置矩阵，但当stride!=1或者padding!=0时，就有些不同的地方，可能不完全是转置

转置的卷积padding = 1, stride = 2

input等于2x2，stride=2，padding = 1, kernel_size = 2x2

tmp_out_width = (2-1)*2+2 = 4; tmp_out_height = (2-1)*2+2=4

out_width = (2-1)*1+2-1*2=2; out_height = (2-1)*1+2-1*2=2;

滑窗

这里的计算是一对多，由于stride= 2，kernel_size=2x2，所以累加的时候不会出现重叠的现象，但若是kernel_size=3x3，那么就会出现重叠的现象，此时要进行多个数值累加

padding = 1, 所以cut_padding，输出大小是2x2

这里要进行cut_padding，padding=1x1，所以上侧、下侧、左侧和右侧都要去掉1个格子，输出是2x2

矩阵

这里的Kernel要根据输出的临时特征图4x4，以及stride和padding进行重排顺序，input仍然是1d向量，最后就可以进行矩阵运算，然后cut_padding，得到最后输出2x2

这里和上面的区别在，左侧的矩阵是16x4，并不是25x4，所以当stride!=1, padding!=0时还是存在些区别的

并不完全是转置，转置卷积的kernel重排主要还是要看输出临时特征图的大小来决定

多个channel的转置卷积矩阵运算，和卷积矩阵运算基本类似，可以和之前的对照

总结：

卷积和转置卷积都可以使用滑窗的方式来理解，实际使用也可以这样写codes，这两者也都可以用矩阵运算来实现，加速的实现使用矩阵运算来加速，转置卷积矩阵重排的方式实际要看临时输出矩阵的大小、stride以及padding。

有关卷积和转置卷积矩阵计算 convolution和deconvolution或者transposed_convolution的更多相关文章

旋转矩阵的几何意义 - 2
点向量坐标矩阵的几何意义介绍旋转矩阵的几何含义之前，先介绍一下点向量坐标矩阵的几何含义点：在一维空间下就是一个标量，如同一条直线上，以任意某一个位置为0点，以一定的尺度间隔为1，2，3...,相反方向为-1，-2，-3...；如此就形成了一维坐标系，这时候任何一个点都可以用一个数值表示，如点p1=5，即即从原点出发沿着x轴正方向移动5个尺度；点p2=-3，负方向移动3个尺度；在一维坐标系上过原点做垂直于一维坐标系的直线，则形成了二维坐标系，此时描述一个点需要两个数值来表示点p3=（3，2），即从原点出发沿着x轴正方向移动3个尺度，在此基础上沿着y轴正方向移动两个尺度的位置就是点p3。
华为OD机试真题 C++ 实现【带传送阵的矩阵游离】【2023 Q2 | 200分】 - 2
所有题目均有五种语言实现。C实现目录、C++实现目录、Python实现目录、Java实现目录、JavaScript实现目录题目n行m列的矩阵，每个位置上有一个元素你可以上下左右行走，代价是前后两个位置元素值差的绝对值.另外，你最多可以使用一次传送阵(只能从一个数跳到另外一个相同的数)求从走上角走到右下角最少需要多少时间。输入描述：第一行两个整数n,m，分别代表矩阵的行和列。后面n行，每行m个整数，分别代表矩阵中的元素。输出描述：一个整数，表示最少需要多少时间。
欧拉角表示的姿态矩阵（313和312转序） - 2
一、习惯约定图片来自PSINS（高精度捷联惯导算法）PSINS工具箱入门与详解.pptx二、基本旋转矩阵绕x轴逆时钟旋转α\alphaα角度Rx(α)=[ 1000cos⁡αsin⁡α0−sin⁡αcos⁡α]R_x(\alpha)=\begin{bmatrix}\1&0&0\\0&\cos\alpha&\sin\alpha\\0&-\sin\alpha&\cos\alpha\end{bmatrix}Rx(α)= 1000cosα−sinα0sinαcosα绕y轴逆时钟旋转α\alphaα角度Ry(α)=[ cos⁡α0−sin⁡α010sin⁡α0cos⁡α]R_y(\alpha
欧拉角、旋转矩阵及四元数 - 2
欧拉角、旋转矩阵及四元数1.简介2.欧拉角2.1欧拉角定义2.2右手系和左手系2.3转换流程3.旋转矩阵4.四元数4.1四元数与欧拉角和旋转矩阵之间等效变换4.2测试Matlab代码5.总结1.简介常用姿态参数表达方式包括方向余弦矩阵、欧拉轴/角参数、欧拉角、四元数以及罗德里格参数等。高分辨率光学遥感卫星主要采用欧拉角与四元数对姿态参数进行描述。这里着重讲解欧拉角、旋转矩阵和四元数。2.欧拉角2.1欧拉角定义欧拉角是表征刚体旋转的一种方法之一，由莱昂哈德·欧拉引入的三个角度，用于描述刚体相对于固定坐标系的方向。在摄影测量、空间科学或其它技术领域，一般用一组（三个）欧拉角描述两个空间坐标之间的旋
ruby - 如何修改矩阵(Ruby std-lib Matrix 类)？ - 2
我理解RubystdlibMatrix是不可修改的，也就是说，例如。m=Matrix.zero(3,4)不会写m[0,1]=7但我非常想做...我可以用笨拙的编程来做，比如defmodify_value_in_a_matrix(matrix,row,col,newval)ary=(0...m.row_size).map{|i|m.rowi}.map(&:to_a)ary[row][col]=newvalMatrix[*ary]end...或者作弊，比如Matrix.send:[]=,0,1,7但我想知道，这一定是人们一直遇到的问题。有没有一些标准的、习惯的方法可以做到这一点，而不必使用
线性代数让我想想：快速求三阶矩阵的逆矩阵 - 2
快速求三阶矩阵的逆矩阵前言一般情况下，我们求解伴随矩阵是要注意符号问题和位置问题的（如下所示）A−1=1[ ][−[ ]−[ ]−[ ] −[ ]]=A−1=1[ ][ M11−[M12] M13−[M21] M22−[M23] M31−[M32] M33]⊤\begin{aligned}&A^{-1}=\frac{1}{[\\]}\left[\begin{array}{cccccc}&-[\\]&\\-[\\]&&-[\\]\\\\&-[\\]&\\\end{array}\right]=\\\\&A^{-1}=\frac{1}{[\\]}\left[\b
相机校准—外参矩阵 - 2
在本文中，我们将探讨摄影机的外参，并通过Python中的一个实践示例来加强我们的理解。相机外参摄像头可以位于世界任何地方，并且可以指向任何方向。我们想从摄像机的角度来观察世界上的物体，这种从世界坐标系到摄像机坐标系的转换被称为摄像机外参。那么，我们怎样才能找到相机外参呢？一旦我们弄清楚相机是如何变换的，我们就可以找到从世界坐标系到相机坐标系的基变换的变化。我们将详细探讨这个想法。具体来说，我们需要知道相机是如何定位的，以及它在世界空间中的位置，有两种转换可以帮助我们：有助于确定摄影机方向的旋转变换。有助于移动相机的平移变换。让我们详细看看每一个。旋转通过旋转改变坐标让我们看一下将点旋转一个角度
ruby - 应该 validate_format_of 。 not_with 在框架中有问题(或者在我的理解中) - 2
我将以下代码放入RSpec测试中:it{shouldvalidate_format_of(:email).not_with('test@test')}并设置实际的类:validates:email,:presence=>true,:format=>/\b[A-Z0-9._%-]+@(?:[A-Z0-9-]+\.)+[A-Z]{2,4}\b/i当我运行测试时，我得到:失败:1)用户失败/错误:它{应该validate_format_of(:email).not_with('test@test')}当电子邮件设置为“test@test”时，预期错误包括“can'tbeblank”，得到错误
Ruby 等同于 C#'s ' yield' 关键字，或者，在不预分配内存的情况下创建序列 - 2
在C#中，您可以这样做:publicIEnumerableGetItems(){for(inti=0;i这将返回一个包含1000万个整数的可枚举序列，而无需在该长度的内存中分配一个集合。有没有一种方法可以在Ruby中做同样的事情？我要处理的具体示例是将矩形数组展平为要枚举的值序列。返回值不必是Array或Set，而是某种只能按顺序而不是索引迭代/枚举的序列。因此，整个序列不需要同时分配到内存中。在.NET中，这是IEnumerable和IEnumerable.对Ruby世界中此处使用的术语的任何澄清都会有所帮助，因为我更熟悉.NET术语。编辑也许我最初的问题还不够清楚——我认为yiel
ruby-on-rails - 你可以用ruby重新定义一个类吗？或者这只是在 irb - 2
我启动了irb，然后输入:类点结束然后我再次输入，但添加了一些其他内容。Irb没有提示我正在定义一个已经存在的类。最佳答案其实你并没有重新定义Point类，你重新打开了它。一个小代码片段来说明差异:classPointdeffooendendclassPointdefbarendend现在Point有两个方法:foo和bar。所以Point的第二个定义并没有取代之前的定义，而是添加了它。这在ruby脚本和irb中都是可能的(标准库中的类也是可能的，而不仅仅是您自己的类)。也可以真正重新定义类，通过使用remove_const

卷积和转置卷积矩阵计算 convolution和deconvolution或者transposed_convolution

1d的卷积计算

​2d的卷积计算 padding = 0， stride=1

滑窗

矩阵

卷积padding = 1, stride = 2

滑窗

矩阵

多个channel的卷积矩阵运算

​转置卷积或者逆卷积 stride=1，padding = 0

滑窗

矩阵

​转置的卷积padding = 1, stride = 2

滑窗

矩阵

总结：

有关卷积和转置卷积矩阵计算 convolution和deconvolution或者transposed_convolution的更多相关文章

随机推荐

2d的卷积计算 padding = 0， stride=1

转置卷积或者逆卷积 stride=1，padding = 0

转置的卷积padding = 1, stride = 2