草庐IT

半正定Toeplitz矩阵的范德蒙德分解

Turbo-shengsong 2024-02-10 原文

半正定Toeplitz矩阵的范德蒙德分解

Toeplitz矩阵定义:Matrices whose entries are constant along each diagonal are called Toeplitz matrices.
形如
T = [ r 0 r 1 r 2 r 3 r − 1 r 0 r 1 r 2 r − 2 r − 1 r 0 r 1 r − 3 r − 2 r − 1 r 0 ] (1) \boldsymbol{T}=\left[ \begin{matrix} r_0& r_1& r_2& r_3\\ r_{-1}& r_0& r_1& r_2\\ r_{-2}& r_{-1}& r_0& r_1\\ r_{-3}& r_{-2}& r_{-1}& r_0\\ \end{matrix} \right] \tag{1} T=r0r1r2r3r1r0r1r2r2r1r0r1r3r2r1r0(1)

半正定的Toeplitz矩阵:Positive-Semi-Definite Toeplitz, PSD
形如
T = [ r 0 r 1 r 2 r 3 r 1 ∗ r 0 r 1 r 2 r 2 ∗ r 1 ∗ r 0 r 1 r 3 ∗ r 2 ∗ r 1 ∗ r 0 ] ,     T ≽ 0 (2) \boldsymbol{T}=\left[ \begin{matrix} r_0& r_1& r_2& r_3\\ r_{1}^{*}& r_0& r_1& r_2\\ r_{2}^{*}& r_{1}^{*}& r_0& r_1\\ r_{3}^{*}& r_{2}^{*}& r_{1}^{*}& r_0\\ \end{matrix} \right] , \ \ \ \boldsymbol{T} \succcurlyeq \boldsymbol 0 \tag{2} T=r0r1r2r3r1r0r1r2r2r1r0r1r3r2r1r0,   T0(2)
其中 T ≽ 0 \boldsymbol{T} \succcurlyeq \boldsymbol 0 T0表示 T \boldsymbol{T} T是半正定矩阵。

定理半正定Toeplitz矩阵的范德蒙德分解
Any PSD Toeplitz matrix T ( u ) ∈ C N × N \boldsymbol T(\boldsymbol u) \in \mathbb C^{N \times N} T(u)CN×N of rank r ≤ N r \leq N rN admits the following r-atomic Vandermonde decomposition:
T = ∑ k = 1 r p k a ( f k ) a H ( f k ) = A ( f ) d i a g ( p ) A H ( f ) (3) \boldsymbol T = \sum_{k=1}^r p_k \boldsymbol a (f_k) \boldsymbol a^H(f_k) = \boldsymbol A( \boldsymbol f ) diag(\boldsymbol p) \boldsymbol A^H( \boldsymbol f ) \tag{3} T=k=1rpka(fk)aH(fk)=A(f)diag(p)AH(f)(3)
where p k > 0 p_k >0 pk>0, and f k ∈ T f_k \in \mathbb T fkT, T = ( − 1 2 , 1 2 ] \mathbb T=(-\frac{1}{2}, \frac{1}{2}] T=(21,21] k = 1 , 2 , ⋯   , r k=1,2,\cdots,r k=1,2,,r are distinct. Moreover, the decompostion above is unique if r < N r < N r<N.
其中
a ( f ) = [ 1 , e i 2 π f , ⋯   , e i 2 π ( N − 1 ) f ] T ∈ C N × 1 \boldsymbol a(f) = [1, e^{i 2 \pi f}, \cdots, e^{i 2 \pi (N-1) f} ]^T \in \mathbb C^{N \times 1} a(f)=[1,ei2πf,,ei2π(N1)f]TCN×1

证明
(1)首先考虑 r = rank ( T ) ≤ N − 1 r=\text{rank}(\boldsymbol T) \leq N - 1 r=rank(T)N1的情况
因为 T ≽ 0 \boldsymbol T \succcurlyeq 0 T0,因此存在 V ∈ C N × r \boldsymbol V \in \mathbb C^{N \times r} VCN×r满足: T = V V H \boldsymbol T= \boldsymbol {VV}^H T=VVH
V − N \boldsymbol V_{-N} VN V \boldsymbol V V去掉第 N N N行(最后一行)的矩阵: V − N ∈ C ( N − 1 ) × r \boldsymbol V_{-N} \in \mathbb{C}^{(N-1) \times r} VNC(N1)×r
V − 1 \boldsymbol V_{-1} V1 V \boldsymbol V V去掉第 1 1 1行(第一行)的矩阵: V − 1 ∈ C ( N − 1 ) × r \boldsymbol V_{-1} \in \mathbb{C}^{(N-1) \times r} V1C(N1)×r
因为半正定Toeplitz矩阵的特殊结构,必然有: V − N V − N H = V − 1 V − 1 H \boldsymbol V_{-N} \boldsymbol V^H_{-N}=\boldsymbol V_{-1} \boldsymbol V^H_{-1} VNVNH=V1V1H (下图给了一个直观解释, V − N V − N H \boldsymbol V_{-N} \boldsymbol V^H_{-N} VNVNH对应红色方框中的矩阵, V − 1 V − 1 H \boldsymbol V_{-1} \boldsymbol V^H_{-1} V1V1H对应绿色方框中的矩阵,两者是一样的)

因此,一定存在某个酉阵 Q ∈ C r × r \boldsymbol Q \in \mathbb C^{r \times r} QCr×r,使得 V − 1 = V − N Q \boldsymbol V_{-1} = \boldsymbol V_{-N} \boldsymbol Q V1=VNQ,据此我们可以进一步得到(=> it follows that) V j , : = V 1 , : Q j − 1 , j = 2 , ⋯   , N \boldsymbol V_{j,:}=\boldsymbol V_{1,:} \boldsymbol Q^{j-1},j=2,\cdots,N Vj,:=V1,:Qj1,j=2,,N,因此
u j = V 1 , : ( V j , : ) T = V 1 , : ( Q j − 1 ) H ( V 1 , : ) H = V 1 , : Q 1 − j ( V 1 , : ) H (4) \begin{aligned} u_j &= \boldsymbol V_{1,:} (\boldsymbol V_{j,:}) ^T \\ &= \boldsymbol V_{1,:} (\boldsymbol Q^{j-1})^H (\boldsymbol V_{1,:})^H \\ &= \boldsymbol V_{1,:} \boldsymbol Q^{1-j} (\boldsymbol V_{1,:})^H \end{aligned} \tag{4} uj=V1,:(Vj,:)T=V1,:(Qj1)H(V1,:)H=V1,:Q1j(V1,:)H(4)

我们可以将 Q ∈ C r × r \boldsymbol Q \in \mathbb C^{r \times r} QCr×r特征分解为(注意 Q \boldsymbol Q Q是酉阵,特征分解必然存在):
Q = Q ~ d i a g ( z 1 , z 2 , ⋯   , z r ) Q ~ H (5) \boldsymbol Q = \tilde{\boldsymbol Q} diag(z_1, z_2, \cdots, z_r) \tilde{\boldsymbol Q}^H \tag{5} Q=Q~diag(z1,z2,,zr)Q~H(5)

其中 Q ~ ∈ C r × r \tilde{\boldsymbol Q} \in \mathbb C^{r \times r} Q~Cr×r是酉阵。因为酉阵的特征值的模都等于1,因此我们可以找到 f k ∈ T , k = 1 , 2 , ⋯   , r f_k \in \mathbb T, k= 1,2,\cdots,r fkT,k=1,2,,r满足 z k = e i 2 π f k , k = 1 , 2 , ⋯   , r z_k=e^{i 2 \pi f_k}, k=1,2,\cdots,r zk=ei2πfk,k=1,2,,r。令 p k = ∣ V 1 , : Q ~ : , k ∣ 2 > 0 , k = 1 , ⋯   , r p_k = \vert \boldsymbol V_{1,:} \tilde{\boldsymbol Q}_{:,k} \vert^2 > 0, k =1,\cdots,r pk=V1,:Q~:,k2>0,k=1,,r,将式(5)代入式(4),我们得到
u j = V 1 , : Q ~ d i a g ( z 1 , z 2 , ⋯   , z r ) 1 − j Q ~ H ( V 1 , : ) H = ∑ k = 1 r p k z k 1 − j = ∑ k = 1 r p k e − i 2 π ( j − 1 ) f k (6) \begin{aligned} u_j &= \boldsymbol V_{1,:} \tilde{\boldsymbol Q} diag(z_1, z_2, \cdots, z_r)^{1-j} \tilde{\boldsymbol Q}^H (\boldsymbol V_{1,:})^H \\ &= \sum_{k=1}^r p_k z_k^{1-j} \\ &= \sum_{k=1}^r p_k e^{-i 2 \pi (j-1) f_k} \end{aligned} \tag{6} uj=V1,:Q~diag(z1,z2,,zr)1jQ~H(V1,:)H=k=1rpkzk1j=k=1rpkei2π(j1)fk(6)

由此可以得出式(3)是成立的。另外, f k 1 ≠ f k 2 , k 1 ≠ k 2 f_{k_1} \neq f_{k_2}, k_1 \neq k_2 fk1=fk2,k1=k2,否则 rank ( T ) < r \text{rank}(\boldsymbol T) < r rank(T)<r(与假设矛盾)。

(2)然后考虑 r = rank ( T ) = N r=\text{rank}(\boldsymbol T) = N r=rank(T)=N的情况
这时, T ≻ 0 \boldsymbol T \succ 0 T0。我们随机地选 f N ∈ T f_N \in \mathbb T fNT,并且令 p N = ( a H ( f N ) T − 1 a ( f N ) ) p_N= { \left ( \boldsymbol a^H(f_N) \boldsymbol T^{-1} \boldsymbol a (f_N) \right ) } pN=(aH(fN)T1a(fN))。另外,我们定义一个新的向量 u ′ ∈ C N × 1 \boldsymbol u^{\prime} \in \mathbb C^{N \times 1} uCN×1
u j ′ = u j − p N e − i 2 π ( j − 1 ) f N u^{\prime}_j = u_j - p_N e^{-i 2 \pi (j-1) f_N} uj=ujpNei2π(j1)fN

可以被证明:
T ( u ′ ) = T ( u ) − p N a ( f N ) a H ( f N ) T ( u ′ ) ≽ 0 rank ( T ( u ′ ) ) = N − 1 \begin{aligned} \boldsymbol T(\boldsymbol u^{\prime}) &= \boldsymbol T(\boldsymbol u) - p_N \boldsymbol a (f_N) \boldsymbol a^H(f_N) \\ \boldsymbol T(\boldsymbol u^{\prime}) & \succcurlyeq \boldsymbol 0 \\ \text{rank} \left ( \boldsymbol T(\boldsymbol u^{\prime}) \right ) &= N-1 \end{aligned} T(u)T(u)rank(T(u))=T(u)pNa(fN)aH(fN)0=N1

因此, T ( u ′ ) \boldsymbol T(\boldsymbol u^{\prime}) T(u)满足第一种 r ≤ N − 1 r \leq N-1 rN1的情况。因此,当 r = N r=N r=N时,分解并不唯一。

最后我们来证明 r ≤ N − 1 r \leq N-1 rN1时分解的唯一性,如果假设存在另一种分解形式: T = A ( f ′ ) P ′ A H ( f ′ ) ,   p j ′ > 0 \boldsymbol T = \boldsymbol A(f^{\prime}) \boldsymbol P^{\prime} \boldsymbol A^H(f^{\prime}), \ p^{\prime}_j > 0 T=A(f)PAH(f), pj>0,且 f j ′ ∈ T f_j^{\prime} \in \mathbb T fjT各不相同,这时,我们有
A ( f ′ ) P ′ A H ( f ′ ) = A ( f ) P A H ( f ) \boldsymbol A(f^{\prime}) \boldsymbol P^{\prime} \boldsymbol A^H(f^{\prime}) = \boldsymbol A( \boldsymbol f ) \boldsymbol P \boldsymbol A^H( \boldsymbol f ) A(f)PAH(f)=A(f)PAH(f)

那么,存在一个酉阵 Q ′ ∈ C r × r \boldsymbol Q^{\prime} \in \mathbb C^{r \times r} QCr×r 使得 A ( f ′ ) P ′ 1 2 = A ( f ) P 1 2 Q ′ \boldsymbol A(f^{\prime}) \boldsymbol P^{\prime \frac{1}{2}}=\boldsymbol A( \boldsymbol f ) \boldsymbol P^{\frac{1}{2}} \boldsymbol Q^{\prime} A(f)P21=A(f)P21Q,因此
A ( f ′ ) = A ( f ) P 1 2 Q ′ P ′ − 1 2 \boldsymbol A(f^{\prime}) = \boldsymbol A( \boldsymbol f ) \boldsymbol P^{\frac{1}{2}} \boldsymbol Q^{\prime} \boldsymbol P^{\prime -\frac{1}{2}} A(f)=A(f)P21QP21

上式意味着,对于 ∀ j ∈ { 1 , 2 , ⋯   , r } \forall j \in \{1,2,\cdots, r\} j{1,2,,r} a ( f j ′ ) ∈ span { a ( f 1 ) , ⋯   , a ( f r ) } \boldsymbol a(f^{\prime}_j) \in \text{span} \left \{ \boldsymbol a(f_1), \cdots, \boldsymbol a(f_r) \right \} a(fj)span{a(f1),,a(fr)}。又因为在 r ≤ N − 1 r \leq N-1 rN1时,任意两个分量 a ( f i ) \boldsymbol a(f_i) a(fi) a ( f j ) , i ≠ j \boldsymbol a(f_j), i\neq j a(fj),i=j都是线性独立的,因此必然有, { f j ′ } j = 1 r \{f^{\prime}_j\}_{j=1}^r {fj}j=1r { f j } j = 1 r \{f^{}_j\}_{j=1}^r {fj}j=1r相等。由此可以得出,当 r ≤ N − 1 r \leq N-1 rN1时,分解具有唯一性。

总结

  • r ≤ N − 1 r \leq N-1 rN1时,半正定Toeplitz矩阵的范德蒙德分解是唯一地;
  • r = N r = N r=N时,半正定Toeplitz矩阵的范德蒙德分解不唯一。

推论:任意PSD Toeplitz矩阵 T ( u ) ∈ C N × N \boldsymbol T(\boldsymbol u) \in \mathbb C^{ N \times N} T(u)CN×N可以被唯一地分解为:
T = ∑ k = 1 r p k a ( f k ) a H ( f k ) + σ I = A ( f ) d i a g ( p ) A H ( f ) + σ I \boldsymbol T = \sum_{k=1}^r p_k \boldsymbol a(f_k) \boldsymbol a^H(f_k) + \sigma \boldsymbol I = \boldsymbol A( \boldsymbol f ) diag(\boldsymbol p) \boldsymbol A^H( \boldsymbol f ) + \sigma \boldsymbol I T=k=1rpka(fk)aH(fk)+σI=A(f)diag(p)AH(f)+σI
其中 σ = λ m i n ( T ) \sigma = \lambda_{min}(\boldsymbol T) σ=λmin(T) r = rank ( T − σ I ) < N r = \text{rank}(\boldsymbol T - \sigma \boldsymbol I) < N r=rank(TσI)<N p k > 0 p_k >0 pk>0 f k ∈ T , k = 1 , ⋯   , r f_k \in \mathbb T, k=1,\cdots,r fkT,k=1,,r are disjoint.
Remark: Note that the uniqueness of the decomposition above is guranteed by the condition that σ = λ m i n ( T ) \sigma=\lambda_{min}(\boldsymbol T) σ=λmin(T). If the condition is violated by letting 0 ≤ σ < λ m i n ( T ) 0 \leq \sigma < \lambda_{min}(\boldsymbol T) 0σ<λmin(T) (in such a case T \boldsymbol T T has full rank and r ≥ N r \geq N rN), then the deomposition cannot be unique.

参考

[1] Yang, Z., Li, J., Stoica, P., & Xie, L. (2016). Sparse Methods for Direction-of-Arrival Estimation. ArXiv, abs/1609.09596.

有关半正定Toeplitz矩阵的范德蒙德分解的更多相关文章

  1. 旋转矩阵的几何意义 - 2

    点向量坐标矩阵的几何意义介绍旋转矩阵的几何含义之前,先介绍一下点向量坐标矩阵的几何含义点:在一维空间下就是一个标量,如同一条直线上,以任意某一个位置为0点,以一定的尺度间隔为1,2,3...,相反方向为-1,-2,-3...;如此就形成了一维坐标系,这时候任何一个点都可以用一个数值表示,如点p1=5,即即从原点出发沿着x轴正方向移动5个尺度;点p2=-3,负方向移动3个尺度;     在一维坐标系上过原点做垂直于一维坐标系的直线,则形成了二维坐标系,此时描述一个点需要两个数值来表示点p3=(3,2),即从原点出发沿着x轴正方向移动3个尺度,在此基础上沿着y轴正方向移动两个尺度的位置就是点p3。

  2. 华为OD机试真题 C++ 实现【带传送阵的矩阵游离】【2023 Q2 | 200分】 - 2

            所有题目均有五种语言实现。C实现目录、C++实现目录、Python实现目录、Java实现目录、JavaScript实现目录题目n行m列的矩阵,每个位置上有一个元素你可以上下左右行走,代价是前后两个位置元素值差的绝对值.另外,你最多可以使用一次传送阵(只能从一个数跳到另外一个相同的数)求从走上角走到右下角最少需要多少时间。输入描述:第一行两个整数n,m,分别代表矩阵的行和列。后面n行,每行m个整数,分别代表矩阵中的元素。输出描述:一个整数,表示最少需要多少时间。

  3. 欧拉角表示的姿态矩阵(313和312转序) - 2

    一、习惯约定图片来自PSINS(高精度捷联惯导算法)PSINS工具箱入门与详解.pptx二、基本旋转矩阵绕x轴逆时钟旋转α\alphaα角度Rx(α)=[ 1000cos⁡αsin⁡α0−sin⁡αcos⁡α]R_x(\alpha)=\begin{bmatrix}\1&0&0\\0&\cos\alpha&\sin\alpha\\0&-\sin\alpha&\cos\alpha\end{bmatrix}Rx​(α)=​ 100​0cosα−sinα​0sinαcosα​​绕y轴逆时钟旋转α\alphaα角度Ry(α)=[ cos⁡α0−sin⁡α010sin⁡α0cos⁡α]R_y(\alpha

  4. 欧拉角、旋转矩阵及四元数 - 2

    欧拉角、旋转矩阵及四元数1.简介2.欧拉角2.1欧拉角定义2.2右手系和左手系2.3转换流程3.旋转矩阵4.四元数4.1四元数与欧拉角和旋转矩阵之间等效变换4.2测试Matlab代码5.总结1.简介常用姿态参数表达方式包括方向余弦矩阵、欧拉轴/角参数、欧拉角、四元数以及罗德里格参数等。高分辨率光学遥感卫星主要采用欧拉角与四元数对姿态参数进行描述。这里着重讲解欧拉角、旋转矩阵和四元数。2.欧拉角2.1欧拉角定义欧拉角是表征刚体旋转的一种方法之一,由莱昂哈德·欧拉引入的三个角度,用于描述刚体相对于固定坐标系的方向。在摄影测量、空间科学或其它技术领域,一般用一组(三个)欧拉角描述两个空间坐标之间的旋

  5. ruby - 如何修改矩阵(Ruby std-lib Matrix 类)? - 2

    我理解RubystdlibMatrix是不可修改的,也就是说,例如。m=Matrix.zero(3,4)不会写m[0,1]=7但我非常想做...我可以用笨拙的编程来做,比如defmodify_value_in_a_matrix(matrix,row,col,newval)ary=(0...m.row_size).map{|i|m.rowi}.map(&:to_a)ary[row][col]=newvalMatrix[*ary]end...或者作弊,比如Matrix.send:[]=,0,1,7但我想知道,这一定是人们一直遇到的问题。有没有一些标准的、习惯的方法可以做到这一点,而不必使用

  6. 线性代数让我想想:快速求三阶矩阵的逆矩阵 - 2

    快速求三阶矩阵的逆矩阵前言一般情况下,我们求解伴随矩阵是要注意符号问题和位置问题的(如下所示)A−1=1[  ][−[  ]−[  ]−[  ]  −[  ]]=A−1=1[  ][   M11−[M12]   M13−[M21]   M22−[M23]     M31−[M32]   M33]⊤\begin{aligned}&A^{-1}=\frac{1}{[\\]}\left[\begin{array}{cccccc}&-[\\]&\\-[\\]&&-[\\]\\\\&-[\\]&\\\end{array}\right]=\\\\&A^{-1}=\frac{1}{[\\]}\left[\b

  7. 相机校准—外参矩阵 - 2

    在本文中,我们将探讨摄影机的外参,并通过Python中的一个实践示例来加强我们的理解。相机外参摄像头可以位于世界任何地方,并且可以指向任何方向。我们想从摄像机的角度来观察世界上的物体,这种从世界坐标系到摄像机坐标系的转换被称为摄像机外参。那么,我们怎样才能找到相机外参呢?一旦我们弄清楚相机是如何变换的,我们就可以找到从世界坐标系到相机坐标系的基变换的变化。我们将详细探讨这个想法。具体来说,我们需要知道相机是如何定位的,以及它在世界空间中的位置,有两种转换可以帮助我们:有助于确定摄影机方向的旋转变换。有助于移动相机的平移变换。让我们详细看看每一个。旋转通过旋转改变坐标让我们看一下将点旋转一个角度

  8. ruby-on-rails - 将大型 Rails 应用程序分解成较小的应用程序? - 2

    按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visitthehelpcenter指导。关闭10年前。我有一个包含600个模型的Rails应用程序,很快就会增加到800-1000个。我想对Rails应用程序进行分段,以便仅加载某些模型,因此充当单独的应用程序,但所有模型都共享相同的基本模型。是否有执行此操作的标准做法?编辑:我在2.3.8编辑2:问题是许多模型是相似的,但不同之处恰恰足以保证编写一个新类,也就是说,将所有模型都放在一个模型中所需的逻辑将是

  9. ruby - Ruby 中的有限矩阵 - 2

    为什么Matrix类没有方法来编辑它的向量和组件?似乎矩阵中的所有内容都可以读取但不能写入。我错了吗?是否有一些类似于Matrix的第三方优雅类允许我删除行并有意地编辑它们?如果没有这样的类(class),请通知我——我将停止搜索。 最佳答案 Matrix类的设计者一定是不可变数据结构和函数式编程的爱好者。是的,你是对的。无论如何,总有一个简单的解决方案可以满足您的需求。使用Matrix它可以做的事情,然后,只需使用.to_a来获得一个真正的数组。>>Matrix.identity(2).to_a=>[[1,0],[0,1]]另见N

  10. ruby-on-rails - 你如何分解出 RSpec 中常见的 "before(:each)"调用,以便多个规范可以使用它们? - 2

    我想分解这堆代码,以便我所有的Controller测试(好吧,几乎所有的)都使用这个before(:each)block:before(:each)do@user=User.newcontroller.stub(:authenticate_user!)controller.stub(:current_user).and_return(@user)controller.stub(:add_secure_model_data)end有什么办法吗?我不想将它包含在所有Controller中......因为有一些不需要它。基本上,每个从SecureController扩展的Controller

随机推荐