作者简介:陈绵书(1973-),男,副教授,博士.研究方向:图像处理,人工智能.E-mail:chenms@jlu.edu.cn
为了使Karhunen-Loeve ( KL)变换适应高维数据,同时为了找出多维矢量矩阵的最优变换,本文提出了基于多维矢量矩阵理论的 M维KL变换(即MKL变换).首先结合多维矢量矩阵理论定义多维协方差矩阵,并求解多维特征向量矩阵;然后定义MKL变换,将多维数据映射到投影空间.实验结果表明:MKL变换在一维时与KL变换具有相同的最优性;对于三维视频数据,MKL变换实现了完全解相关,平均能量集中率(EPE)高达99%.
In order to adapt Karhunen-Loeve (KL) transform to multidimensional data, meanwhile to find out the optimal transformation of multidimensional vector matrix, a Multidimensional KL (MKL) transform based the theory of multidimensional vector matrix is proposed. First, the multidimensional covariance matrix is defined using the theory of multidimensional vector matrix, and the multidimensional characteristic matrix vector is solved. The, MKL transform is defined and the multidimensional data are mapped to the projective space. Simulation results show that the MKL transform in one-dimension has the same optimality as the KL transform. For 3D video data block, the average EPE can be as high as 99% by integral transformation, and MKL realizes decorrelation completely.
多维理论(高维理论)很早就被提出, 并在一些领域里得到了广泛的应用, 如在力学领域[1], 优化方面[2], 数据存储方面[3]等.目前, 高维理论无论是在表现形式, 还是在存储上都得到了不断发展, 但是较少应用于变换领域.Liu等[4, 5, 6]提出了基于多维矢量矩阵的多维矢量变换, 并应用到彩色视频流压缩编码和多视角视频编码中, 在去除冗余, 提高能量集中性方面都取得了不错的效果.对于有限的多维矢量信号给出它的最优变换, 也就成为了进一步过程中不可避免的一部分.Karhunen-Loeve(KL)变换[7, 8, 9]是均方误差准则下的最优变换, 由于它在完全解相关, 有效减少特征图像数目以及抽取更好特征图像等方面的优点, 所以即使它存在计算量大, 复杂度高, 无快速算法的缺点, 也还是在实际中应用.
离散图像的KL变换采用行, 列堆叠的方法进行近似计算, 表达形式上还存在一定的缺陷, 并且随着人们对于视频图像要求的提高, 传统的二维(2 dimensional, 2D)图像记录及重现场景的视频技术已经不能满足观看者的视觉要求, 然而现有的KL变换并不具备向着多维方向发展的延展性.为明确离散图像KL变换的表达式, 并使KL变换从一维扩展到多维, 本文从KL变换理论出发, 结合多维矢量矩阵理论, 重新定义离散图像KL变换, 并把其推广到M维, 即MKL变换.最后通过实验证明其在能量集中性和解相关性方面的优越性.
定义1 F域上的m1× m2个元素(
定义2 将多维矩阵
定义3 若定义2中划分的矢量m和n的维数相同(M=N), 则称
由于此处的特征值和特征向量的计算都是针对于2M维的协方差矩阵, 且2M维协方差矩阵
定义4 如果2M维矢量矩阵为
定义5 若2M维矢量矩阵的特征矩阵如定义4所示, 则它的行列式为|λ
1.3 2M维矢量矩阵的特征向量
定理1 设λ 是2M维矢量矩阵
KL变换最大优点是消除相关性, 它是最小均方误差准则(Minimum mean square error, MMSE)下的最优变换[10, 11], 可以获得最佳匹配图像效果, 并消除变换域里的全部相关性.本文在推导出MKL变换之前, 首先给出多维协方差的定义.
对于一维向量, KL变换的协方差矩阵具有明确的定义和表达形式.而对于离散图像信号, 并没有相应的定义.所以在此结合多维矢量矩阵理论, 给出了离散图像信号多维协方差矩阵的定义.
定义6 设屡被传送的N× N图像信号为X,
则离散图像信号多维协方差矩阵为:
其中, I=(i1i2), J=(j1j2);
1< i1, i2, j1, j2< N;
E
定义6给出了离散图像信号多维协方差矩阵的定义.此外, 为了处理高维数据, 本文又通过推导给出Μ 维矢量信号的多维协方差矩阵定义, 如定义7所示.
定义7 设屡被传送的M维矢量信号为X, X=
; 1≤ i1≤ N1, , et al., 1≤ iΜ ≤ NM, 则M维矢量信号的2M维协方差矩阵为:
其中, I=(i1i2, et al.iM), J=(j1j2, et al.jM),
E
定义6和定义7摒弃了传统离散图像应用堆叠思想求解协方差矩阵的思路, 直接应用多维矢量矩阵, 定义M维矢量信号的2M维协方差矩阵.
在多维矢量矩阵运算法则, 多维协方差矩阵定义和多维特征向量求解方法的基础上, 对多维信号的KL变换进行研究, 推导出了MKL变换.
设M维离散矢量信号为X, 其中X=[
对M维离散矢量信号X进行变换:
MKL正变换为:YJ=
MKL反变换为:XI=TIJYJ(4)
其中, Y是X经过变换后得到的M维矩阵, Y=[
其中, I=
实验采用352× 288的4:2:0的yuv视频作为实验对象, 主要包括foreman.yuv等视频, 并以解相关程度和能量集中性作为评价标准对实验数据进行分析.
分块是把* .yuv格式的视频分为Y块, U块, V块, 并在Y, U, V块上进行扫描得4× 4× 4, 8× 8× 8或者16× 16× 16数据块.图1为分成4× 4× 4数据块的示意图.
数据一般通过比较变换前, 后的协方差矩阵来衡量解相关的程度.本文利用VC++6.0进行实验, 分别获取变换前, 后的多维协方差矩阵, 发现变换后的多维协方差矩阵均为对角阵, 因此MKL变换具有完全解相关性.
能量集中率(EPE)评价标准是变换系数矩阵中某一矢量较大系数的能量与所有系数能量的百分比, 即:
对foreman.yuv进行MKL变换, 比较不同分块情况下变换前, 后左上角的能量集中率, 如表1所示, 其中EPE如公式(6)所示:
分别对foreman, tempete, silent视频进行分块, 变换, 并以4阶三维分块为例, 比较变换前, 后左上角的平均能量集中率, 如表2所示.
由表1, 表2可以发现, 视频块经过MKL变换, 平均能量基本已经完全集中在左上角, 具有很好的能量集中性.
图2是以foreman的4阶三维块为例, 显示出变换前, 后所有变换块的EPE.通过对比可以发现, 变换后所有块的能量集中率都得到了很大改善.
根据现有的多维矢量矩阵和Karhunen-Loeve(KL)变换理论, 创新性地定义了基于多维矢量矩阵的协方差矩阵, MKL变换.对yuv格式视频进行了三维4阶, 8阶, 16阶的MKL变换, 以验证MKL变换的解相关性和能量集中性.实验结果表明:变换后的数据可以完全解相关; 且对于数据块仅取左上角1个数据(即1/64, 1/512, 1/4096)所得Y分量的EPE均值均高达99%以上.这充分说明了MKL变换具有很好的能量集中性和解相关性.本研究还有一定的局限性和不足, 在下一步工作中, 将继续针对MKL变换的应用, MKL变换与多维矢量矩阵最优变换的关系等方面展开进一步的研究.
The authors have declared that no competing interests exist.
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|