多维DCT/IDCT立体类蝶形算法及其单元式通道结构
刘媛媛1,2, 陈贺新1, 赵岩1, 杨楚皙1
1.吉林大学 通信工程学院,长春 130012
2.吉林农业大学 信息技术学院,长春 130118
赵岩(1971-),女,教授,博士生导师.研究方向:图像与视频编码和立体视频处理.

作者简介:刘媛媛(1980-),女,讲师,博士研究生.研究方向:图像处理与视频编码和立体视频处理.

摘要

为了匹配离散余弦变换(DCT)算法不同大小分块,实现不同维度DCT结构的兼容性,提出了一种多维DCT立体类蝶形算法,并对其单元式通道结构进行研究。首先,根据DCT理论,以“张量积”运算为基础,介绍了DCT及其反变换IDCT立体类蝶形算法理论原理,给出了多维算法推导。然后,以DCT/IDCT立体类蝶形算法数学运算为理论基础,从一维引申至多维立体类蝶形图形式,并根据多维与一维的关系,以一维单元式通道结构为基础,提出多维单元式通道结构。实验结果表明:本文算法仅需要传统算法中50%的加法器和约30%的乘法器;算法耗时与分块大小和维度有关,在从三维到五维的实验耗时检测中,本文算法耗时不超过普通DCT算法耗时的10%,具有速度快、复杂度低、多维兼容性的特点。

关键词: 信息处理技术; DCT/IDCT; 多维立体; 蝶形算法; 通道式结构
中图分类号:TN919 文献标志码:A 文章编号:1671-5497(2016)06-2094-09
Multidimensional DCT/IDCT similar butterfly algorithm and it unit channel architectures
LIU Yuan-yuan1,2, CHEN He-xin1, ZHAO Yan1, YANG Chu-xi1
1.College of Communication Engineering, Jilin University, Changchun 130012, China
2.College of Information Technology, Jilin Agricultural University, Changchun 130118, China
Abstract

In order to match different size block of Discrete Cosine Transform (DCT) algorithm, the architecture compatibility of different dimensional DCTs is implemented. A multidimensional DCT similar butterfly algorithm is proposed and its unit channel architectures are studied. First, based on the theory of DCT and tensor product operation, the theoretical principles of the DCT similar butterfly algorithm and its inverse transform IDCT are introduced, and the derivation of the multidimensional algorithm is given. Second, taking the arithmetical operation of DCT/IDCT stereo similar butterfly algorithm as the theoretical foundation, the one-dimensional stereo similar butterfly diagram is extended to multidimensional one. Finally, according to the relationship of one-dimension and multi-dimension, based on the one-dimensional channel unit architectures, the multidimensional unit channel architectures are put forward. Experimental results indicate that the proposeds algorithm only needs 50% adders and 30% multipliers of the traditional algorithm. The consuming time of this algorithm is related to the block size and dimension, for three-dimension and five-dimension, the consuming time of this algorithm is less than 10% of that of the common DCT algorithm. This algorithm is characterized by fast, low complexity and multidimensional compatibility.

Key words: information processing; DCT/IDCT; multidimensional stereo; butterfly algorithm; pipeline architectures
0 引言

离散余弦变换(DCT)广泛应用于信息处理领域中, 以其简单的变换算法、高效的变换效果得到人们越来越广泛的关注。当前DCT变换最为有效的应用是高效视频编码(HEVC)[1, 2, 3, 4]和多维矩阵算法[5, 6, 7, 8]。近年来, 对于原理简单的DCT算法, 人们一直追求实现结构简单化、兼容化效果, 其有效途径主要有3个方面:①超大规模集成电路(VLSI)的设计[2, 4, 9]; ②变换核的设计[10, 11, 12]; ③离散余弦正反变换和离散正弦正反变换的兼容结构设计[13]。而这些结构设计的适用性往往非常局限, 而且当分块、维度等参数变化时, 整体结构的设计也随之变化很大, 甚至不能适用, 这样很难满足当前广泛应用的可变分块、复合编码标准、多维变换等要求。因此, 通道式结构又称管道式结构近年来被人们提及[14, 15, 16], 通道式结构类似于“ 拼积木” , 只需要设计算法单元结构, 然后根据要求直接给出整体结构。这种方法依托于单元结构, 因此具有极高的兼容性和可延展性。

本文算法充分考虑到算法结构便捷、兼容的特点, 以Nikara和Takala提出的因式分解的DCT算法理论方法[15, 16]为依据, 在此基础上推导出多维DCT算法, 并从快速傅里叶变换(FFT)的蝶形流图中得到灵感, 给出一种立体类蝶形流图形式, 使其复杂定义直观化。同时根据其定义, 提出一种高效、低复杂度、兼容性强的通道式结构, 此种结构可根据需要选择大小, 可塑性强, 思路简单, 实用性、通用性及扩展性极强。

1 DCT/IDCT算法原理
1.1 基础算法及1-D DCT算法原理

本文仅考虑DCT-II型算法, 为了方便, 暂时省略系数 2/N, 根据参考文献[15], 将DCT变换写成通道式算法结构:

C2k= U2k[ s=k-11Qs2k( I2k-s-1P2s+1)] Qs2kPH2k(1)

式中:⊗表示张量积; I为单位矩阵; 2k=N为进行变换的点数; Q为已知矩阵:

Q1=I1;Q2=I2;Q4=P24;QN=IN/4Q4 (2)

本文均采用基-2的算法, 为了与多维统一, 令 AsN= QsN; PHNUN分别为输入和输出排列:

PHNX=(xhN(0),xhN(1),xhN(2),,xhN(N-1))T(3)UN=P2k[k-3(I2k-i-1R2k-2k-i-1)i=0(I2i+1P2k-i-1)] (4)

式中:⊗表示矩阵直和; R为一已知矩阵:

R1=I1;R2=I2;R4=Q4PH4;RN=IN/4R4 (5)

hN(i)为Hadamard排列函数, 初始值为h1(0)=0, 分奇偶数定义[15]为:

{h2N(2i)=hN(i)h2N(2i+1)=2N-1-hN(i)(6)i=0, 1,,N-1:[PHN]mn={1,n=hN(m)0,otherwise(7)

式(1)表示DCT变换中对第s列进行处理, 其中s=0, 1, …, k-1, Qs2k定义为:

Qs2k=Ms2kHs2kNs2kF2k(8)Ms2k=2k-1-1i=0(10-μs(i)1)=I2k-1(10-μs(i)1)(9)Hs2k=2k-1-1i=0(S4R4S4)μs-1(i)=I2k-2(S4R4S4)μs-1(i)(10)Ns2k=diag(gk(i,s)),i=0, 1,,2k-1(11){F2=(1 11-1)FN=IN/2F2(12){S4=P4=(1000001001000001)SN=IN/4S4(13){R4=(1000010000010010)RN=IN/4R4(14)

函数gk(i, s)表示为:

gk(i,s)=[2μs(i2)d(2k-s-1+i/2s+1)]fk(i,s)(15)

式中 :

Fk(i, s)=(I mod 2)+(i-τ 0 (i))(1-τ k-1(s)) (16)

二进制参数μ s(· )、τ i(s)分别定义为:

μs(i)={0,imod2n=01,imod2n0(17)τi(s)={0,s=i1,si(18)

系数d(i)按奇偶数可以表示为:

{d(2i)=[1+d(i)]/2d(2i+1)=[1-d(i)]/2d(1)=1/2 (19)

1-D DCT变换整体写为:

XD=UNKNPHNxD={UN[s=k-11AsN(I2k-s-1P2s+1)]A0NPHN}xD(20)

1.2 n-D DCT算法原理

xnDXnD分别表示n维原信号与其正变换的结果, 因此n-D DCT变换定义为:

XnD=(CsNCsNCsN)nxnD (21)

根据1-D DCT变换的结果, 得到:

XnD=[(UNUNUN)nKNn×(PHNPHNPHN)n]xnD=UNnKNnPHNnxnD(22)

式中: PHNnUNn分别为n-D DCT的输入和输出排列; KNnn-D DCT的变换核, 其计算公式为:

KNn=[s=k-11(QsNQsNQsN)n×(I2k-s-1P2s+1)(I2k-s-1P2s+1)(I2k-s-1P2s+1)n]×(Q0NQ0NQ0N)n(23)式中:QsNQsNQsN=(MsNMsNMsN)n(HsNHsNHsN)n×(NsNNsNNsN)n(FsNFsNFsN)n(24)

对照1-D DCT, n-D DCT与之类似, 只是将变换中一维的M(指变换中的参数)用相应位置的张量积结果 MMMn代替, 进一步计算得到, 如式(25)所示, 参数 HsNFsNQsNI2k-s-1⊗P2s+1同理。

MsNMsNMsNn=(MsNINn-1)(INn-1MsN)=(MsN2INn-2)(INn-2MsN2)=(MsNmINn-m)(INn-mMsNm)(25)(I2k-s-1P2s+1)(I2k-s-1P2s+1)××(I2k-s-1P2s+1)n=(I2k-s-1P2s+1I2(n-1)k)××(I2(n-2)k-s-1P2s+1I22k)×(I2(n-1)k-s-1P2s+1I2k)(I2nk-s-1P2s+1)(26)AsNn=QsNQsNQsNn=(MsNINn-1)(INn-1MsN)(HsNINn-1)×(INn-1HsN)DsNn(FNINn-1)(INn-1FN)=(MsNmINn-m)(INn-mMsNm)(HsNINn-m)×(INn-mHsNm)DsNn(FNmINn-m)(INn-1FNm)(27)

因而变换核可以写为:

KNn=[s=k-11AsNn(I2k-s-1P2s+1I2(n-1)k)××(I2(n-2)k-s-1P2s+1I22k)×(I2(n-1)k-s-1P2s+1I2k)×(I2n k-s-1P2s+1)]A0Nn(28)

n-D DCT变换整体写为:

XnD={ UNn[ s=k-11AsNn=( I2k-s-1P2s+1

I2(n-1)k)× × ( I2(n-2)k-s-1P2s+1I22k)×

( I2(n-1)k-s-1P2s+1I2k)× ( I2n k-s-1

P2s+1)] A0NnPHNn}xnD(29)

式中:xnD及其相应的结果XnDNn矩阵系数组成的列向量。

2 多维立体类蝶形形式
2.1 基本类蝶形形式

根据式(1), 忽略排列因子, 只需考虑[ s=k-11Qs2k( I2k-s-1⊗P2s+1)] Q02k, 其中 Q02kQs2k各个s取值是级联的关系, I2k-s-1⊗P2s+1表示级间排列。由式(8)可知, 每级中 Ms2kHs2kNs2kF2k亦为级联关系, 因此仅考虑各个参数的形式及级间排列参数 I2k-s-1⊗P2s+1。由1.1节推导可知, 每级中均由基本蝶形运算、单蝶运算、本级交换、乘数运算完成, 各级间由级联运算和级间排列完成, 需要注意的是, 每级中可能缺少其中的一项或者两项, 如N=8时第一级缺少 M08H08, 第二级缺少 H18, 其原因是此项值恰好为单位矩阵, 向量与其相乘对结果不产生影响。经分析可知整体运算流程恰为DCT流程的倒置形式, 这也符合DCT可逆变换的宗旨, N=8DCT/IDCT类蝶形形式如图1所示, 其中xi为输入信号; di为乘数。

图1 N=8点1-D DCT/IDCT类蝶形结构形式Fig.1 N=8 1-D DCT/IDCT similar butterfly architectures

2.2 n-D DCT/IDCT类蝶形形式

n-D DCT变换如式(29)所示, 其中 UNnPHNn为输出、输入排列, 因此仅考虑变换核 KNn, 如式(28)所示, 其中 A0NnAsNn各个s取值是级联的关系, 根据式(24),

( HsNHsNHsNHsNn)

( MsNMsNMsNMsNn)

( NsNNsNNsNNsNn)

( FsNFsNFsNFsNn)

类似于一维DCT中参数 Ms2kHs2kN Fs2kF2k相互间亦为级联关系, n维变换中参数为其自身n-1次张量积运算而成。图2为三维蝶形运算( FsNFsNFsN), 其中FN为二维平面中线型蝶形运算, 如图中红色和蓝色蝶形位置, FsN FsN为三维立体中面型蝶形运算, 如图中红色和蓝色级与黄色级两级级联蝶形位置, FsN FsNFsN为四维立体中体型蝶形运算, 如全部三级级联蝶形位置。

图2 2× 2× 2三维立体蝶形图Fig.2 2× 2× 2 3-D DCT butterfly architectures

n-D DCT变换整体如式(29)所示, 则n-D IDCT变换核为:

(CNn)-1={UNn·[s=k-11AsNn(I2k-s-1P2s+1I2(n-1)k)××(I2(n-2)k-s-1P2s+1I22k)×I2(n-1)k-s-1×(P2s+1I2k)×(I2nk-s-1P2s+1)]A0NnPHNn}-1(30)式中:[(FsNFsNFsNFsNn)]-1[(NsNNsNNsNNsNn)]-1[(HsNHsNHsNHsNn)]-1[(MsNMsNMsNMsNn)]-1

亦为级联关系, 现仅需考虑这4个参数与

( FsNFsNFsNFsNn)

( NsNNsNNsNNsNn)

( HsNHsNHsNHsNn)

( MsNMsNMsNMsNn)

参数的差异, 得到n-D IDCT与n-D DCT运算形式上的相关性。由上部分参数可知均为1-D DCT相应参数n-1“ 张量积” 后取逆运算而成, 因此n-D IDCT结构结合了n-D DCT与1-D IDCT的特点, 是n维正变换倒置结构情况。

3 通道式结构
3.1 通道式基本结构

由类蝶形结构形式可知DCT/IDCT包括蝶形单元、乘法单元和交换单元3种基本结构, 如图3所示。统一蝶形单元(UBU)由三个控制量控制输出, 分别得到蝶形操作(BU)、局部减法蝶形操作(LSU)和局部加法蝶形操作(LAU); 交换单元, 又称为移位寄存器(SEU), 作用是进行级内和级间交换。算法过程中分为本级交换单元(LEU)和级间交换单元(PSN)。

图3 基本结构示意图Fig.3 Architectures diagram of basic

3.2 n-D DCT基本结构

n维BU、LSU、LAU需进行n级蝶形运算, 级间以级联方式连接。第1级为线型蝶形运算, 即为基本蝶形运算; 第2级为面型蝶形运算; 第3级为体型蝶形运算, 以此类推, 将除基本级以外的其他级统称为延时级, 以N=2k为例, 第2级蝶形运算在基本蝶形运算硬件基础上将原延时器D替换为 (2k)D; 第3级蝶形运算在基本蝶形运算硬件基础上将原延时器替换为 (2k)2D, 则n级蝶形运算在基本蝶形运算硬件基础上将原延时器替换为 (2k)n-1D。UBUn结构单元如图4所示。

n维级间排列如式(26)所示, 在结构中, 仍沿袭基本级与其他延时级级联运算的形式, 若基本级中为两级运算的, 则延时级为对两级运算分别对应进行延时, 延时大小不变。P Sn8结构示意图如图5所示。

图4 UBUn结构示意图Fig.4 Architectures diagram of UBUn

图5 P Sn8结构示意图Fig.5 Architectures diagram of P Sn8

3.3 n-D DCT/IDCT通道式结构

图4图5所示结构为基础将其模块化, n-D DCT/IDCT通道式结构如图6(a)(b)所示, 以N=8、k=3为例, 将LSUn、BUn均用UBUn表示, 比较n-D DCT和IDCT两图结构, 将两图合二为一得到n-D DCT/IDCT兼容性通道式结构如图6(c)所示(控制量已省略), 结构器件示意图如图7所示。

图6 n-D DCT/IDCT通道式结构Fig.6 n-D DCT/IDCT pipeline schematic architectures

图7 N=8点n-D DCT/ IDCT兼容性通道式结构器件示意图Fig.7 N=8 n-D DCT/ IDCT compatible pipeline architectures view of devices

4 复杂度分析
4.1 硬件复杂度分析

图4可知, n维DCT结构主要由延时器、选择器和乘法器3部分组成。从硬件功能方面上看, n维DCT结构主要由蝶形运算BU(单蝶运算LSU和LEU均归属于蝶形运算范畴)、乘法运算和交换运算PS, 其中乘法运算由乘法器完成, 交换运算由延时器和选择器完成, 每级BU延时器和选择器以外还需要3个加法器(含减法)完成蝶形操作。一个Nn= 2k×2k××2kn点的n维DCT所需延时器主要由两部分组成:

(1)蝶形运算总共需要BUn3(log2N-1)级, 每级需要延时器个数为:

2×(1+N+N2++Nn-1)(31)

(2)级间交换P SnM(M=2m)需要延时器个数为:

(20+21+22++2m-2)(1+N+N2++Nn-1)(32)

Nnn维DCT需要P Sn4、P Sn8、…到P Snm的(log2N-1)级级间交换。因此Nnn维DCT总共需要延时器个数为:

[6(log2N-1)+20+(20+21)+(20+21+22)++(20+21+22++2m-2)](1+N+N2++Nn-1)(33)

类似地, 二选一选择器的个数也由两部分组成:①蝶形运算总共需要BUn3 (log2N-1)级, 每级需要选择器2n个; ②级间交换需要选择器 [1+2+3++(m-1)]× 2n个, 因此Nnn维DCT总共需要二选一选择器数组个数为:

[3(log2N-1)+1+2+3++(m-1)]×2n(34)

4.2 计算复杂度分析

n维DCT是一维运算多维化的结果, 其中运算仅为乘法器和加法器, 乘法器是由式(11)产生的, 其中gk(i, s)是每级的乘数, 值不为1的个数即为乘法器的个数, 一维DCT乘法器的个数为:

N2log2N+1(35)

n维DCT的乘法运算为:

(N(s)NN(s)NN(s)Nn)(36)

由式(36)可以看出, 该运算仅仅改变了每级乘数的不同, 但并没有改变乘法器的级数, 根据张量积的运算规则, 其值为“ 1” 的乘数呈指数增长, 因而n维DCT乘法器的个数为:

Nnlog2N-(N2)n(log2N-1)-(N2-1)n()(37)

加法器来自于蝶形和半蝶形运算, 每个蝶形运算中含有两个加法运算, 每级含有N/2个基本蝶形, 共有k级, 而减法半蝶形运算是每级中每个群少1个, 一个DCT变换共含有减法半蝶形运算个数为:

N2log2N-(20+21++2k-1)=N2log2N-N+1(38)

因此一维DCT加法器的个数为:

32log2N-N+1(39)

n维DCT将每个一维加法(包括减法)运算扩展至n维, 所以n维DCT加法器总个数为:

nNn-1(32log2N-N+1)(40)

5 实验结果及分析

根据本文采用的多维DCT/IDCT立体类蝶形算法, 表1针对视频不同分块N× N× N以常见的三维DCT方法为例对完成一个蝶形运算单元所使用加法器和乘法器数量进行比较, 其中算法一为传统快速算法, 算法二为行排列的方法[17]表1说明, 对于加法器, 算法二与本文算法相等, 约为算法一的一半, 而对于乘法器仅约为算法一的30%, 约为算法二的60%。可明显看出本文提出的算法节约了大量的影响计算速度的乘法器的数量。

表1 蝶形运算单元所用乘法器和加法器个数对比 Table 1 Comparison of number of multiplication and addition operations in butterfly unit

将视频信号中首帧以行、列像素m× m大小进行分块, 结合这个分块所对应的m帧, 即大小为m× m× m的三维视频块, 同理, 将这样m个大小为m× m× m的三维视频块首尾相连, 得到大小为m× m× m× m的四维视频块, 以此类推, 建立多维信号模型。实验仿真环境为:计算机处理器CPU Intel(R) Core(TM)i3-2120@3.30 GHz, Windows7 32 bit操作系统; 3.17 GB可用内存; Visual C++ 2010软件开发环境。表2为以176× 144 150帧视频信号为例, 不同m、不同维度时本文算法与普通DCT处理视频信号耗时[18]的实验比较。实验结果表明:①m越大, 本文算法耗时越少; ②m相同情况下, 维度越高, 本文算法耗时越少, 这也正好说明本文算法中“ 张量积” 运算的优势; ③m=4时, 相邻维度耗时降低幅度近似; ④m=8时, 三维和四维算法耗时百分比接近, 这是由于在四维时对应视频信号不能恰好为8的倍数, 而出现了计算冗余, m越大冗余越明显; ⑤m=8时, 五维算法耗时所占百分比最小, 说明该视频信号在对应维度中最为优化。

表2 不同分块及维度本文算法与普通DCT处理视频信号的耗时对比 Table 2 Time needed between ordinary DCT and DCT alogorithm with different block sizes and dimensions
6 结束语

在一维DCT的基础上提出了n维DCT及其反变换IDCT算法及类蝶形运算的算法流程, 同时, 根据流程提出了一种仅由延时器、选择器和乘法器组成的多维DCT/IDCT算法单元通道式结构。提出的类蝶形算法流程将n维运算直观化、立体化。以三维DCT算法为例, 对比实验数据表明, 本文算法仅需要传统算法中一半的加法器和约30%的乘法器, 大大提高了运算速度、降低了运算的复杂度。从不同分块和维度本文算法与普通DCT处理视频信号耗时对比结果可以看出, 算法耗时与分块大小、维度有关, 但在m=4和m=8时, 从三维到五维的实验耗时检测中可以看出, 本文算法耗时不到普通DCT算法耗时的10%; 当m=8时, 五维信号处理176× 144 150帧视频信号仅耗时253 s, 仅为普通DCT算法耗时的1.22%。

The authors have declared that no competing interests exist.

参考文献
[1] Conceicao R, Souza J C, Jeske R, et al. Power efficient and high throughput multi-size IDCT targeting UHD HEVC decoders[C]∥IEEE International Symposium on Circuits and Systems, Melboume, Australia, 2014: 1925-1928. [本文引用:1]
[2] Sun H M, Zhou D J, Liu P L, et al. A low-cost VLSI architecture of multiple-size IDCT for H. 265/HEVC[DB/OL]. [2014-05-08]. http://www.aoni.waseda.jp/zhou/pdf/ieice/e97-a_12_2467.pdf. [本文引用:2]
[3] Pastuszak G. Flexible architecture design for H. 265/HEVC inverse transform[J]. Circuits Systems and Signal Processing, 2015, 34(6): 1931-1945. [本文引用:1]
[4] 杨启洲, 刘一清. 基于HEVC的多长度DCT变换的VLSI设计[J]. 微电子学, 2015, 45(1): 102-105.
Yang Qi-zhou, Liu Yi-qing. Design of DCT of different lengths VLSI architecture for HEVC[J]. Microelectronics, 2015, 45(1): 102-105. [本文引用:2]
[5] 桑爱军, 穆森, 王墨林, . 基于多维矢量矩阵的多视角视频编码[J]. 吉林大学学报: 工学版, 2013, 43(4): 1110-1115.
Sang Ai-jun, Mu Sen, Wang Mo-lin, et al. Multi-view video coding based on multi-dimensional vector matrix[J]. Journal of Jilin University(Engineering and Technology Edition), 2013, 43(4): 1110-1115. [本文引用:1]
[6] 孙文邦, 陈贺新, 孙文斌, . 基于变换基阵的SDCT 算法[J]. 吉林大学学报: 工学版, 2011, 41(增刊1): 325-331.
Sun Wen-bang, Chen He-xin, Sun Wen-bin, et al. SDCT operation based on transform basic matrix[J]. Journal of Jilin University(Engineering and Technology Edition), 2011, 41(Sup. 1): 325-331. [本文引用:1]
[7] 桑爱军, 杨树媛, 赵欣. 基于多维矢量矩阵离散余弦变换的熵编码[J]. 吉林大学学报: 工学版, 2011, 41(增刊1): 319-324.
Sang Ai-jun, Yang Shu-yuan, Zhao Xin. Entropy code based on multidimensional vector matrix DCT[J]. Journal of Jilin University(Engineering and Technology Edition), 2011, 41(Sup. 1): 319-324. [本文引用:1]
[8] 赵志杰, 陈贺新, 桑爱军. 三维矩阵可变分割彩色图像压缩编码[J]. 吉林大学学报: 工学版, 2009, 39(1): 194-197.
Zhao Zhi-jie, Chen He-xin, Sang Ai-jun. Color image compression based on variable matrix size three dimensional matrix wide DCT[J]. Journal of Jilin University(Engineering and Technology Edition), 2009, 39(1): 194-197. [本文引用:1]
[9] Huang H, Xiao L Y. CORDIC based fast algorithm for power-of-point DCT and its efficient VLSI implementation[J]. Microelectronics Journal, 2014, 45(11): 1480-1488. [本文引用:1]
[10] 桑爱军, 王艇, 栾晓利, . 2M维矢量余弦整数变换核矩阵[J]. 光学精密工程, 2013, 21(7): 1891-1897.
Sang Ai-jun, Wang Ting, Luan Xiao-li, et al. 2M-dimensional vector integer DCT transform kernel matrix[J]. Optics and Precision Engineering, 2013, 21(7): 1891-1897. [本文引用:1]
[11] Chen Y H, Chen J N, Chang T Y, et al. High-throughput multistand ard transform core supporting MPEG/H. 264/VC-1 using common sharing distributed arithmetic[J]. IEEE Transactions on Very Large Scale Integration (VLSI) System, 2014, 22(3): 463-474. [本文引用:1]
[12] Chen Y H, Jou R Y, Chang T Y, et al. A high-throughput and area-efficient video transform core with a time division strategy[J]. IEEE Transactions on Very Large Scale Integration (VLSI) System, 2014, 22(11): 2268-2277. [本文引用:1]
[13] Huang H, Xiao L Y, Liu J M. CORDIC-based unified architecture for computation of DCT/IDCT/DST/IDST[J]. Circuits Systems and Signal Processing, 2014, 33(3): 799-814. [本文引用:1]
[14] Aggrawal E, Kumar N. High throughput pipelined 2D discrete cosine transform for video compression[C]∥International Conference on Issues and Challenges in Intelligent Computing Techniques, Ghaziabad, India, 2014: 702-705. [本文引用:1]
[15] Nikara J A, Takala J H, Astola J T. Discrete cosine and sine transforms-regular algorithms and pipeline architectures[J]. Signal Processing, 2006, 86(2): 230-249. [本文引用:3]
[16] Takala J, Nikara J, Punkka K. Pipeline architecture for two-dimensional discrete cosine transform and its inverse[C]∥Proceedings of the Ninth International Conference on Electronics Circuits Systems, Dubrovnik, Croatia, 2002: 749-750. [本文引用:2]
[17] Boussakta S, Alshibami H O. Fast algorithm for the 3-D DCT-II[J]. Signal Processing, 2004, 52(4): 992-1001. [本文引用:1]
[18] Sang A J, Sun T N, Chen H X, et al. 6D vector orthogonal transformation and its application in multiview video coding[J]. The Imaging Science Journal, 2013, 61(4): 341-350. [本文引用:1]