數(shù)字視頻編碼技術(shù)論文
數(shù)字視頻編碼技術(shù)論文
數(shù)字視頻編碼技術(shù)指通過(guò)特定的壓縮技術(shù),將某個(gè)視頻格式的文件轉(zhuǎn)換成另一種視頻格式文件的方式。下面是學(xué)習(xí)啦小編整理的數(shù)字視頻編碼技術(shù)論文,希望你能從中得到感悟!
數(shù)字視頻編碼技術(shù)論文篇一
數(shù)字視頻編碼技術(shù)的研究綜述
摘要:隨著流媒體技術(shù)、微電子技術(shù)、多媒體技術(shù)以及多媒體技術(shù)的快速發(fā)展,已經(jīng)出現(xiàn)很多智能終端。數(shù)字視頻編解碼算法在智能終端系統(tǒng)中起著核心的作用。該文對(duì)數(shù)字視頻壓縮標(biāo)準(zhǔn)的發(fā)展及現(xiàn)狀進(jìn)行了闡述,然后對(duì)視頻編碼的基本原理進(jìn)行必要的闡述,最后對(duì)可伸縮編碼技術(shù)進(jìn)行詳細(xì)的闡述。
關(guān)鍵詞:視頻編碼;視頻壓縮;可伸縮編碼
中圖分類號(hào):TP37 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2013)24-5528-04
在過(guò)去的20年間,多媒體通信的發(fā)展是迅猛的。因?yàn)橐曨l是多媒體通信的核心,所以很多數(shù)字視頻壓縮算法不斷的推出,這使得視頻傳輸以及視頻存儲(chǔ)的效率也越來(lái)越高。新的視頻編碼標(biāo)準(zhǔn)也隨著音視頻壓縮技術(shù)的不斷發(fā)展而相繼產(chǎn)生?,F(xiàn)在數(shù)字電視越來(lái)越普及,人們對(duì)視頻的質(zhì)量要求也越來(lái)越高。為了滿足人們對(duì)視頻的多樣化、高質(zhì)量的需求,ITU-T/VCEG與ISO/MPEG共同制訂了一系列的視頻壓縮編碼國(guó)際標(biāo)準(zhǔn)。這些標(biāo)準(zhǔn)在日常生活的應(yīng)用又推動(dòng)了視頻服務(wù)業(yè)務(wù)的發(fā)展。
1 視頻編碼的發(fā)展及現(xiàn)狀
數(shù)字視頻分辨率的提高使得原始數(shù)據(jù)量不斷增多,為了提高視頻編碼的壓縮效率,新的視頻編碼標(biāo)準(zhǔn)不斷推出。1984年CCITT第15研究組發(fā)布了數(shù)字基準(zhǔn)電視會(huì)議編碼標(biāo)準(zhǔn)H.120建議。在1988年的時(shí)候,CCITT通過(guò)了視頻編碼標(biāo)準(zhǔn)H.261建議。H.261是視頻壓縮編碼的一個(gè)里程碑。從這以后,ISO及ITU-T等發(fā)布的基于波形的編碼標(biāo)準(zhǔn)中的編碼方法很多都是基于H.261的混合編碼。在1986年,聯(lián)合圖像專家組成立,對(duì)連續(xù)色調(diào)靜止圖像壓縮算法的國(guó)際標(biāo)準(zhǔn)進(jìn)行研究,在1992年通過(guò)了JPEG標(biāo)準(zhǔn)。
在1988年,活動(dòng)圖像專家組成立。并在1991年MPEG-2編碼標(biāo)準(zhǔn),主要在VCD的視頻壓縮中進(jìn)行應(yīng)用。在1994年公布的MPEG-2編碼標(biāo)準(zhǔn),不同的碼率分別在不同檔次、不同級(jí)別的視頻壓縮中應(yīng)用。MPEG-2已經(jīng)支持高清晰度視頻,但是要實(shí)現(xiàn)全面高清化還需要更高效的編碼技術(shù)。
在1995年,ITU-T又推出了H.263編碼標(biāo)準(zhǔn)。主要用于可視會(huì)議和多媒體通信等低碼率視頻的傳輸。
在1999年,ISO/IEC通過(guò)了MPEG-4編碼標(biāo)準(zhǔn),此標(biāo)準(zhǔn)強(qiáng)調(diào)了多媒體通信的靈活性和交互性。
在2003年,ISO/IEC和ITU-T公布H.264視頻壓縮標(biāo)準(zhǔn),這個(gè)標(biāo)準(zhǔn)明顯提高了視頻壓縮效率,而且網(wǎng)絡(luò)親和性也很不錯(cuò),對(duì)誤碼及丟包的處理進(jìn)行了加強(qiáng)。H.264增加了1/4精度預(yù)測(cè)、整數(shù)DCT變換等技術(shù)。
在2007年,作為H.264/AVC標(biāo)準(zhǔn)可伸縮性擴(kuò)展檔次的可伸縮性編碼SVC推出,根據(jù)要求將視頻分割成一個(gè)基本層和多個(gè)增強(qiáng)層。
在2013年,HEVC成為國(guó)際標(biāo)準(zhǔn),可以提供更好的視覺(jué)效果。HEVC對(duì)預(yù)測(cè)模型、變換技術(shù)等進(jìn)行了擴(kuò)展。
2 視頻編解碼技術(shù)基礎(chǔ)
在通用的視頻編碼框器中,一般使用一個(gè)編碼框架,但是使用多種壓縮編碼方法。不同壓縮編碼方法的原理也是不同的。這些編碼方法是視頻編碼的基本工具。本節(jié)主要對(duì)預(yù)測(cè)編碼,變換編碼及熵編碼的原理進(jìn)行詳細(xì)介紹。
2.1 預(yù)測(cè)編碼
預(yù)測(cè)編碼是比較基本的編碼工具,常用的預(yù)測(cè)編碼方法有幀內(nèi)預(yù)測(cè)和幀間預(yù)測(cè)編碼。幀間預(yù)測(cè)是用于消除時(shí)間冗余,幀內(nèi)預(yù)測(cè)用于消除空間冗余。因?yàn)闀r(shí)間冗余遠(yuǎn)遠(yuǎn)大于時(shí)間冗余,下面主要對(duì)幀間預(yù)測(cè)進(jìn)行闡述。
2.1.1 預(yù)測(cè)編碼的基本概念
預(yù)測(cè)編碼通過(guò)利用已知的信息對(duì)未知的信息進(jìn)行猜測(cè),對(duì)實(shí)際值和預(yù)測(cè)值之間的差值進(jìn)行編碼。通過(guò)預(yù)測(cè)得到一個(gè)預(yù)測(cè)值,實(shí)際值減去預(yù)測(cè)值得到一個(gè)殘差:
如果預(yù)測(cè)方法比較好,殘差值就會(huì)比較小,對(duì)殘差進(jìn)行編碼的碼流也會(huì)比較小。在解碼端對(duì)殘差進(jìn)行解碼,使用與編碼端相同的預(yù)測(cè)方法得到預(yù)測(cè)值,進(jìn)而重構(gòu)出原始圖像:
通常情況下,可以利用若干已經(jīng)編碼圖像像素的線性組合來(lái)得到預(yù)測(cè)值??紤]圖像的特點(diǎn),預(yù)測(cè)一般以塊為單位進(jìn)行。需要將圖像按照規(guī)則分割成具有規(guī)則的塊。按照順序?qū)γ總€(gè)塊分別進(jìn)行預(yù)測(cè)編碼。
2.1.2 幀間預(yù)測(cè)編碼
幀間預(yù)測(cè)的目的是去除時(shí)域的冗余信息,就是使用已經(jīng)編碼的圖像對(duì)現(xiàn)在要編碼的圖像進(jìn)行預(yù)測(cè)。預(yù)測(cè)方法的合理性關(guān)系到殘差的大小。
幀間預(yù)測(cè)中比較重要的兩個(gè)概念是運(yùn)動(dòng)估計(jì)和運(yùn)動(dòng)補(bǔ)償。運(yùn)動(dòng)估計(jì)就是尋找當(dāng)前編碼的塊在已編碼圖像的最佳對(duì)應(yīng)塊。并計(jì)算出對(duì)應(yīng)塊之間的偏移即運(yùn)動(dòng)矢量。如果當(dāng)前幀是P,參考幀是Pr ,當(dāng)前編碼塊是B,在Pr中找到與B塊相減之后殘差最小的塊Br ,Br就是B的最佳匹配塊。這個(gè)過(guò)程稱為運(yùn)動(dòng)估計(jì)。運(yùn)動(dòng)矢量也需要采用合適的方法編碼到碼流中,這樣在解碼端才能解碼出原圖像。
運(yùn)動(dòng)補(bǔ)償是由運(yùn)動(dòng)矢量及幀間預(yù)測(cè)方法得到當(dāng)前幀的估計(jì)值的過(guò)程。它是對(duì)當(dāng)前圖像的描述,說(shuō)明當(dāng)前圖像的每一塊怎么由其他參考圖像的像素塊得到。
運(yùn)動(dòng)估計(jì)和運(yùn)動(dòng)補(bǔ)償都是消除時(shí)間冗余的重要方法。這兩者直接影響到重建圖像質(zhì)量及壓縮比。運(yùn)動(dòng)估計(jì)是動(dòng)態(tài)過(guò)程,而運(yùn)動(dòng)補(bǔ)償只是一個(gè)靜態(tài)的描述。
2.1.3 運(yùn)動(dòng)估計(jì)
運(yùn)動(dòng)估計(jì)有兩種模型:非參數(shù)模型和參數(shù)模型。
非參數(shù)模型是一種把非參數(shù)的平滑度約束條件附加到二維運(yùn)動(dòng)場(chǎng)得到的運(yùn)動(dòng)估計(jì)模型。根據(jù)約束條件的種類可以分為確定性模型和隨機(jī)性模型。常見(jiàn)的有貝葉斯法、塊匹配法等。實(shí)際中的很多運(yùn)動(dòng)估計(jì)算法都是基于非參數(shù)模型。
參數(shù)模型主要對(duì)三維運(yùn)動(dòng)物體在圖像平面上的正交或透視投影進(jìn)行描述。參數(shù)模型只對(duì)三維剛體的運(yùn)動(dòng)估計(jì)適用。
2.2 變換編碼
變換編碼的編碼效率要比預(yù)測(cè)編碼高。K-L變換、傅里葉變換等算法出現(xiàn)比較早,壓縮效率高,但因高復(fù)雜度沒(méi)有得到廣泛應(yīng)用。離散余弦變換是首個(gè)廣泛應(yīng)用的變換編碼算法。因?yàn)殡x散余弦變換不需要求解特征向量,大大降低了復(fù)雜度。 2.2.1變換編碼基本原理
變換編碼對(duì)信號(hào)的樣本值進(jìn)行某種形式的函數(shù)變換,從一種空間變換到另一種空間,后根據(jù)信號(hào)在一個(gè)空間域的特征對(duì)信號(hào)進(jìn)編碼壓縮。變換系統(tǒng)有三個(gè)步驟:預(yù)處理,變換及量化編碼。變換本身并不壓縮數(shù)據(jù),只是把信號(hào)變換到另一個(gè)域,變換之后的信號(hào)更獨(dú)立,更有序,比較容易壓縮。變換編碼中,輸入函數(shù)和輸出函數(shù)不同是因?yàn)榱炕`差形成的。量化編碼在變換編碼系統(tǒng)中是不可缺少的,量化使數(shù)據(jù)得以壓縮。為了使量化失真最小化可以針對(duì)不同的分量使用不一樣的量化方式。
2.3熵編碼
熵編碼的思想是對(duì)出現(xiàn)概率大的符號(hào)取較短的碼長(zhǎng),出現(xiàn)概率小的符號(hào)取較大的碼長(zhǎng)。熵編碼的基本定理對(duì)平均碼長(zhǎng)的極限進(jìn)行了描述。
熵編碼基本定理是在對(duì)信源進(jìn)行二進(jìn)制編碼時(shí),假使aj的編碼長(zhǎng)度是Lj,在Lj=-log2Pj時(shí),平均碼長(zhǎng)取最小值H(X),H(X)是信源的熵?;径ɡ碛靡韵鹿奖硎荆?/p>
L=∑PjLj≥H(X)
熵編碼在實(shí)際的壓縮編碼中很難達(dá)到熵值,越接近熵值,壓縮效果就越好,壓縮比越高。
3 可伸縮編碼技術(shù)
3.1 可伸縮編碼的發(fā)展及含義
可伸縮編碼技術(shù)已經(jīng)有20年的歷史,早起出現(xiàn)的H.262/MPEG-2,H.263,MPEG-4有若干工具能夠滿足一些比較重要的可伸縮性需求,但是因?yàn)榻獯a器的復(fù)雜度過(guò)高,在實(shí)現(xiàn)空間,質(zhì)量可伸縮時(shí)的編碼效率低下,編碼質(zhì)量存在階躍性突變等問(wèn)題,故以上可伸縮編碼技術(shù)沒(méi)有獲得廣泛的應(yīng)用。
SVC技術(shù)因?yàn)榭梢怨?jié)省傳輸帶寬,能夠自適應(yīng)解碼顯示,所以具有廣闊的發(fā)展前景。以下介紹主要針對(duì)SVC。
在實(shí)際的視頻應(yīng)用中,傳輸?shù)膸捠窃诓粩喟l(fā)生變化的,各種終端的需求也不同,為了滿足實(shí)際需求,可伸縮編碼就產(chǎn)生了??缮炜s性編碼將輸入的視頻序列編碼為一個(gè)基本層,多個(gè)增強(qiáng)層?;緦拥囊曨l質(zhì)量比較低,增強(qiáng)層的視頻質(zhì)量比較高。服務(wù)器可以根據(jù)需求發(fā)送對(duì)應(yīng)的數(shù)據(jù)。接收端根據(jù)接受到的數(shù)據(jù)解碼出對(duì)應(yīng)質(zhì)量視頻。
3.2 可伸縮編碼的分來(lái)
實(shí)現(xiàn)可伸縮視頻編碼的方法比較常見(jiàn)的有三種:時(shí)間可伸縮,空間可伸縮以及質(zhì)量可伸縮。這三種編碼方法的實(shí)現(xiàn)原理是不同的,所以編碼方法的性能也是不同的。這三種方法的性能一般和特定的參數(shù)是緊密相關(guān)的。時(shí)間可伸縮中GOP的作用是至關(guān)重要的,空間可伸縮的層間預(yù)測(cè)則較為重要。時(shí)間可伸縮以幀率角度進(jìn)行編碼,空間可伸縮以分辨率角度進(jìn)行編碼,質(zhì)量可伸縮以量化步長(zhǎng)的角度進(jìn)行編碼。下面對(duì)這三種比較常見(jiàn)的壓縮編碼方法進(jìn)行闡述。
3.2.1時(shí)間可伸縮編碼
時(shí)域可伸縮根據(jù)人眼對(duì)聯(lián)系性圖像的響應(yīng)時(shí)間,在基本幀率和最高幀率之間提供幀率可伸縮。如果網(wǎng)絡(luò)帶寬比較窄,則接受基本幀率的視頻;如果網(wǎng)絡(luò)帶寬比較大,則同時(shí)接受基本幀率和高幀率視頻,解碼出的視頻比只接受基本幀率的視頻的質(zhì)量要好。時(shí)間可伸縮是通過(guò)等級(jí)B圖像,運(yùn)動(dòng)補(bǔ)償時(shí)域?yàn)V波編碼實(shí)現(xiàn)的。不同層量化參數(shù)的選擇對(duì)等級(jí)B圖像的編碼效率影響是非常大的?;緦邮怯申P(guān)鍵幀組成的,所以要選擇最小的量化參數(shù);增強(qiáng)層對(duì)別層的影響較基本層要小,可以選擇稍大的量化參數(shù)。等級(jí)越高,量化參數(shù)對(duì)應(yīng)的就越大。
3.2.2空間可伸縮編碼
空間可伸縮編碼將輸入的原始視頻序列進(jìn)行下采樣,從而得到低分辨率的視頻。不同的空間分辨率形成不同的編碼層。在空間分辨率的基礎(chǔ)上可進(jìn)而實(shí)現(xiàn)時(shí)間可伸縮和質(zhì)量可伸縮。每層的編碼時(shí)互相獨(dú)立的,編碼參數(shù)壓實(shí)相互獨(dú)立的,比如說(shuō)運(yùn)動(dòng)信息,量化參數(shù)及變換參數(shù)等。空間可伸縮編碼有三種預(yù)測(cè)方式:層間幀內(nèi)預(yù)測(cè),層間運(yùn)動(dòng)預(yù)測(cè)及層間殘差預(yù)測(cè)。
3.2.2.1層間幀內(nèi)預(yù)測(cè)
在對(duì)增強(qiáng)層的宏塊進(jìn)行編碼時(shí),首先需要確定當(dāng)前宏塊是否存在與之對(duì)應(yīng)的基本層宏塊;如果存在基本層宏塊,再繼續(xù)判斷是否使用幀內(nèi)預(yù)測(cè)。如果使用幀內(nèi)預(yù)測(cè),則對(duì)基本層宏塊進(jìn)行上采樣之后,作為增強(qiáng)層宏塊的預(yù)測(cè)塊。
3.2.2.2層間運(yùn)動(dòng)預(yù)測(cè)
層間運(yùn)動(dòng)預(yù)測(cè)分為基本層模式,1/4像素修正模式。在基本層模式中,增強(qiáng)層的運(yùn)動(dòng)矢量,宏塊分割等信息是由相對(duì)應(yīng)基本層宏塊提供的?;緦雍陦K的運(yùn)動(dòng)信息放大后可以直接應(yīng)用在增強(qiáng)層宏塊。在使用1/4像素修正模式時(shí),基本層運(yùn)動(dòng)矢量信息要在增強(qiáng)層的1/4精度內(nèi)進(jìn)行適當(dāng)?shù)恼{(diào)整。層間預(yù)測(cè)的使用可以大量減少層內(nèi)運(yùn)動(dòng)估計(jì),模式判斷。
3.2.2.3層間殘差預(yù)測(cè)
層間殘差預(yù)測(cè)使用基本層的預(yù)測(cè)殘差信息對(duì)增強(qiáng)層的殘差信息進(jìn)行預(yù)測(cè),對(duì)兩者之間的差值進(jìn)行編碼。只有在基本層和增強(qiáng)層的運(yùn)動(dòng)矢量信息相似或相等的情況下,兩層之間的殘差的相關(guān)性才會(huì)比較大,使用層間殘差預(yù)測(cè)才會(huì)比較合適。如果兩層運(yùn)動(dòng)矢量的差異性比較大,則不適合使用層間殘差預(yù)測(cè),此時(shí),很有可能會(huì)降低編碼效率。
3.2.3質(zhì)量可伸縮編碼
質(zhì)量可伸縮編碼有兩種:精細(xì)可伸縮編碼和粗粒可伸縮編碼。兩者的思想,架構(gòu)都是相同的。
精細(xì)可伸縮編碼(FGS,F(xiàn)ine Granular Scalable)的核心思想是通過(guò)使用增強(qiáng)層的圖像作預(yù)測(cè)參考幀,從而提高編碼效率。FGS將原始視頻壓縮為基本層碼流,增強(qiáng)層碼流兩個(gè)碼流。基本層采用的是傳統(tǒng)的非可伸縮編碼。增強(qiáng)層采用的是位平面編碼技術(shù),解碼端根據(jù)接受到增強(qiáng)層數(shù)據(jù)解碼質(zhì)量不同的視頻序列。FGS的核心算法是基于DCT系數(shù)的位平面編碼。
粗??缮炜s編碼(CGS,Coarse Grain Scalability)的編碼結(jié)構(gòu)和空間可伸縮式非常相似的。但是CGS的增強(qiáng)層的空間分辨率是相同的,而且增強(qiáng)層的量化系數(shù)一般比基本層的要小,因此食品質(zhì)量伴著層級(jí)的遞增就越來(lái)越好。編碼框架如下所述:對(duì)原始圖像進(jìn)行DCT變換之后進(jìn)行量化參數(shù)比較大的粗量化,然后進(jìn)行熵編碼,熵編碼后形成基本層數(shù)據(jù)。然后把粗量化的數(shù)據(jù)進(jìn)行反量化,原始圖像DCT與之作差。然后對(duì)差值進(jìn)行量化參數(shù)比較小的細(xì)量化,進(jìn)行熵編碼之后形成增強(qiáng)層的數(shù)據(jù)。量化參數(shù)大,解碼出來(lái)的視頻質(zhì)量比較差;量化參數(shù)小,解碼出來(lái)的圖像的質(zhì)量比較好。 3.3 SVC在數(shù)字電視的應(yīng)用
現(xiàn)在數(shù)字電視采用的編碼標(biāo)準(zhǔn)大部分是MPEG-2,SVC還沒(méi)有在數(shù)字電視中推廣起來(lái),因?yàn)镾VC不被老式機(jī)頂盒所支持,所以這種不兼容性也在一定程度上造成了新標(biāo)準(zhǔn)使用的延遲。
4 結(jié)束語(yǔ)
隨著視頻編碼的不斷發(fā)展,可分級(jí)視頻編碼是近幾年來(lái)的研究熱點(diǎn),它是解決現(xiàn)代視頻傳輸和存儲(chǔ)系統(tǒng)中異構(gòu)問(wèn)題的非常重要的手段。該文首先對(duì)視頻編碼的發(fā)展及現(xiàn)狀進(jìn)行詳細(xì)的說(shuō)明,然后對(duì)視頻編碼的基本原理進(jìn)行必要的說(shuō)明。最后對(duì)可伸縮編碼分類及每個(gè)類別進(jìn)行詳細(xì)的闡述。
視頻編碼技術(shù)不斷發(fā)展,新的編碼標(biāo)準(zhǔn)也在不斷的推出?,F(xiàn)在,視頻編碼也在面臨新的挑戰(zhàn)。
1) 網(wǎng)絡(luò)視頻應(yīng)用對(duì)視頻編碼碼流的“友好性”提出了更高層次的要求。
2) 高清晰度、高質(zhì)量視頻的推廣和普及對(duì)視頻編碼壓縮效率提出了更高層次的要求。
綜上所述,這兩個(gè)挑戰(zhàn),將是當(dāng)前和未來(lái)視頻編碼技術(shù)的研究中需要解決的比較重要的課題。
參考文獻(xiàn):
[1] 李德識(shí),李薇.無(wú)線傳感器網(wǎng)絡(luò)中覆蓋問(wèn)題的研究[J].微電子學(xué)與計(jì)算機(jī),2005,22(8):150-152.
[2] 畢厚杰. 新一代視頻壓縮編碼標(biāo)準(zhǔn)H.264[M].北京:人民郵電出版社,2004.
[3] 吳俊峰. H_264SVC可伸縮視頻編碼及轉(zhuǎn)碼技術(shù)研究[D].天津大學(xué),2008.
[4] JVT. ISO/ETC 14496-10:2010 Information Technology — Coding of Audio-Visual Objects — Part 10: Advanced Video Coding. 2010
[5] 陳靖,劉京,曹喜信.深入理解視頻編解碼技術(shù)[M].北京:北京航空航天大學(xué)出版社,2012.
[6] JVT-X202. Joint Scalable Video Model JSVM-11. 2012
[7] 鐘玉琢,王琪,趙黎,楊小勤.MPEG-2運(yùn)動(dòng)圖像壓縮編碼國(guó)際標(biāo)準(zhǔn)及MPEG的新發(fā)展[M].北京:清華大學(xué)出版社,2002.
[8] 柳輝.可伸縮性視頻編碼的轉(zhuǎn)碼及其應(yīng)用[D].中國(guó)科技大學(xué),2009.
[9] 王偉超.基于MPEG_2的多視點(diǎn)視頻可分級(jí)實(shí)時(shí)解碼器研究[D].天津大學(xué),2009.
[10] ITU-T and ISO/IEC JTC1.Joint Scalable Video Model JSVM-9.19,2011.
點(diǎn)擊下頁(yè)還有更多>>>數(shù)字視頻編碼技術(shù)論文