1、引言
IPTV業(yè)務(wù)是指基于寬帶互聯(lián)網(wǎng)與寬帶接入,以機頂盒或其它具有視頻編解碼能力的數(shù)字化設(shè)備作為終端,通過聚合SP的各種流媒體服務(wù)內(nèi)容和增值應(yīng)用,為用戶提供多種互動多媒體服務(wù)的寬帶增值業(yè)務(wù)。
IPTV能否成功開展的一個關(guān)鍵點是采用什么樣的視頻編解碼標(biāo)準(zhǔn),因為IPTV業(yè)務(wù)需要在有限的網(wǎng)絡(luò)帶寬條件下提供清晰的圖像質(zhì)量,對編碼效率有較高的要求;同時,視頻編碼標(biāo)準(zhǔn)的選擇會直接影響到整個IPTV產(chǎn)業(yè)鏈的發(fā)展,涉及從內(nèi)容編碼到流媒體服務(wù)器以及組播復(fù)制點直至用戶機頂盒各個層面,要從某一種編碼格式轉(zhuǎn)換為另一種編碼格式,需要進行的系統(tǒng)升級甚至硬件更換的成本是極其巨大的。也正因為這一點,視頻編碼標(biāo)準(zhǔn)的選擇一直是IPTV業(yè)界關(guān)注的首要問題。
2、視頻編解碼標(biāo)準(zhǔn)簡介
視頻編解碼標(biāo)準(zhǔn)有很多種,目前國內(nèi)IPTV產(chǎn)業(yè)中主要采用了MPEG-4、H.264技術(shù)以及中國提出的具有自主知識產(chǎn)權(quán)的標(biāo)準(zhǔn)AVS這3種標(biāo)準(zhǔn),相對于H.264和AVS技術(shù)標(biāo)準(zhǔn),MPEG4 ASP在流媒體和IPTV應(yīng)用市場中起步時間早,因此產(chǎn)業(yè)化程度成熟,IPTV設(shè)備提供商的支持也廣泛;AVS的產(chǎn)業(yè)化程度,H.264次之。下面對這3種標(biāo)準(zhǔn)進行介紹。
2.1 MPEG-4標(biāo)準(zhǔn)簡介
運動圖像專家組(MPEG)于1999年2月正式公布了MPEG-4(ISO/IEC14496)標(biāo)準(zhǔn)版本。同年年底公布了MPEG-4第 2版,且于2000年年初正式成為國際標(biāo)準(zhǔn)。MPEG-4與MPEG-1和MPEG-2有著很大的差異,MPEG-4不只是具體壓縮算法,它是針對數(shù)字電視、交互式繪圖應(yīng)用、交互式多媒體等整合及壓縮技術(shù)的需求而制定的國際標(biāo)準(zhǔn)。
MPEG-4除采用代視頻編碼的核心技術(shù),如變換編碼、運動估計與運動補償、量化、熵編碼外,還提出了一些有創(chuàng)見性的關(guān)鍵技術(shù),其中包括:
(1)視頻對象提取技術(shù)
MPEG-4標(biāo)準(zhǔn)同以前標(biāo)準(zhǔn)的顯著的差別在于它是采用基于對象的編碼理念,即在編碼時將一幅景物分成若干在時間和空間上相互聯(lián)系的視頻音頻對象,分別編碼后再經(jīng)過復(fù)用傳輸?shù)浇邮斩耍缓笤賹Σ煌膶ο蠓謩e解碼,從而組合成所需要的視頻和音頻。這樣可以實現(xiàn)對不同的對象采用不同的編碼方法和表示方法,又有利于不同數(shù)據(jù)類型間的融合,同時也便于對各種對象進行操作及編輯。視頻對象提?。匆曨l對象分割)是MPEG-4視頻編碼的關(guān)鍵技術(shù),也是新一代視頻編碼的研究熱點和難點。
(2)VOP視頻編碼技術(shù)
視頻對象平面(VOP,Video Object Plane)是視頻對象(VO)在某一時刻的采樣,VOP是MPEG-4視頻編碼的核心概念。MPEG-4在編碼過程中針對不同VO采用不同的編碼策略,即對前景VO的壓縮編碼盡可能保留細(xì)節(jié)和平滑;對背景VO則采用高壓縮率的編碼策略,甚至不予傳輸而在解碼端由其他背景拼接而成。這種基于對象的視頻編碼不僅克服了代視頻編碼中高壓縮率編碼所產(chǎn)生的方塊效應(yīng),而且使用戶可與場景交互,從而既提高了壓縮比,又實現(xiàn)了基于內(nèi)容的交互,為視頻編碼提供了廣闊的發(fā)展空間。MPEG-4支持任意形狀圖像與視頻的編解碼。
(3)視頻編碼可分級性技術(shù)
MPEG-4通過視頻對象層(VOL,Video Object Layer)數(shù)據(jù)結(jié)構(gòu)來實現(xiàn)分級編碼。MPEG-4提供了兩種基本分級工具,即時域分級(Temporal Scalability)和空域分級(Spatial Scalability),此外還支持時域和空域的混合分級。每一種分級編碼都至少有兩層VOL,低層稱為基本層,高層稱為增強層?;緦犹峁┝艘曨l序列的基本信息,增強層提供了視頻序列更高的分辨率和細(xì)節(jié)。
(4)運動估計與運動補償技術(shù)
MPEG-4采用I-VOP、P-VOP、B-VOP3種幀格式來表征不同的運動補償類型。它采用了H.263中的半像素搜索技術(shù)和重疊運動補償技術(shù),同時又引入重復(fù)填充(repetitive padding)技術(shù)和修改的塊匹配(modified block matching)技術(shù)以支持任意形狀的VOP區(qū)域。
在MPEG-4視頻編碼中,運動估計相當(dāng)耗時,對編碼的實時性影響很大。因此這里特別強調(diào)快速算法。運動估計方法主要有像素遞歸法和塊匹配法兩大類,前者復(fù)雜度很高,實際中應(yīng)用較少,后者則在H.263和MPEG中廣泛采用。
2.2 H.264標(biāo)準(zhǔn)簡介
2003年,ITU-T通過了一個新的數(shù)字視頻編解碼標(biāo)準(zhǔn),即H.264標(biāo)準(zhǔn),H.264是由ISO/IEC與ITU-T組成的聯(lián)合視頻組制定的新一代視頻壓縮編解碼標(biāo)準(zhǔn)。國際電信聯(lián)盟將該系統(tǒng)命名為H.264/AVC,國際標(biāo)準(zhǔn)化組織和國際電工委員會將其稱為14496-10/MPEG-4 AVC。
H.264標(biāo)準(zhǔn)只有3個子集:基本子集、主體子集和擴展子集。基本子集是專為視頻會議應(yīng)用設(shè)計的,能夠提供強大的差錯隱消技術(shù),并且支持低延時編/解碼技術(shù),使視頻會議顯得更自然。主體子集和擴展子集更適合于電視應(yīng)用(數(shù)字廣播、DVD)和延時影響不會太大的視頻流應(yīng)用。
H.264標(biāo)準(zhǔn)的關(guān)鍵技術(shù)如下:
(1)幀內(nèi)預(yù)測編碼
幀內(nèi)編碼用來縮減圖像的空間冗余。為了提高H.264幀內(nèi)編碼的效率,在給定幀中充分利用相鄰宏塊的空間相關(guān)性,相鄰的宏塊通常含有相似的屬性。因此,在對一給定宏塊編碼時,首先可以根據(jù)周圍的宏塊預(yù)測,然后對預(yù)測值與實際值的差值進行編碼,這樣,相對于直接對該幀編碼而言,可以大大減小碼率。H.264提供6種模式進行4×4像素宏塊預(yù)測,包括1種直流預(yù)測和5種方向預(yù)測,H.264也支持16×16的幀內(nèi)編碼。
(2)幀間預(yù)測編碼
幀間預(yù)測編碼利用連續(xù)幀中的時間冗余來進行運動估計和補償。H.264的運動補償支持以往的視頻編碼標(biāo)準(zhǔn)中的大部分關(guān)鍵特性,而且靈活地添加了更多的功能,除了支持P幀、B幀外,H.264還支持一種新的流間傳送幀——SP幀,碼流中包含SP幀后,能在有類似內(nèi)容
但有不同碼率的碼流之間快速切換,同時支持隨機接入和快速回放模式。
(3)整數(shù)變換
在變換方面,H.264使用了基于4×4像素塊的類似于DCT的變換,但使用的是以整數(shù)為基礎(chǔ)的空間變換,不存在反變換。與浮點運算相比,整數(shù) DCT變換會引起一些額外的誤差,但因為DCT變換后的量化也存在量化誤差,與之相比,整數(shù)DCT變換引起的量化誤差影響并不大。此外,整數(shù)DCT變換還具有減少運算量和復(fù)雜度,有利于向定點DSP移植的優(yōu)點。
(4)量化
H.264中可選32種不同的量化步長,這與H.263中有31個量化步長很相似,但是在H.264中,步長是以12.5%的復(fù)合率遞進的,而不是一個固定常數(shù)。在H.264中,變換系數(shù)的讀出方式也有兩種:之字形(Zigzag)掃描和雙掃描,大多數(shù)情況下使用簡單的之字形掃描;雙掃描僅用于使用較小量化級的塊內(nèi),有助于提高編碼效率。
(5)熵編碼
視頻編碼處理的一步就是熵編碼,H.264標(biāo)準(zhǔn)采用的熵編碼有兩種:一種是基于內(nèi)容的自適應(yīng)變長編碼(CAVLC)與統(tǒng)一的變長編碼(UVLC)結(jié)合;另一種是基于內(nèi)容的自適應(yīng)二進制算術(shù)編碼(CABAC)。CAVLC與CABAC根據(jù)相臨塊的情況進行當(dāng)前塊的編碼,以達到更好的編碼效率。CABAC比CAVLC壓縮效率高,但要復(fù)雜一些。
2.3 AVS標(biāo)準(zhǔn)簡介
AVS是基于我國創(chuàng)新技術(shù)和部分公開技術(shù)的自主標(biāo)準(zhǔn),AVS標(biāo)準(zhǔn)包括系統(tǒng)、視頻、音頻、數(shù)字版權(quán)管理等4個主要技術(shù)標(biāo)準(zhǔn)和一致性測試等支撐標(biāo)準(zhǔn)。2002年在信息產(chǎn)業(yè)部支持下,成立了“數(shù)字音視頻編解碼技術(shù)標(biāo)準(zhǔn)”工作組(簡稱AVS工作組),在國內(nèi)外上百家企業(yè)和科研單位共同參與下,AVS標(biāo)準(zhǔn)制定工作進展順利,其中重要的視頻編碼標(biāo)準(zhǔn)于2005年通過國家廣電總局測試,2006年1月得到信息產(chǎn)業(yè)部批準(zhǔn),2月國家標(biāo)準(zhǔn)化管理委員會正式頒布,3月1日起實施。
AVS視頻編解碼的核心技術(shù)包括:8×8整數(shù)變換、量化、幀內(nèi)預(yù)測、1/4精度像素插值、特殊的幀間預(yù)測運動補償、二維熵編碼等。
(1)變換量化
AVS的8×8變換與量化可以在16位處理器上無失配地實現(xiàn),從而克服了H.264之前所有視頻壓縮編碼國際標(biāo)準(zhǔn)中采用的8×8 DCT變換存在失配的固有問題。而H.264所采用的4×4整數(shù)變換在高分辨率的視頻圖像上的去相關(guān)性能不及8×8的變換有效。AVS采用了64級量化,可以完全適應(yīng)不同的應(yīng)用和業(yè)務(wù)對碼率和質(zhì)量的要求。
(2)幀內(nèi)預(yù)測
AVS的幀內(nèi)預(yù)測技術(shù)沿襲了H.264幀內(nèi)預(yù)測的思路,用相鄰塊的像素預(yù)測當(dāng)前塊,采用代表空間域紋理方向的多種預(yù)測模式。但AVS亮度和色度幀內(nèi)預(yù)測都是以8×8塊為單位的。亮度塊采用5種預(yù)測模式,色度塊采用4種預(yù)測模式,而這4種模式中又有3種和亮度塊的預(yù)測模式相同。在編碼質(zhì)量相當(dāng)?shù)那疤嵯?,AVS采用較少的預(yù)測模式,使方案更加簡潔、實現(xiàn)的復(fù)雜度大為降低。
(3)幀間預(yù)測
幀間運動補償編碼是混合編碼技術(shù)框架中重要的部分之一。AVS標(biāo)準(zhǔn)采用了16×16,16×8,8×16和8×8的塊模式進行運動補償,而去除了H.264標(biāo)準(zhǔn)中的8×4,4×8,4×4的塊模式,目的是能更好地刻畫物體運動,提高運動搜索的準(zhǔn)確性。較少的塊模式,能降低運動矢量和塊模式傳輸?shù)拈_銷,從而提高壓縮效率、降低編解碼實現(xiàn)的復(fù)雜度。
(4)熵編碼
AVS熵編碼采用自適應(yīng)變長編碼技術(shù),在AVS熵編碼過程中,所有的語法元素和殘差數(shù)據(jù)都是以指數(shù)哥倫布碼的形式映射成二進制比特流。采用指數(shù)哥倫布碼的優(yōu)勢在于:一方面 ,它的硬件復(fù)雜度比較低,可以根據(jù)閉合公式解析碼字,無需查表;另一方面,它可以根據(jù)編碼元素的概率分布靈活地確定以k階指數(shù)哥倫布碼編碼,如果k選得恰當(dāng),則編碼效率可以逼近信息熵。
3、三種編碼標(biāo)準(zhǔn)的對比與選擇
3.1 基本性能對比
3種編碼標(biāo)準(zhǔn)的基本功能對比如表1:
表1 3種視頻編解碼標(biāo)準(zhǔn)的基本功能
這3種主要編碼技術(shù)各有優(yōu)缺點,MPEG-4標(biāo)準(zhǔn)因為發(fā)布較早,產(chǎn)業(yè)化程度較高,因此產(chǎn)品相對成熟,內(nèi)容比較豐富、價格也較低,同時算法復(fù)雜度較低,但相應(yīng)的問題是編碼效率也相對較低,需要占用較多的帶寬,對網(wǎng)絡(luò)要求較高,對于現(xiàn)有網(wǎng)絡(luò)需要進行升級改造才能滿足其需求。
對于H.264標(biāo)準(zhǔn),目前市場上已經(jīng)有多家廠商提供H.264芯片和機頂盒,產(chǎn)品開始成熟,內(nèi)容也逐漸豐富,而且因為采用了多項提高圖像質(zhì)量和增加壓縮比的技術(shù)措施,在不影響視頻效果的情況下能夠比MPEG-4節(jié)約39%的碼率,因而占用帶寬較低。例如要達到標(biāo)清的播放質(zhì)量,MPEG-4編碼需要1.5~2Mbit/s的碼率,而H.264只需要1.2~1.5Mbit/s碼率即可;對于高清圖像質(zhì)量,MPEG-4編碼的視頻碼率需要 6~8Mbit/s,而H.264只需要4~6Mbit/s。因此采用H.264可以大大節(jié)約網(wǎng)絡(luò)帶寬,減少網(wǎng)絡(luò)改造的壓力,且在帶寬相同的情況下能夠覆蓋更多的用戶。同時,由于H.264是由ITU-T和ISO/IEC聯(lián)合制定的,所以對解碼兼容性有著明確的定義,具有較強的抗誤碼能力,容易獲得穩(wěn)定的圖像,適用于丟包率高、干擾嚴(yán)重的信道傳輸。不過H.264的算法復(fù)雜度較高,系統(tǒng)開銷也比較大。
AVS是近幾年才提出的視頻標(biāo)準(zhǔn),產(chǎn)業(yè)化進程落后于H.264。但是AVS的編碼效率與H.264相當(dāng),而算法復(fù)雜度比H.264明顯低,其編碼復(fù)雜度相當(dāng)于H.264的30%;解碼復(fù)雜度相當(dāng)于H.264的70%,軟硬件實現(xiàn)成本都低于H.264;同時由于我國掌握主要知識產(chǎn)權(quán),專利授權(quán)模式簡單,專利費用低,因此可以預(yù)見AVS標(biāo)準(zhǔn)將會是支撐國家數(shù)字音視頻產(chǎn)業(yè)發(fā)展的重要標(biāo)準(zhǔn)。
3.2 專利費用對比
如果采用國外的技術(shù)標(biāo)準(zhǔn),不得不面臨高昂的專利費用的問題。3種標(biāo)準(zhǔn)對應(yīng)的專利費用如表2所示:
表2 3種標(biāo)準(zhǔn)的專利費用
可以看出在專利費方面AVS占有的優(yōu)勢。MPEG-4和H.264不僅要收軟硬件的專利費,而且還要收取節(jié)目點播費用等,如果按照這兩種標(biāo)準(zhǔn)的專利收費標(biāo)準(zhǔn),中國龐大用戶群將給運營商帶來每年數(shù)以億計的巨大專利費負(fù)擔(dān);而AVS只收取1元人民幣的象征性費用,對于運營商來講非常具有吸引力。
3.3 應(yīng)用情況對比
從目前的應(yīng)用情況來看,MPEG-4和H.264在中國市場具有一定的發(fā)展優(yōu)勢,在中國電信和中國網(wǎng)通已經(jīng)開展的IPTV試驗及商用網(wǎng)中, MPEG4和H.264同時存在,例如中國電信在上海截止目前已經(jīng)有15萬左右的IPTV用戶,使用的是H.264編碼標(biāo)準(zhǔn);廣東電信的IPTV商用網(wǎng)也將實現(xiàn)MPEG4向H.264標(biāo)準(zhǔn)的整體平移。中國網(wǎng)通現(xiàn)已開展了基于AVS標(biāo)準(zhǔn)的IPTV試驗。由于AVS推出較晚,還處于上下游產(chǎn)業(yè)鏈的完善階段,在市場的推廣和開拓方面還有待加強,真正商用有待驗證其圖像質(zhì)量、商用情況是否滿足商用要求和產(chǎn)業(yè)鏈的逐漸成熟。目前3種標(biāo)準(zhǔn)常見的應(yīng)用場景列舉如表3:
表3 3種標(biāo)準(zhǔn)的應(yīng)用場景
3.4 三種編碼標(biāo)準(zhǔn)的選擇
由上面的對比可以看出,3種編碼標(biāo)準(zhǔn)在性能、設(shè)備成本、產(chǎn)業(yè)化程度及專利費用方面都各有千秋,具體選擇哪種視頻編碼標(biāo)準(zhǔn)還需綜合考慮各方面因素。對于IPTV產(chǎn)業(yè)來說,H.264得到了電信運營商及設(shè)備提供商的支持,目前已經(jīng)逐漸占據(jù)市場主流的地位,而AVS憑借低廉的專利費優(yōu)勢,長遠(yuǎn)來說對運營商更具誘惑力,同時又得到了中國政府的支持,今后的應(yīng)用前景將比較樂觀。
4、結(jié)束語
本文討論了目前國內(nèi)IPTV產(chǎn)業(yè)中主要采用的3種編碼標(biāo)準(zhǔn)MPEG-4、H.264及AVS。通過介紹和對比這3種標(biāo)準(zhǔn),可以看出 H.264/AVS是目前主流的選擇。當(dāng)然事物都在不斷發(fā)展,音視頻編解碼技術(shù)也處于不斷演進的過程中,因此多種編碼標(biāo)準(zhǔn)在相當(dāng)長的時間內(nèi)還將繼續(xù)共存。今后的IPTV舞臺上,編碼標(biāo)準(zhǔn)將花落誰家,讓我們拭目以待。