1. gzyueqian
      13352868059
      首頁 > 新聞中心 > > 正文

      TMS320C6201在MPEG-4視頻解碼器中的應(yīng)用

      更新時間: 2005-12-07 15:45:43來源: 粵嵌教育瀏覽量:3757

      引言

      隨著網(wǎng)絡(luò)和多媒體技術(shù)的發(fā)展,視覺通信的重要性和需求急劇增加,如桌面視頻會議、移動終端、基于因特網(wǎng)的視音頻通信等。隨之而來的是視頻壓縮技術(shù)的迅速發(fā)展和視頻壓縮標(biāo)準(zhǔn)的不斷推出。國際運動圖像編碼專家組(MPEG)先后推出了MPEG-1、MPEG-2和MPEG-4.MPEG-4是由國際運動圖像專家組于1998年11月制定的。它是一個面向多媒體應(yīng)用的壓縮標(biāo)準(zhǔn),其應(yīng)用覆蓋范圍遠(yuǎn)大于MPEG-1和MPEG-2等標(biāo)準(zhǔn)。從移動可視電話到專業(yè)視頻編輯,既支持自然圖像,也支持計算機合成圖像。重要的是它支持交互功能。這是由于MPEG-4采用了與其它標(biāo)準(zhǔn)不同的、基于對象的圖像描述方式。目前,國內(nèi)有關(guān)MPEG-4應(yīng)用技術(shù)的研究及開發(fā)的工作正在悄然興起。筆者在研究了MPEG-4視頻標(biāo)準(zhǔn)之后,充分利用TMS320C6201的硬件資源和軟件優(yōu)化,實時實現(xiàn)了嵌入式MPEG-4視頻解碼器。


      1 MPEG-4視頻碼流及主要算法

      MPEG-4采用了基于對象的壓縮編碼技術(shù)。在編碼前,首先要對視頻序列進(jìn)行分析,從原理圖像中分割出各個視頻對象,然后南分別對每個視頻對象單獨編碼。每個對象都有自己的形狀信息(shape)、運動信息(motion)、紋理信息(texture)。對視頻對象的編碼就是對這3種信息進(jìn)行編碼。MPEG-4通過運動預(yù)測和運行補償來去除連續(xù)幀之間的時間冗余。運動預(yù)測與運動補償?shù)木瓤梢詾檎袼亍胂袼鼗?/4像素,另外還增了重疊運動補償方式。與形狀相關(guān)算法有:基于鄰近信息的算術(shù)編碼、水平和垂直填補、擴張?zhí)钛a等。與紋理編碼相關(guān)的算法有:離散余弦變換(DCT)、量化、DCT系數(shù)的DC/AC差分預(yù)測、Zig-Zag掃描、游程編碼、霍夫曼變長編碼等。

      筆者實現(xiàn)的是MPEG-4的SVP(Simple Visual Profile)視頻解碼。視頻序列全部為矩形,所以不存在任意形狀編碼。視頻序列按照視頻對象層VOL(Video Object Layer)、視頻對象平臺VOP(Video Object Plane)、宏塊MB(Macro Block)視順序編成一串碼流。1個VOL中包含多個VOP,1個VOP中包含多個MB。MB是碼流中的基本單位。MB又分為幀內(nèi)MB(intraMB)、幀間MB(imterMB)。幀間4VMB(inter4VMB)等幾種。在I-VOP中,所有的宏塊都是intraMB。P-VOP中宏塊有多種可能,可以是intraMB、interMB或inter4VMB。P-VOP中的interMB或inter4VMB的碼流描述如下:

      MB碼流=MB形狀+MB頭信息+MV+DCT紋理信息(Y1+Y2+Y3+Y4+U+V)

      由于是矩形幀,所以無形狀編碼MB shape部分。

      MB頭信息中主要包括4個參數(shù):not_coded(本MB是否編碼的標(biāo)志位)、mcbpc(色度塊U和V是否編碼的標(biāo)志位)、cbpy(亮度塊Y1~Y4是否編碼的標(biāo)志位)、dquant(本MB中DCT系數(shù)量化步長的增量值)。

      MV為運動矢量,實際寫入碼流的是運動矢量誤差值(ΔMV),這是因為編碼中MV采用差分編碼。如果MB是一個interMB,則表示本MB只有1個運動矢量,所以在碼流中只傳1個ΔMV;如果MB是一個inter4VMB,則表示本MB有4個運行矢量,即每個子塊(block)有1個運動矢量,所以在碼流中需傳送4個ΔMV,即mvd1、mvd2、mvd3和mvd4。

      是一連串經(jīng)過量化、Zig-Zag掃描、游程編碼和霍夫曼變長編碼的DCT系數(shù),按照Y1、Y2、Y3、Y4、U和V的先后順序編碼。

      2 TMS320C6201 DSP及EVM板介紹

      2.1 TMS320C6201 DSP

      TMS320C6201是美國TI公司的C6000系列新一代數(shù)字信號處理器中的第1個產(chǎn)品,于1997年3月發(fā)布。它是一個32bit的定點DSP芯片。該芯片具有8個相互獨立的功能單元,可以工作在200MHz的CPU時鐘頻率,全速運行時可達(dá)到1600 MIPS。其主要特性包括:

      *芯片內(nèi)核采用VelociTI TM先進(jìn)的超長指令字(VLIW)結(jié)構(gòu),具有高度的并行性和快速的運行能力,每個時鐘周期多可同時執(zhí)行8條32位指令,并且所有的指令都可以有條件執(zhí)行;

      *具有豐富的指令系統(tǒng)且可對字節(jié)操作,支持16位的乘法運算;

      *有4個彼此獨立的快速的DMA通道,可以進(jìn)行多種形式的數(shù)據(jù)傳輸。

      *片內(nèi)數(shù)據(jù)存儲區(qū)和程序存儲區(qū)各64KB,并支持多種數(shù)據(jù)寬度8位/16位/32位;32位的外部存儲器接口,提供與片外SDRAM、SDSRAM和SRAM的直接接口。

      TMS320C6201的以上特點,能滿足視頻圖像處理的實時性要求。例如:TMS320C6201 DSP計算1塊8×8 IDCT(逆變散余弦變換)僅用(168+62)個時鐘周期,為1.15μs

      2.2 EVM板

      TMS320C6201 EVM板是一塊帶有PCI接口的插卡,除了可以插在計算機主板的PCI插槽上使用外,還可以外配電源作為獨立的模塊工作,并通過XDS510仿真器進(jìn)行調(diào)試。該板上配有1片TMS320C6201 DSP,工作在160MHz。

      EVM板上提供的片外存儲器包括1組64Kbit×32(256KB)、133MHz的SBSRAM,配置成CE0;2組4MB、100MHz的SDRAM,分別配置成CE2和CE3;另外還可以通過板上的外部存儲器接口(EMIF)擴展存儲空間,這些擴展存儲器配置成CEI。


      3 用TMS320C6201實現(xiàn)MPEG-4 SVP解碼

      3.1 MPEG-4視頻解碼原理

      MPEG-4的一個VOP的解碼過程如圖1所示,解碼器用這一過程從編碼位流中恢復(fù)視頻對象。不難看出,解碼器主要由形狀解碼器、運動解碼器和紋理解碼器3部分組成。

      3.2 程序流程

      整個程序采用模塊化設(shè)計,以優(yōu)化C語言編程為主。限于篇幅,僅列出主程序流程(如圖2所示)和MB解碼流程(如圖3所示)。

      主程序在初始化后,首先從碼流中解出VOL和VOP的頭,然后根據(jù)這些頭信息以宏塊為單位進(jìn)行解碼。MB解碼單獨做成函數(shù),也是首先解出頭信息,據(jù)此判斷出宏塊類型:幀內(nèi)MB、幀間MB或幀間4VMB。幀內(nèi)MB解碼是以1塊為單位作紋理解碼,解出的紋理值在block[6][64]中,存入解碼后宏塊行緩存區(qū)內(nèi);2種幀間MB解碼相同部分都是先解出運動矢量MV,根據(jù)MV進(jìn)行運動補償?shù)玫筋A(yù)測值存入解碼后宏塊行緩存區(qū),再以塊為單位進(jìn)行紋理解碼,解出殘差值存入block[6][64]中,將block[6][64]加入到解碼后宏塊門緩存區(qū)中得到結(jié)果。不同的是,在解碼MV時intraMB解出1個MV;而inter4VMB解出4個MV。因此,運動補償時,一個按宏塊做,一個按塊做。另外還有一種情況,就是P-VOP中的MB沒有被編碼(not_coded=1),碼流中沒有此宏塊的數(shù)據(jù),應(yīng)該MV=0、DCT系數(shù)全為0處理,即從前一幀同樣位置處找到參考塊作為當(dāng)前宏塊的結(jié)果。

      3.3 存儲器分配

      MPEG-4 SVP解碼器是在EVM板上編程實現(xiàn)的。由于TMS320C6201 DSP片內(nèi)數(shù)據(jù)存儲空量只有64KB,而圖像處理的數(shù)據(jù)量非常大,因此,合理有效地分析存儲空間是解碼設(shè)計中的關(guān)鍵問題。內(nèi)部64KB存儲空間內(nèi)開辟了一些空間用于暫存解碼中常用的一些信息,具體設(shè)置如表1所列。

      表1 內(nèi)部數(shù)據(jù)存儲器空間分配

      全局變量 所占空間/B
      變長解碼(VLD)表 4906
      Zig-Zag掃 192
      VOL、VOP和MB的頭信息 108
      DC/AC預(yù)測和MB模式 5560
      MV預(yù)測 9504
      量化步長 396
      解碼輸出緩存區(qū)(1個宏塊行) 8448
      輸入的壓縮碼流緩存區(qū) 10K

      合    計

      38.3K

      輸入的壓縮碼流和解碼后的視頻輸出都存儲在片外。輸入的壓縮碼流在程序開始前由PC機傳輸?shù)紼VM板的外部存儲器中保存,解碼時分批將數(shù)據(jù)通過DMA方式復(fù)制到片內(nèi)。片內(nèi)設(shè)置1個壓縮碼流緩存區(qū)。解碼后的視頻序列存放在外部存儲器中,在內(nèi)部緩存1個宏塊行,每解完1個宏塊行后,就用DMA傳輸?shù)酵獠看鎯ζ髦小?/p>

      3.4 程序優(yōu)化

      (1)軟件開發(fā)流程及開發(fā)工具

      整個程序的編寫和調(diào)試按照C6000軟件開發(fā)流程進(jìn)行,流程分為:產(chǎn)生C代碼、優(yōu)化C代碼和編寫線性匯編程序3個階段。使用的開發(fā)工具是TI的集成開發(fā)環(huán)境CCS(Code Composer Studio)。在CCS下,可以對軟件進(jìn)行編輯、編譯、調(diào)試、代碼性能測試(profile)等所有工作。

      (2)程序優(yōu)化措施

      為使程序優(yōu)化,采取如下措施:

      ①為編寫出優(yōu)化的C程序,在編程時盡量按照C6000環(huán)境下支持的優(yōu)化C的方法進(jìn)行編程,這樣有助于C編譯器產(chǎn)生高效的匯編代碼。

      ②使用TI提供的庫函數(shù),大大提高了編程效率。

      ③使用DMA傳數(shù),提高了CPU的效率。

      在解碼程序中用DMA方式實現(xiàn)了下列數(shù)據(jù)的傳輸:

      *碼流輸入——碼流從片外存儲器傳輸?shù)狡瑑?nèi);

      *解碼后的結(jié)果輸出——解碼完一宏塊行后,將結(jié)果從片內(nèi)傳輸?shù)狡獗4妫?/p>

      *頂部和低部的填充;

      *運動補償時,將在片外找到的參考塊傳輸?shù)狡瑑?nèi)。

      (3)采用線性匯編對某些程序段做進(jìn)一步優(yōu)化。

      為了提高代碼性能,對影響應(yīng)用程序的代碼可以用線性匯編重新編寫。

      3.5 MPEG-4 SVP解碼器的特性及測試結(jié)果

      按照上述思路所實現(xiàn)的MPEG-4 SVP視頻解碼器完全符合MPEG-4的SVP規(guī)范,其特點如表2所列。輸入圖像分辨率可為QCIF或CIF,輸入比特率為64Kbps、128Kbps和384Kbps,輸出圖像格式為4:2:0YUV,解碼速率為30幀/s。

      表2 MPEG-4 SVP視頻解碼器特性表

      壓縮標(biāo)準(zhǔn) MPEG-4SVP
      輸入圖像分辨率 QCIF(176×144),CIF(352×288)
      像素精度 8bit/pixel
      掃描格式 逐行掃描
      輸入比特率/Kbps 64,128,384
      解碼幀率 30幀/s
      輸出圖像格式 4:2:0 YUV

      在解碼軟件是在EVM板上調(diào)試通過的,解碼時間可在CCS環(huán)境下測得。對于不同的圖像解碼所用的時間是有差異的。筆者對多種情況的碼流進(jìn)行了測試,在1秒內(nèi)都能解出25~30幀,甚至更多幀從而實現(xiàn)了實時解碼。

      結(jié)束語

      筆者在研究了MPEG-4的視頻編解碼算法之后,成功地在TMS320C6201 EVM板上編程實現(xiàn)子MPEG-4 SVP的實時解碼,為終設(shè)計出獨立的MPEG-4解碼器打下了基礎(chǔ)。此解碼器可以嵌入到某些移動終端中,用于解碼VPEG-4碼流,如PDA、機頂盒和住宅網(wǎng)關(guān)等;還可以與相應(yīng)的編碼器配套用于遠(yuǎn)程監(jiān)控中。

      免費預(yù)約試聽課

      亚洲另类欧美综合久久图片区_亚洲中文字幕日产无码2020_欧美日本一区二区三区桃色视频_亚洲AⅤ天堂一区二区三区

      
      

      1. 在线精品视频A免费不卡 | 亚洲AV激情码国产一区 | 中文字幕在线流畅不卡高清 | 思思久久96热视频 | 日本精品激情乱一区二区 | 一本色道久久综合色 |