1. gzyueqian
      13352868059
      首頁 > 新聞中心 > > 正文

      利用TMS320C6201芯片進(jìn)行圖像壓縮

      更新時(shí)間: 2009-05-07 09:06:49來源: 粵嵌教育瀏覽量:3085

      編輯導(dǎo)讀:一種基于DSP控制的液晶顯示器的設(shè)計(jì)及實(shí)現(xiàn)|基于DSP的智能電機(jī)保護(hù)器設(shè)計(jì)|采用SAA7110和AL250集成芯片TV/VGA轉(zhuǎn)換電路|一種基于分層級(jí)連DSP陣列技術(shù)的電子浮標(biāo)設(shè)計(jì)|具有優(yōu)異功耗性能比的DSP|單片機(jī)協(xié)處理器在電力系統(tǒng)中的應(yīng)用|TMS320C203擴(kuò)展引導(dǎo)加載的設(shè)計(jì)與實(shí)現(xiàn)|基于P87LPC761單片機(jī)控制的時(shí)間控制器系統(tǒng)簡(jiǎn)介|基于VHDL語言的卷積碼編解碼器的設(shè)計(jì)|運(yùn)用定點(diǎn)DSP實(shí)現(xiàn)MPEG-4標(biāo)準(zhǔn)中DCT系數(shù)快速量化的方法|
      正文:

           摘要:介紹了利用TMS320C6201 DSP芯片進(jìn)行實(shí)時(shí)圖像壓縮的軟件設(shè)計(jì)。結(jié)合該芯片的編程特點(diǎn)介紹了壓縮算法,并給出了部分關(guān)鍵程序,具有一定的參考價(jià)值。

          關(guān)鍵詞:圖像壓縮 C6201 FDCT變換 霍夫曼編碼

      圖像中含有豐富的信息,在現(xiàn)代科技中將圖像作為一種探測(cè)手段,正受到越來越廣泛的青睞。有很多探測(cè)設(shè)備,采用掃描成像儀器作為前端探測(cè)器。作為一種很常見的情況,成像儀器采集到的圖像要通過無線信道進(jìn)行發(fā)送。但是,圖像數(shù)據(jù)通常都是海量數(shù)據(jù),無線信道的傳輸帶寬無法滿足要求,必須對(duì)圖像進(jìn)行壓縮處理,才能通過無線信道進(jìn)行傳輸。

          實(shí)現(xiàn)圖像實(shí)時(shí)無線傳輸必須研制專門的圖像壓縮,該壓縮器須滿足如下要求:(1)圖像實(shí)時(shí)壓縮?鴉(2)能夠較好地保存圖像質(zhì)量。筆者以TI公司的高速DSP芯片TMS320C6201為核心的數(shù)字信號(hào)處理板作為圖像壓縮器的硬件平臺(tái),通過自行開發(fā)的壓縮程序,實(shí)現(xiàn)了圖像的實(shí)時(shí)壓縮。

      1 數(shù)字信號(hào)處理板的硬件功能框圖

      數(shù)字信號(hào)處理板的硬件功能框圖如圖1所示。TMS320C6201是一種高性能的定點(diǎn)數(shù)字信號(hào)處理器。工作頻率為200MHz時(shí),每個(gè)指令周期為5ns,運(yùn)算速度可達(dá)1600MIPS;具有VLIW(甚長(zhǎng)指令集)體系結(jié)構(gòu),每周期8?jìng)€(gè)32bit的指令并行執(zhí)行;8?jìng)€(gè)獨(dú)立的功能單元,有兩個(gè)16bit乘法器和6個(gè)算術(shù)邏輯單元;采用加載存儲(chǔ)體系結(jié)構(gòu),數(shù)據(jù)在多處理單元之間的傳輸依靠32個(gè)32bit的通用寄存器。C6000的存儲(chǔ)器尋址空間為32bit,片內(nèi)有1Mbit的SRAM。片內(nèi)RAM被分為兩塊:一是內(nèi)部程序/cache存儲(chǔ)器,二是內(nèi)部數(shù)據(jù)存儲(chǔ)器。32bit外部存儲(chǔ)器接口(EMIF)可與不同存儲(chǔ)器接口,可方便地配置不同速度、不同容量、不同復(fù)雜程度的存儲(chǔ)器。此外,C6000還有兩通道Boot-loading DMA處理器、16bit的主機(jī)接口HPI、兩個(gè)多通道緩沖串口(McBSP),并且其片內(nèi)鎖相環(huán)(PLL)時(shí)鐘發(fā)生器,可以對(duì)輸入時(shí)鐘進(jìn)行不同的倍頻處理。這種芯片用來處理圖像壓縮這種運(yùn)算密集型的工作是非常合適的。功能框圖的其它部分不再做介紹。

      圖3 圖像壓縮器的工作過程方框圖

      2 圖像壓縮算法

      圖像壓縮中的圖像有彩色和灰度之分。考慮到彩色圖像和灰度圖像的壓縮類似,且大多數(shù)的掃描成象設(shè)備掃的是灰度圖像,所以僅以灰度圖像的壓縮為例介紹DSP上的圖像壓縮。圖像壓縮算法原理圖如圖2所示。

      圖中,首先將原始灰度圖像分為8×8的圖塊,然后對(duì)每一圖像塊進(jìn)行FDCT變換,再將變換得到的DCT系數(shù)使用量化表進(jìn)行量化。量化后可得到如下形式的數(shù)據(jù):

      (x)是不為零的數(shù)據(jù))

      x  x  x  x  0  0  0  0

      x  x  x  0  0  0  0  0

      x  x  0  0  0  0  0  0

      x  0  0  0  0  0  0  0

      0  0  0  0  0  0  0  0

      0  0  0  0  0  0  0  0

      0  0  0  0  0  0  0  0

      0  0  0  0  0  0  0  0

      該數(shù)據(jù)在存儲(chǔ)器中存放的順序如下:

      z[0]   z[1]   z[2]   z[3]   z[4]   x[5]   z[6]   z[7]

      z[8]   z[9]   z[10]  z[11]  z[12]  z[13]  z[14]  z[15]

      z[16]  z[17]  z[18]  z[19]  z[10]  z[21]  z[22]  z[23]

      z[24]  z[25]  z[26]  z[27]  z[28]  z[29]  z[30]  z[31]

      z[32]  z[33]  z[34]  z[35]  z[36]  z[37]  z[38]  z[39]

      z[40]  z[41]  z[42]  z[43]  z[44]  z[45]  z[46]  z[47]

      z[48]  z[49]  z[50]  z[51]  z[52]  z[53]  z[54]  z[55]

      z[56]  z[57]  z[58]  z[59]  z[60]  z[61]  z[62]  z[63]

      在存儲(chǔ)器中,非零數(shù)據(jù)和零數(shù)據(jù)交替存放,不便于壓縮,所以要對(duì)數(shù)據(jù)進(jìn)行重排列,數(shù)據(jù)的重排列形式如下:

      z[0]   z[1]   z[5]   z[6]   z[14]   z[15]   z[27]   z[28]

      z[2]   z[4]   z[7]   z[13]  z[16]   z[26]   z[29]   z[42]

      z[3]   z[8]   z[12]  z[17]  z[25]   z[30]   z[41]   z[43]

      z[9]   z[11]  z[18]  z[24]  z[31]   z[40]   z[44]   z[53]

      z[10]  z[19]  z[23]  z[32]  x[39]   z[45]   z[52]   z[54]

      z[20]  z[22]  z[33]  z[38]  z[46]   z[51]   z[55]   z[60]

      z[21]  z[34]  z[37]  z[47]  z[50]   z[56]   z[59]   z[61]

      z[35]  z[36]  z[48]  z[49]  z[57]   z[58]   z[62]   z[63]

      變換完成后再根據(jù)編碼表對(duì)DC系數(shù)和AC系數(shù)分別進(jìn)行編碼,就完成了圖像的壓縮。

      圖4 量化表

      3 利用DSP芯片進(jìn)行圖像壓縮

      3.1 圖像壓縮器的工作過程

      圖像壓縮器工作過程方框圖如圖3所示。

      圖像數(shù)據(jù)通過I/O接口送入數(shù)字信號(hào)處理板,由DSP芯片中的DMA控制器負(fù)責(zé)將數(shù)據(jù)放入輸入緩沖區(qū)中,DSP對(duì)緩沖的圖像數(shù)據(jù)進(jìn)行壓縮后,通過HPI接口將壓縮數(shù)據(jù)送出。

      3.2 編程介紹

      這里主要介紹壓縮參數(shù)初始化和壓縮程序。

      3.2.1 壓縮參數(shù)初始化

      由圖2所示的圖像壓縮算法可知,圖像壓縮過程中需要量化表和編碼表,量化表如圖4(a)所示。

          量化操作就是把8×8圖塊進(jìn)行FDCT變換,將變換后的的DCT系數(shù)用量化表元素來除。由于DSP中有硬件乘法器和移位指令,為了充分提高程序的執(zhí)行速度,應(yīng)該將除法運(yùn)算轉(zhuǎn)化為乘法運(yùn)算和移位運(yùn)算,對(duì)上面的量化表元素逐個(gè)求倒數(shù)并用16進(jìn)制表示,如圖4(b)所示。

      編碼表有兩個(gè),一個(gè)是直流差值編碼表,另一個(gè)是交流系數(shù)編碼表,如圖5所示。

      編碼表中的左端的一列代表中間碼字,具體編碼時(shí)要根據(jù)8x8圖塊的DCT系數(shù)產(chǎn)生中間碼字,再由中間碼字查編碼表,將中間碼字轉(zhuǎn)換為霍夫曼碼,完成編碼。在DSP程序初始化階段要生成量化表和編碼表,量化表可直接將圖4(b)所示的量化表元素代入來得到,編碼表就要按照霍夫曼碼的編碼方法生成霍夫曼碼來得到。由于在壓縮過程中要頻繁地查找編碼表,因此,編碼表的組織形式對(duì)程序的執(zhí)行效率影響很大。

       

      3.2.2 壓縮程序

      圖像壓縮包括FDCT變換、標(biāo)量量化、Zigzag掃描和編碼等幾個(gè)步驟,下面分別介紹。

      3.2.2.1FDCT變換

      DCT變換公式如下:

      式中,Cu,Cv=

      具體壓縮的時(shí)候要采用DCT變換的快速算法來加快程序的運(yùn)行速度,將二維的DCT變換分解為兩個(gè)一維的DCT變換,可以有效地降低計(jì)算量。CCS2.0(Code Composer Studio)中提供了一個(gè)成熟的C語言函數(shù)庫,里面包含了進(jìn)行FDCT變換的函數(shù)。函數(shù)原型如下:

      void fdct_8×8(short *dct_data, unsigned num_fdcts);

      函數(shù)中dct_data指針指向待變換的圖像數(shù)據(jù),num_fdcts是進(jìn)行DCT變換的圖像塊的數(shù)目。該函數(shù)可以對(duì)一大塊連續(xù)存放的圖像塊進(jìn)行DCT變換,特別針對(duì)TMS320C6201 DSP芯片的特點(diǎn)進(jìn)行了優(yōu)化。考慮到存儲(chǔ)器的等待時(shí)間和指令的并行等問題,執(zhí)行效率非常高,具體的程序開銷可以通過如下公式計(jì)算:

      時(shí)鐘周期數(shù)=48+160*num_fdcts;

      要在自己的工程中使用這個(gè)函數(shù),必須把img62x.lib函數(shù)庫添加到工程中,并且在主程序文件中包含fdct_8×8.h頭文件。

      3.2.2.2 標(biāo)量量化

      所謂標(biāo)量量化就是對(duì)8×8圖像塊的DCT變換系數(shù)使用量化表逐個(gè)相除并四舍五入。CCS2.0提供了一個(gè)量化函數(shù),其原型如下:

      void quantize

      (

      short *data, /* Data to be quantized. */

      int num_blks, /*Number of 64-element blocks.?*/

      int blk_size, /*Block size (multiple of 8). */

      const short *recip_tbl, /*Quant. values (reciprocals). */

      int q_pt /*Q-point of Quant values.*/

      );

      將圖4(b)所示的量化表元素代入程序,blk_size為64,q_pt為16,data指向量化數(shù)據(jù),即可進(jìn)行快速的量化。該程序同樣經(jīng)過了優(yōu)化,具體的程序開銷可按如下公式計(jì)算:

      時(shí)鐘周期數(shù)= 25+(blk_size/16)*4+num_blks*12)

      該函數(shù)同樣包含在img62x.lib庫中,程序中應(yīng)包含quantize.h頭文件。

      3.2.2.3 ZigZag掃描

      ZigZag掃描就是對(duì)數(shù)據(jù)進(jìn)行重排列。該部分功能簡(jiǎn)單、運(yùn)算量也不大,但是對(duì)存儲(chǔ)器的訪問非常頻繁,而且影響處理器執(zhí)行速度的主要是對(duì)存儲(chǔ)器的訪問速度。一般情況下,CPU訪問內(nèi)部存儲(chǔ)器需要4個(gè)時(shí)鐘周期,訪問外部存儲(chǔ)器的速度要比內(nèi)部存儲(chǔ)器的速度慢得多,具體情況應(yīng)根據(jù)實(shí)際使用的外部存儲(chǔ)器的類型而定。由于TMS3206201 DSP芯片每秒鐘多可以執(zhí)行8條指令,如果讓DSP芯片經(jīng)常處于等待狀態(tài)是非常大的浪費(fèi)。解決該問題的有效的辦法是充分利用數(shù)據(jù)總線的寬度并讓軟件進(jìn)行流水線執(zhí)行。TMS320C6201的數(shù)據(jù)總線寬度是32位,一般情況下DCT系數(shù)使用一個(gè)短整型數(shù),只有16位寬度,如果每次同時(shí)從存儲(chǔ)器中讀寫兩個(gè)數(shù),則可以減少一半訪問存儲(chǔ)器的次數(shù)。由于TMS320C6201有8?jìng)€(gè)功能單元,CPU可以在處理當(dāng)前數(shù)據(jù)的同時(shí)去存儲(chǔ)器取下一個(gè)數(shù)據(jù)。通過流水線,CPU可以做到每周期訪問一次存儲(chǔ)器,這樣可以使程序的執(zhí)行效率大大提高。一般情況下軟件的流水線安排是由編譯優(yōu)化系統(tǒng)完成的,程序員所要做的是讓自己的程序符合流水線執(zhí)行的要求,并且讓優(yōu)化后的流水線周期盡量短。流水線的要求主要有以下幾點(diǎn):

      (1)程序所使用的寄存器數(shù)目不能超過32個(gè);

      (2)程序所使用的條件寄存器數(shù)目不能超過5個(gè);

      (3)程序中不能含有分支語句,可能的話盡量使用條件指令;

      (4)一個(gè)寄存器中的變量值不能存放太長(zhǎng)時(shí)間,實(shí)在不行就換個(gè)寄存器存放;

      (5)程序所使用的CPU左右兩邊的資源盡量平衡,一般情況下,平衡的資源使用換來的是比較短的流水線周期;

      (6)程序中包含的指令不能太多。

      對(duì)于用線性匯編語言編寫的程序,應(yīng)該在程序編寫時(shí)注意這些問題。對(duì)一個(gè)用C語言編寫的程序,可以通過觀察編譯系統(tǒng)產(chǎn)生的優(yōu)化后的匯編語言文件來獲得相關(guān)的信息。具體程序略。

      3.2.2.4 編碼

      編碼部分主要是對(duì)量化后的DCT系數(shù)進(jìn)行處理,主要利用了相鄰圖像塊之間的相關(guān)性、量化后的DCT系數(shù)矩陣的連零特性和霍夫曼編碼應(yīng)進(jìn)行壓縮編碼。該部分主要涉及了查表、移位運(yùn)算和存儲(chǔ)器讀寫。DC差值/AC系數(shù)等級(jí)表如圖6所示。

          DC系數(shù)的編碼流程圖如圖7所示。

      AC系數(shù)的編碼流程圖如圖8所示。

      其中,ZZ(K)編碼是對(duì)不為零的AC DCT系數(shù)進(jìn)行編碼,編碼方法可參考DC差值編碼。

      由于在AC編碼過程當(dāng)中分支語句比較多,為了程序的流水線執(zhí)行,同時(shí)為了指令的并行性,大量地使用了條件指令。但是應(yīng)該注意,在TMS320C6201中只有A1、A2、B0、B1、B2五個(gè)條件寄存器,不可能滿足所有的需要,因此一定要盡量簡(jiǎn)化程序。在實(shí)際使用中,使用該壓縮器壓縮一幅512×512的灰度圖像需要的時(shí)間不到55ms,配合適當(dāng)?shù)臄?shù)據(jù)接口可滿足對(duì)數(shù)據(jù)率為32Mbit/s的掃描圖像進(jìn)行實(shí)時(shí)壓縮。

      免費(fèi)預(yù)約試聽課

      亚洲另类欧美综合久久图片区_亚洲中文字幕日产无码2020_欧美日本一区二区三区桃色视频_亚洲AⅤ天堂一区二区三区

      
      

      1. 午夜在线视频国产五月天 | 激情伊人五月天久久综合 | 五月天国产精品 | 午夜免费视频国产在线观看 | 日韩亚洲欧洲美三区中文字幕 | 伊人久久综合色 |