專利名稱:利用改進塊區分割法和輪廓編碼法對視頻信號編碼的設備的制作方法
技術領域:
本發明涉及一種視頻信號編碼設備;較具體地說,涉及一種利用改進的塊區分割(BTC)法和輪廓編碼法對視頻信號編碼的設備。
在各種電子設施中,視頻信號可以以數字形式發送。當用數字形式表達含有一系列視頻“幀”的視頻信號時,將出現大量的數字數據對于一個視頻幀中的每一行,都要用一系列稱之為“象素”的數字數據單元來定義。然而,由于普通的發送頻道中可供利用的頻帶寬度是有限的,所以為了通過固定的頻道來發送大量的數字數據,通常需要采用某種視頻信號編碼方法來壓縮數字數據。
BTC法是這種視頻信號壓縮技術中的一種方法,它能在保持被發送的視頻信號的圖象質量的同時,大大減少數字數據的量。
為了用BTC法對視頻信號編碼,視頻信號的一個幀被分割成多個互不重疊的K×K個象素的塊區,其中K是大于1的正整數。參見
圖1A,那里示出了一個作為BTC法中的一個編碼單位的示例性塊區。圖1A中示出的塊區含有16個象素f1至f16。
通過把各個象素的強度值與一個閾值進行比較,一個塊區內的N(=K2)個象素被進一步分成兩個組(一個亮組和一個暗組);然后含在該塊區內的各象素的強度值被轉換成兩個重建值中的一個值,這兩個重建值分別是含在亮組和暗組內的象素的代表性強度值。在圖1B中,A和B分別代表兩個重建值A是暗組的重建值,B是亮組的重建值。結果,該塊區被用組成一個圖形的兩個重建值為表示。這個圖形可以進一步用一個比特圖來表示,也即用一個例如象圖1C所示的二值圖象的塊區來表示。
兩個重建值由一個樣本均值和一個樣本偏差來確定,其中的樣本均值通常用作上述的閾值,而樣本偏差則表征了該塊區的對比度。含在圖1A所示塊區中的各象素的強度值的樣本均值fM和樣本偏差fV可按下式計算fM=1NΣi=1Nfi]]>等式1fV=1NΣi=1N(fi2-rM2)]]>等式2其中N表示塊區中所含象素的數目;i表示1到N范圍內的整數;fi是圖1A中用同樣符號表示的象素的強度值。
確定兩個重建值的原則是,使得圖1B所示的二灰階塊區的樣本均值和樣本偏差分別與圖1A所示的原始塊區的樣本均值和樣本偏差相等。為了達到這一點,這兩個重建值A和B可以按下式確定A=fM-fVLN-L]]>B=fM+fVN-LL]]>等式3其中L代表其強度值大于或等于樣本均值fM的象素的數目。
回到圖1B,其中強度值小于fM的象素用A表示,而其他的象素用B表示。另一方面,在圖1C所示的比特圖中,強度值小于fM的象素用0表示,而其他的象素則用1表示。
在編碼器中確定出的兩個重建值和比特圖被發送給相應的解碼器,在解碼器中比特圖指明塊區內的各個象素是屬于亮組的還是屬于暗組的,而兩個重建值則分別代表兩個組內的重建象素值。
通過用兩個重建值和一個比特圖來代表視頻信號的一個塊區,要發送的數據的量就得以大為減少。
在相應的解碼器中,被解碼了的比特圖和兩個重建值構成了重建視頻信號的一個塊區。由于只用兩個重建值為代表多達K×K個不同的象素強度值,原始視頻信號和重建視頻信號之間可能出現不可忽略的差異。不過,由于在整個BTC處理過程中每個塊區的樣本均值和樣本偏差被保留了下來,所以一個幀內的對比度和最明顯的特征得以很好地保留,其中較小的變化可能會被大的變化所掩蓋,但如果沒有大的變化則較小的變化就能保留住。這和人類視覺系統的響應是十分接近的,在視覺響應中大的變化趨向于掩蓋其鄰近處的較小的變化。因此,雖然經過BTC處理后做到了比特數量的大量減少,但重建視頻信號仍然可以是原始視頻信號的一個良好的近似。
另一方面,如果不作進一步處理就把含在比特圖內的每一個二值象素都發送出去,那末表示一個比特圖就需要多達K×K比特。因此,編碼一幀視頻信號所用的比特數將等于該幀內的象素數加上編碼各個塊區的重建值所需的比特數。雖然采用了普通的BTC法之后要發送的比特數被減少了,但在發送比特圖時還是需要大量的比特,這樣就提出了編碼視頻信號時進一步減少所用比特數的要求。
因此,本發明的一個主要目的是提供一種用于編碼器的設備,它結合了改進BTC法和輪廓編碼法來對視頻信號進行編碼,由此能夠進一步減少編碼視頻信號的比特率。
根據本發明,提供了一種對一個含有多個其中帶有許多象素的幀的輸入視頻信號進行編碼的設備,該設備包括一個掩蓋模塊,用來把每一幀內的每個象素的強度值與一個閾值進行比較,并制作一個由二值象素組成的二值幀;一個輪廓編碼模塊,用來對該二值幀進行輪廓編碼,由此提供能夠重建出該二值幀的信息;一個第一分割模塊,用來把二值幀分割成許多個互不重疊的各自含有K×K個象素的塊區,其中K是一個大于1的正整數;一個第一計算模塊,用來計算每個塊區中的其強度值大于或等于閾值的象素的數目L;一個控制信號發生模塊,用來對每一個塊區在塊區的所有二進制值都等于0或1時提供一個第一控制信號,而在塊區內既有0又有1時則提供一個第二控制信號;一個第二分割模塊,用來把輸入視頻信號幀分割成與第一分割模塊所得到的塊區準確相同的多個塊區,每個塊區也含有K×K個象素;一個第二計算模塊,用來對由第二分割模塊所得到的每個塊區,確定出K×K個象素的一個樣本均值和一個樣本偏差;一個第三計算模塊,用來對由第二分割模塊所得到的每個塊區,根據樣本均值、樣本偏差和數目L來計算兩個重建值,這兩個重建值分別是含在亮組和暗組內的象素的代表性強度值,各象素含在亮組內還是暗組內是根據其強度值來確定的;一個選擇模塊,用來根據第一或第二控制信號選擇出樣品均值或兩個重建值;以及一個編碼模塊,用來對所選出的值編碼,即對選擇模塊的輸出編碼。
本發明的上述目的和其他目的及特點將通過下面參考附圖對優選實施例的說明而變得清楚明白,在附圖中圖1A至1C分別例舉出普通BTC法中所用的一個視頻信號塊區、其相應的二灰階塊區和比特圖;圖2給出本發明的視頻信號編碼器的方框圖;以及圖3給出圖2中所示的改進BTC模塊的詳細方框圖。
參見圖2,那里示出了本發明的一個視頻信號編碼器10的方框圖,該編碼器包括一個掩蓋模塊110、一個輪廓編碼模塊120、一個控制模塊130、一個改進BTC模塊140和一個編碼模塊150。
一個被耦合到掩蓋模塊110上的輸入視頻信號含有一系列由許多象素組成的幀,在掩蓋模塊110中該視頻信號中的一個幀內的各個象素的強度值與一個閾值進行比較。根據本發明的一個優選實施例,把含在視頻信號的一個幀內的所有象素的強度的平均值用作閾值。當一個象素的強度值小于該閾值時,則用一個二進制值,例如0來代表該象素,否則用二進制值1來代表該象素。結果,視頻信號的一個幀在掩蓋模塊110中被表示成為一個二值幀,該二值幀含有多個區域,每個區域由一些以相同數字0或1所代表的相鄰接的象素組成。然后該二值幀被輸出給輪廓編碼模塊120和控制模塊130。
在輪廓編碼模塊120中,含在二值幀內的各個區域的輪廓用諸如B-仿樣逼近或多邊形逼近方法之類的普通輪廓編碼方法進行編碼,由此提供出各區域的信息。該區域信息包括有各個區域的輪廓信息和含在各個區域中的象素的二值信息,該二值信息表示為一個數字,例如1或0。輪廓信息可以用來畫出各個區域的輪廓或邊界,它包括有邊界上的象素的位置數據。二值信息指明了被輪廓所包圍的區域中的象素的強度值是否小于閾值。然后輪廓信息和二值信息被輸送給一個發送機(未示出),以把這些信息發送出去。
在控制模塊130中,由掩蓋模塊110所提供的二值幀首先被分割成多個互不重疊的含有K×K個象素的塊區,其中K是一個大于1的正整數。如果一個塊區內的所有K×K個象素都具有相同的值,即1或者0,則在線路L1上輸出一個控制信號S1;否則,也就是說如果一個塊區中既含有值為0的象素又含有值為1的象素,則在線路L1上輸出一個控制信號S2。控制模塊130還對每一個塊區計算其強度值大于或等于在討論掩蓋模塊110時提到過的那個閾值的象素的數目L,也即還計算每個塊區中由數字1所表示的象素數目,并通過線路L2把該象素數L提供給改進BTC模塊140。
在這同時,輸入的視頻信號也被輸送給改進BTC模塊140,在那里該視頻信號的每一個幀都用根據本發明的改進BTC法進行處理。
參見圖3,那里示出了圖2中所示的改進BTC模塊140的詳細方框圖。該改進BTC模塊140包括有一個塊區確定模塊141、一個fM和fV確定模塊142、一個A和B計算模塊143、以及一個選擇模塊144。
在塊區確定模塊141中,輸入視頻信號的每一個幀都被分割成多個與控制模塊130中所分割的塊區相同的K×K個象素的塊區,并且逐個塊區地把這些塊區輸送給fM和fV確定模塊142。在fM和FV確定模塊中,用上述等式1和等式2確定出含在每個塊區內的K×K個象素的樣本均值fM和樣本偏差fV。然后樣本偏差被輸送給A和B計算模塊143,樣本均值被輸送給A和B計算模塊143和選擇模塊144。
在A和B計算模塊143中,只對相應于在線路L1上傳送有控制信號S2的各個塊區分別計算它們的兩個重建值A和B,計算時根據各塊區的樣本均值、樣本偏差、通過線路L2所提供的象素數L、以及象素數N(=K×K),利用等式3來進行。換言之,只對那種相應于控制信號S2的塊區計算重建值。如果一個相應于控制信號S1的塊區被輸入到A和B計算模塊143中,則其中不進行重建值的計算。這樣計算得到的兩個重建值被傳送給選擇模塊144。熟悉本技術領域的人們應該能明顯地看到,通過利用這樣得到的重建值,對于具有利用本發明的閥值來確定的輪廓的塊區仍然可以保持象素強度的平均值和偏差。需要指出,根據本發明,輪廓是利用一個幀內所有象素的強度值的平均值來確定的,而不象普通BTC法那樣是利用塊區的平均象素值來確定的。
選擇模塊144根據從線路L1傳送來的控制信號選擇出一個塊區的樣本均值或者兩個重建值。也就是說,如果向選擇模塊144輸送了控制信號S1,則對該塊區選擇其樣本均值;而如果輸送了控制信號S2,則選擇兩個重建值。
回到圖2,對各個塊區選出的值被輸送給編碼模塊150,在那里通過利用一個適當的編碼方法,例如DPCM(差分脈沖碼調制)技術對所選出的值進行編碼。然后編碼值被輸出給一個發送機(未示出),把它們發送出去。
這樣在編碼器10中產生的二值幀的各個區域的包括了輪廓信息和二值信息的區域信息以及各個塊區的編碼值被發送給接收端的一個相應解碼器。在相應的解碼器中,區域信息被解碼,以重建出在圖2中所示的編碼器10的掩蓋模塊110中所產生的二值幀,而發送來的編碼值則被解碼成為一系列的解碼樣本均值和重建值。接著,利用與編碼器10的控制模塊130相類似的處理方式,重建的二值幀被分割成多個K×K個象素的塊區。然后根據各塊區內的象素值,把一個或兩個解碼值依次地設定給各K×K象素的塊區。具體地說,如果一個塊區內的所有象素都具有同樣的數字值1或0,則只有一個確定值,也即是,在圖3的fM和fV確定塊142中所確定的該塊區的樣本均值,被設定為該塊區內所有象素的代表性象素值。如果一個塊區內的各個象素具有不同的值,也即如果有些象素值為1而另外的象素值為0,則兩個重建值被設定為該塊區的代表性象素值,其中具有象素值0的象素將用重建值A來代替,象素值為1的各個象素將用重建值B來代替,上述的兩個重建值A和B就是圖3中A和B計算模塊143對該塊區所提供的兩個解碼值。
如上所述,通過把改進BTC法和根據本發明來確定編碼輪廓的輪廓編碼法結合在一起,用于編碼一個視頻信號的比特數就可以比普通BTC法減少。
雖然只是對某些優選實施例說明了本發明,但是在不偏離由下述權利要求所規定的本發明的精神和范疇的情形下,可以做出各種其他的修改和變化。
權利要求
1.一種對一個含有多個視頻幀的視頻信號編碼的設備,其中每個視頻幀都含有許多象素,上述設備包括用來把含在一個視頻幀內的每個象素的強度值與一個閾值進行比較,并根據各個象素的強度值和閾值的比較結果把各個象素分類成兩個組,由此提供出一個二值幀的裝置,其中的二值幀包含有多個區域,每個區域由一些被分在兩個組中的某一個組內的相鄰接的象素組成用來對二值幀編碼以提供包括輪廓信息和二值信息在內的區域信息的裝置,其中的輪廓信息代表位在各個區域的輪廓處的象素的位置數據,而二值信息則代表含在每個區域中的象素所分入的那個組;用來把二值幀分割成多個互不重疊的二值塊區的裝置,其中每個二值塊區都含有K×K個象素,這里K是一個大于1的正整數;用來對每一個二值塊區確定含在該二值塊區內的、被分入到兩個組中的一個組內的象素的數目L的裝置;用來對每一個二值塊區產生一個顯示出每個二值塊區內的K×K個象素是否全都只屬于兩個組中的一個組的控制信號的裝置;用來把視頻幀分割成多個互不重疊的K×K像素的視頻塊區的裝置,其中每個視頻塊區都對應著一個二值塊區,該裝置還用來對每個視頻塊區根據該視頻塊區內的K×K個象素的值,以及對與該視頻塊區相對應的二值塊區所確定的數目L,來提供一個平均值和兩個重建值;以及用來根據控制信號來選擇平均值或者選擇兩個重建值以對每個視頻塊區產生一個所選的輸出的裝置,其中,當控制信號顯示出對應的二值塊區內的所有象素全部屬于兩個組中的一個組時則選擇平均值,否則就選擇兩個重建值。
2.根據權利要求1的設備,其中的閾值是含在視頻幀內的各個象素的強度的平均值。
3.根據權利要求2的設備,其中只有當控制信號顯示出在一個對應于某一視頻塊區的二值塊區內的各象素并不僅僅屬于兩個組中的一個組時,才提供該視頻塊區的上述兩個重建值。
4.根據權利要求1的設備,它還包括用來對每個視頻塊區的選出的輸出進行編碼的裝置。
全文摘要
利用改進BTC法和輪廓編碼法編碼輸入視頻信號的設備,該視頻信號含多個幀,每個幀可分成多個K×K個象素的塊區。該設備包括提供輸入視頻信號的二值幀的掩蓋模塊;產生二值幀的輪廓信息和二值信息的輪廓編碼模塊;對每個從二值幀導出的二值塊區確定一數目L和一控制信號的控制模塊;對每個從輸入圖象信號導出的視頻塊區根據各視頻塊區內的K×K個象素的強度值和數目L來產生一個平均值和兩個重建值,并根據控制信號選擇出平均值或兩個重建值的改進BTC模塊。
文檔編號G06T9/20GK1139355SQ96103979
公開日1997年1月1日 申請日期1996年3月28日 優先權日1995年3月28日
發明者丁海默 申請人:大宇電子株式會社