專利名稱:基于廣義歐拉向量的圖像檢索方法
技術領域:
本發明涉及一種圖像方法,特別涉及一種基于廣義歐拉向量的圖像檢索方 法,屬于計算機圖形學領域。
背景技術:
在對圖像拓撲進行估計時,經常會使用到一個量,就是歐拉數。所謂歐拉數, 就是一幅圖像中的連通體數目減去連通體中的孔洞數。在二維空間中,連通體
可以是4連通或8連通形成的對象,孔洞被定義為邊界為前景的背景區域。圖像 的連通性和區域的孔洞數是拓撲性質,當圖像平移、旋轉、拉伸、壓縮、扭變
之后,它們都不變。歐拉數的計算方法可以參照文獻"TheEulerNumberstudy。fim昭e and its application[C]. Second IEEE Conference Indust. Electron, Applic, IEEE Computer Society, 2007:910-912 "(《圖像歐拉數的研究與應用》)。
所謂圖像的位平面就是將圖像的每個像素值用相應的二進制數值表示,所
有像素的每個相同位組成一幅二值圖像,稱為位平面。對于灰度級為256的圖像, 每個像素值可以用8位二進制數來表示,記為^ ##。,其中每個W 0,…,7) 為0或1,所有像素的 位就構成了圖像的第7個位平面(最高位平面),所有像素 的&位就構成了圖像的第6個位平面,依次類推。為了方便,以下都把6'(/ = (),"',7) 記做圖像的i個位平面。所以, 一幅圖像可以看作是由這8個位平面重疊而成。不 同的位平面包含的內容不同,較高的位平面反映原圖像的主要內容,稱為重要 位平面;較低的位平面包含了很局部的小細節,許多情況下被認為是噪聲,它 們只是增加了原圖像的亮度,對原圖像的結構信息貢獻很小。因此可以忽略較 低的位平面。
因此,針對一幅圖像,可以把它表示為位平面形式,求出每個重要位平面 的歐拉數,組成向量作為圖像的特征。2002年ArijitBishnu等人在文"Content based image retrieval: related issues using euler vector"中提出/歐拉向量的概念,
并把歐拉向量作為灰度圖像的特征用于圖像檢索。具體實現方案為
1. 對于一幅NXM的灰度圖像I,先后利用中值濾波和均值濾波進行過濾, 并把圖像I線性轉換到區間
中,把圖像分解為8個位平面&AAAAAAA。
2. 把圖像1的前四個重要位平面67,66,65,64轉換為相對應的灰度碼表示 g"g6,g5,g4;當"7時&=^當4^'"時,&=6'+1 ^其中 表示乂011 (異或)
操作。
3. 對于每個灰度碼位平面,計算其歐拉數;
4. 返回一個4元向量,4個分量分別為4個重要的灰度碼位平面的歐拉數。
5. 該4元向量稱為歐拉向量。
6. 計算查詢圖像和圖像庫中的所有圖像的歐拉向量,采用馬氏距離進行相 似度計算,選取距離最小的前若干幅圖像作為結果圖像。
2007年Arijit Bishnu等人在文Stacked Euler Vector(SERVE): A Gray-Tone Image Feature Based on Bit-Plane Augmentation又提出了堆疊歐拉向量(Stacked Euler Vector)的概念,并把堆疊歐拉向量作為灰度圖像的特征進行圖像檢索。 具體實現方案為
1、 對于一幅NXM的灰度圖像I,先后利用中值濾波和均值濾波進行過濾, 并把圖像I線性轉換到區間
中,把圖像分解為8個位平面、A,、64,6^2,6,,6。。
2、 對于每個位平面^,計算增量位平面勺1^+ 其中"〃7,
'+'代表邏輯或。
3、 對于上述4個增量位平面,分別計算其歐拉數,得到一個四元向量,即 為堆疊歐拉向量。
4、 計算査詢圖像和圖像庫中的所有圖像的堆疊歐拉向量,采用一定的距離 進行相似度計算,選取距離最小的前若干幅圖像作為結果圖像。
實驗表明,直接釆用基于歐拉向量或堆疊歐拉向量對圖像進行檢索,存在 以下問題這兩種方法首先都要對圖像進行中值濾波和均值濾波,在濾掉噪聲
的同時, 一些有用的信息也過濾掉了。過濾后的圖像的位平面的歐拉數的絕對 值減小,再利用歐拉向量進行比較時誤檢率變高。另外,單獨使用歐拉向量或 堆疊歐拉向量特征進行圖像檢索雖然計算簡單,但檢索率不是很理想,尤其對 于復雜背景圖像更是如此。
發明內容
針對現有技術的缺點,本發明把歐拉向量和堆疊歐拉向量進行了有效結合, 用于彩色圖像檢索,特征組合既保留了前二者的優點,同時還具有更高的檢索 效率。
本發明綜合歐拉向量和堆疊歐拉向量提出了廣義歐拉向量,并提出了一種
將廣義歐拉向量作為圖像的特征進行圖像檢索的方法。具體方案如下
(1)對于一幅NXM的圖像I,假設其灰度級為256,則把圖像分解為8個位平 面67,^6^4,、,62,6,。,圖像i的每個像素的灰度值均用8位二進制表示,所有像素
的最高位組成^位平面,最低位組成6。位平面;
(2) 求出前5個位平面的灰度碼表示g7,g^5,g4,g3,即當/ = 7時&=^當
3&^6時,g,^e、其中十表示xor (邏輯異或)操作;簡言之除了最高位
平面,將每個位平面與它前面緊鄰的高位位平面做"邏輯異或"操作,得到相
應的灰度碼位平面,選取其中的前五個重要的灰度碼位平面;
(3) 根據分解得到的位平面計算前5個重要位平面增量表示""^""^A,即 ~=~+^+1 + ''' + 67,其中3^ys7, '+'代表邏輯或;簡言之,對于每個位平面
與它前面的全部高位平面做"邏輯或"操作,便得到對應的增量位平面,選取 結果中的前五個增量位平面;
(4) 分別計算五個重要灰度碼位平面g7,g6,g5,g"&的歐拉數,組成歐拉向量:
Eg(eg7,eg6,eg5,eg4,eg3);
(5) 分別計算重要增量位平面"7,"6,"""""3的歐拉數,組成堆疊歐拉向量-
Ea(ea7,ea6,ea5,ea4,ea3);
(6) 把步驟(4)和步驟(5)得到的向量進行組合,作為圖像I的特征。所 選擇的組合方式是直接將歐拉向量和堆疊歐拉向量拼接成新的向量,從上述步 驟可知,g7和a7與b7是同一位平面。故這里可以去掉歐拉向量或者堆疊歐拉 向量中的第一個歐拉數,得到新的向量,本發明稱之為廣義的歐拉向量,與前 面的歐拉向量相區別。記為E(e9,e8,e7,e6,e5,e4,e3,e2,el)。廣義歐拉向量E就可以 作為灰度圖像I的特征來描述圖像,進行圖像間的相似性比較。
(7) 求出查詢圖像和圖像庫中所有圖像間的距離,按照由小到大的順序排
列,取感興趣的前n幅返回給用戶作為檢索結果。設查詢圖像和目標圖像分別為 2和/ ,得到的廣義歐拉向量分別為"2, 《,《,《,《《,。和
( , , , ,<),則可以計算它們之間的距離"e',距離越小說明它們之 間的相似度越高。這里的距離可以是歐式距離、城市距離、馬氏距離等等。
本方法的提出,不僅保留了現有方法的優點,而且在基于圖像庫進行檢索 的實驗中,發現檢索效率得到了明顯的提高。
具體實施例方式
下面對本發明的具體實施進行說明。
(1) 對于一幅NXM的圖像I,假設其灰度級為256,則把圖像分解為8個位平
圖像I的每個像素的灰度值均用8位二進制表示。所有像素的最高位組成^ 位平面,最低位組成&位平面。
(2) 求出前5個位平面的灰度碼表示g7,&,g5,g4,&,即當"7時^=67;當 3&'《6時,&=6,+1 6,,其中④表示X0R (邏輯異或)操作。
簡言之除了最高位平面,將每個位平面與它前面緊鄰的高位位平面做"邏 輯異或"操作,得到相應的灰度碼位平面。選取其中的前五個重要的灰度碼位平面。
(3) 根據分解得到的位平面計算前5個重要位平面增量表示"7,"6,"5,"4,"3,即
",~+《+1—' + 67,其4^'S7, ' + ,代表邏輯或。
簡言之,對于每個位平面與前面比它高的全部位平面做"邏輯或"操作, 便得到對應的增量位平面。選取結果中的前五個增量位平面。
(4) 分別計算重要灰度碼位平面^,g6,g"g4,g3的歐拉數組成歐拉向量
Eg(eg7,eg6,eg5,eg4,eg3),分別計算五個灰度碼位平面的歐拉數,獲得的向量 為(-41,-174,-197,-403,-803)。
(5) 分別計算重要增量位平面"7,^ """3的歐拉數組成堆疊歐拉向量 Ea(ea7,ea6,ea5,ea4,ea3),分別計算5個增量位平面的歐拉數,獲得的向量為
(-41,-12, -5, -29, -83)。
(6) 把步驟(4)和步驟(5)得到的向量進行組合,作為圖像I的特征。所 選擇的組合方式是直接將歐拉向量和堆疊歐拉向量拼接成新的向量,從上述步 驟可知,g7和a7與b7是同一位平面。故這里可以去掉歐拉向量或者堆疊歐拉 向量中的第一個歐拉數,得到新的向量,本發明稱之為廣義的歐拉向量,與前 面的歐拉向量相區別。記為E(e9,e8,e7,e6,e5,e4,e3,e2,el)。廣義歐拉向量E 就可以作為灰度圖像I的特征來描述圖像,進行圖像間的相似性比較。
(7) 計算得到廣義歐拉向量特征后,可以用其作為特征進行圖像檢索。設 查詢圖像和目標圖像分別為2和/ ,得到的廣義歐拉向量分別為 (《,《,《,《,《,《,(《《)和( ^, £ "〖),則可以釆用一定的距離公式 計算它們之間的距離%,,距離越小說明它們之間的相似度越高。這里的距離公 式可以是歐式距離、城市距離、馬氏距離等等。求出査詢圖像和圖像庫中所有 圖像間的距離,按照由小到大的順序排列,取感興趣的前n幅返回給用戶作為檢 索結果。
以上所述的是一幅灰度級別為256的灰度圖的基于廣義歐拉向量的圖像檢 索過程。對于一幅RGB彩色圖像,如果每個分量,即分量R、 G、 B均為一幅灰度 圖像。這里把一幅RGB彩色圖像轉換為亮度-色度(Luminance-Chrominance)空 間,例如NTSC彩色空間,圖像數據由三部分組成亮度(Y)、色調(I)和飽 和度,其中亮度分量描述灰度信息,其他兩個分量描述彩色信息。轉換公式為
<formula>formula see original document page 7</formula>簡言之,圖像的每個像素點的亮度值r-0.299xi + 0.587xG + 0.114B, R, G, B
分別對應該像素點的紅、綠、藍分量圖像中的灰度值。這里還可以選用其他亮 度-色度空間,諸如YCbCr空間。也是只選擇其中的Y分量來計算圖像的歐拉向量。 考慮到轉換之后的Y分量可能的動態范圍不是[O, 255]或者Y分量在
范圍 內,但是是該范圍內很小的一個區間,這樣在進行位平面分解是很可能前幾個 重要位平面的不能反映原圖像的內容,所以這里采用一個線性轉換,把像素的 亮度分量的值均勻地轉換到區間
中設y為Y分量圖像中的像素值,則轉 換公式為y=255*(y-MinValue)/(MaxValue-MinValue), 其中MaxValue和 MinValue分別是Y中的最大和最小像素值。其中的最小值轉換之后就變為O,最 大值轉換之后就變為255。
對于一幅RGB彩色圖像,采用上述方法提取到Y分量后,就可以采用上述步 驟(1) - (6)來計算該圖像的廣義歐拉向量特征。
此外,我們還可以采用距離加權的方法,來獲取兩幅圖像間的距離。即設 查詢圖像和目標圖像分別為2和/, 0的歐拉向量表示為(《7,《6,《,《,《),堆疊 歐拉向量表示為(《,《,《,《,4), /的歐拉向量表示為(《7,《6,《5,《4,《3),堆疊歐 拉向量表示為(《7^6^5乂4乂3),分別計算2和/之間的歐拉向量的距離£ 12/和堆 疊歐拉向量之間的距離D2e/ 。然后計算Dle,和D2e,間的加權距離
其中 將1)2/作為0和/的最終距離。
在實際應用中,對一幅公共汽車的圖像在圖像庫中進行檢索。采用歐拉向 量進行檢索,可以檢索出很多公共汽車的圖像和花卉的圖像;采用堆疊歐拉向 量進行檢索,可以檢索出很多公共汽車的圖像和蝴蝶的圖像;采用廣義歐拉向 量進行檢索,則檢索出的圖像全部是公共汽車的圖像。可見,采用廣義歐拉向 量進行圖像檢索,可以顯著提高圖像的檢索效率。
權利要求
1、一種基于廣義歐拉向量的圖像檢索方法,包括以下步驟(1)對于一幅N×M的圖像I,假設其灰度級為256,則把圖像分解為8個位平面b7,b6,b5,b4,b3,b2,b1,b0,圖像I的每個像素的灰度值均用8位二進制表示,所有像素的最高位組成b7位平面,最低位組成b0位平面;(2)求出前5個位平面的灰度碼表示g7,g6,g5,g4,g3,即當i=7時g7=b7;當3≤i≤6時,<maths id="math0001" num="0001" ><math><![CDATA[ <mrow><msub> <mi>g</mi> <mi>i</mi></msub><mo>=</mo><msub> <mi>b</mi> <mrow><mi>i</mi><mo>+</mo><mn>1</mn> </mrow></msub><mo>⊕</mo><msub> <mi>b</mi> <mi>i</mi></msub><mo>,</mo> </mrow>]]></math> id="icf0001" file="A20082C1.tif" wi="22" he="5" top= "62" left = "47" img-content="drawing" img-format="tif" orientation="portrait" inline="yes"/></maths>其中 id="icf0002" file="A20082C2.tif" wi="3" he="3" top= "63" left = "82" img-content="drawing" img-format="tif" orientation="portrait" inline="yes"/>表示XOR(邏輯異或)操作;(3)根據分解得到的位平面計算前5個重要位平面增量表示a7,a6,a5,a4,a3,即aj=bj+bj+1+…+b7,其中3≤j≤7,‘+’代表邏輯或;(4)分別計算五個重要灰度碼位平面g7,g6,g5,g4,g3的歐拉數,組成歐拉向量Eg(eg7,eg6,eg5,eg4,eg3);(5)分別計算重要增量位平面a7,a6,a5,a4,a3的歐拉數,組成堆疊歐拉向量Ea(ea7,ea6,ea5,ea4,ea3);(6)把步驟(4)和步驟(5)得到的向量進行組合,作為圖像I的特征;所選擇的組合方式是直接將歐拉向量和堆疊歐拉向量拼接,并去掉歐拉向量或者堆疊歐拉向量中的第一個歐拉數,得到新的向量,即廣義歐拉向量,記為E(e9,e8,e7,e6,e5,e4,e3,e2,e1);(7)求出查詢圖像和圖像庫中所有圖像間的距離,按照由小到大的順序排列,取感興趣的前n幅返回給用戶作為檢索結果;設查詢圖像和目標圖像分別為Q和I,得到的廣義歐拉向量分別為(e9Q,e8Q,e7Q,e6Q,e5Q,e4Q,e3Q,e2Q,e1Q)和(e9I,e8I,e7I,e6I,e5I,e4I,e3I,e2I,e1I),則可以計算它們之間的距離DQI,距離越小說明它們之間的相似度越高。
2、 根據權利要求1所述的圖像檢索方法,其特征在于對于rgb彩色圖像, 首先通過公式h0.,x及+ 0.SS xG + 0.11"計算每個像素點的亮度值,r、 g、 b分別對應該像素點的紅、綠、藍分量圖像中的灰度值;然后通過線性轉換 y-255+(y-MinValue)/(MaxValue-MinValue),把像素的亮度分量的值均勻地轉換到 區間
中,,其中MaxValue和MinValue分別是Y中的最大和最小像素值; 最后將Y值作為圖像的灰度值,按照步驟(1)至(7)進行檢索。
全文摘要
本發明涉及一種基于廣義歐拉向量的圖像檢索方法,屬于計算機圖形學領域。本發明的方法包括以下步驟1)將圖像分解為8個位平面;2)求出前5個位平面的灰度碼表示;3)計算前5個重要位平面增量表示;4)分別計算五個重要灰度碼位平面的歐拉數,組成歐拉向量;5)分別計算五個重要增量位平面的歐拉數,組成堆疊歐拉向量;6)直接將歐拉向量和堆疊歐拉向量拼接,并去掉歐拉向量或者堆疊歐拉向量中的第一個歐拉數,得到廣義歐拉向量;7)求出查詢圖像和圖像庫中所有圖像間的距離,按照由小到大的順序排列,取感興趣的前n幅返回給用戶作為檢索結果。本發明的方法可以顯著提高檢索的效率。
文檔編號G06K9/46GK101350024SQ20081011942
公開日2009年1月21日 申請日期2008年8月29日 優先權日2008年8月29日
發明者艷 張, 李鳳霞, 楊紅菊, 陳宇峰, 黃天羽 申請人:北京理工大學