一種基于數字圖像內容的圖書檢索方法
【技術領域】
[0001]本發明屬于計算機視覺領域,是圖像檢索領域中的一項重要應用,尤其是涉及一種基于數字圖像內容的圖書檢索方法。
【背景技術】
[0002]模糊C均值聚類算法是一種自適應聚類學習算法,它能夠根據不同類別的輸入訓練樣本特征值自動計算出對應的特征中心,從而為后續的識別與檢測工作提供可靠的先驗知識。這種方法的優點是,在樣本特征表征全面且樣本量充足的條件下能夠進行很好的分類工作,同時對于不良數據的容忍力較強,可以適應多種不同的數據環境。因此該算法廣泛應用于數據挖掘、圖像分類、圖像檢索、圖像物體識別、視頻對象跟蹤等多個圖像處理領域。近年來伴隨數據量的不斷增加,該技術的應用在一定程度上推動了計算機視覺技術的發展。
[0003]基于圖像的圖書檢索是圖像檢索的一項重要應用。一方面它可以根據圖像快速的檢索出對應的圖書信息,從而免去了人工手動輸入文字查詢圖書信息的環節;另一方面通過圖像檢索大大簡化了信息查找的難度,完成了所見即所得的查找模式。
[0004]目前有一些有關基于圖像的圖書檢索方面的研究,也出現了一些相應的方法,其中相當多的方法都用到了圖像特征和先驗學習。從基于圖像的圖書檢索技術角度來分,大致可以分為兩大類:基于圖像特征描述的圖書圖像檢索和基于信息標注的圖書圖像檢索,本文關注的重點在于前者。總體來說,基于信息標注的圖書圖像檢索,由于會受到標注信息不準,標注信息不全面不能有效地滿足各類識別情況等影響,使得該類方法的識別容易受到影響,并且適應的環境也相對局限,不具有有效地進行一對一檢索,此外由于信息標注工作量大維護困難,所以該方法在一定程度上受到了應用限制。相對來講基于圖像特征的方法準確率較高,圖像的多特征描述能夠有效的分析圖書的邊緣、顏色、角點等信息,再通過聚類分析能夠在訓練樣本足夠大的情況下找到不同圖書之間的分界線,此外該類方法對于無關數據的干擾有較強的容忍度,能夠適應較多的識別場景。但是基于訓練學習的方法需要選取全面描述圖像的特征以充分的獲取分類面,另外,對于不同聚類學習算法的輸出需要尋找一種合適的結果獲取規則進行最終結果的獲取。
[0005]伴隨圖形圖像專業方向的不斷發展,圖像檢索的功能會越來越完善,對于圖書圖像檢索要求會越來越高,但是檢索識別的環境卻越來越復雜。因此制定出一種可靠、魯棒的圖書檢索識別算法是十分有必要的。
【發明內容】
[0006]本發明的目的在于針對現有技術存在的不足,提出了一種基于數字圖像內容的圖書檢索方法。該方法以描述圖書圖像的多種特征為基礎,融入了聚類學習與概率分布確立的思想,充分提高了圖書檢索的效率,可以有效地進行不同場景下的圖書圖像檢索識別,對于圖像檢索系統是有積極意義的。
[0007]為實現上述目的,本發明公開了一種基于數字圖像內容的圖書檢索方法,該方法包括以下步驟:
[0008]將選取出的樣本圖書圖像進行分辨率歸一化操作,并進行多特征層面的圖像描述,然后對每種圖書進行學習訓練,以此得到不同的訓練識別模型;
[0009]將獲取的待檢索圖書圖像矯正為矩形,然后對其進行分辨率歸一化,在獲取出相應的圖像后對其進行多特征層面的圖像描述,將特征數據輸入所述訓練識別模型中進行初始結果的預測;所述預測結果中包含當前待檢索圖書最大可能的前兩種結果;
[0010]在得到初始預測結果后,分別判斷最大可能的兩類結果與其判別中心的高斯分布,概率值最高的那一類,確定為最終的檢索結果。
[0011]優選地,多特征層面的圖像描述包括:描述圖書圖像整體顏色分布的顏色矩特征、描述整幅圖像邊緣的邊緣直方圖特征和用于描述圖書圖像角點的角點特征中的一種或多種;
[0012]優選地,樣本圖書圖像在進行圖書圖像特征提取時全部進行分辨率歸一化操作。
[0013]優選地,樣本圖書圖像在進行顏色矩特征提取時,在分辨率歸一化操作結束后,先進行伽馬濾波,接著將樣本圖書圖像分解成有交疊的圖像區塊,其中每兩個相鄰的圖像區塊重疊率是其面積的0.3到0.5倍,然后計算圖像中相應區塊的顏色特征值,最后統計輸出整幅圖像的顏色信息。
[0014]優選地,樣本圖書圖像在進行顏色矩特征提取時,首先對樣本圖書圖像進行分塊處理。
[0015]優選地,樣本圖書圖像在進行角點特征提取時,在分辨率歸一化操作結束后對彩色圖像進行灰度化處理。
[0016]優選地,樣本圖書圖像在進行邊緣直方圖特征提取時,在分辨率歸一化操作結束后對彩色圖像中的每個顏色通道圖像都進行高斯濾波,將圖像分解成有交疊的圖像區塊,其中每兩個相鄰的圖像區塊重疊率是其面積的0.3到0.5倍,然后在每個圖像區塊中統計圖像在360度范圍內的梯度分布情況,最后統計輸出整幅圖像的邊緣信息描述值。
[0017]優選地,在得到描述圖像的各類特征后,用模糊C均值聚類算法對樣本特征進行聚類學習,在訓練學習之前要對所選樣本特征數據進行合并以得到整體的訓練學習參數。
[0018]優選地,進行初始結果的預測步驟包括:
[0019]在計算獲得初始結果前,按照樹的廣度優先策略進行中心遍歷并計算相似度,最后相似度最大的兩類被作為初始候選結果。
[0020]優選地,訓練識別模型是通過基于聚類思想的學習算法,對每種圖書進行學習訓練后獲取。
[0021]本發明能夠全面的描述圖像的顏色、角點和邊緣信息,特征數據聚類技術能夠對無關數據的干擾有較強的容忍度,并且能夠適應多種識別場景。在獲得初始預測結果后為精確的融合結果采用了高斯概率判別理論,有效的提高了圖書檢索的準確率。
【附圖說明】
[0022]圖1為本發明實施例提供的一種基于數字圖像內容的圖書檢索方法流程示意圖;
[0023]圖2為本發明實施例提供的顏色矩特征提取方法流程示意框圖;
[0024]圖3為本發明實施例提供的邊緣直方圖特征提取方法流程示意框圖;
[0025]圖4為本發明實施例提供的角點特征提取方法流程示意框圖。
【具體實施方式】
[0026]結合附圖,本發明實施例的基本思想是針對圖書圖像檢索的實際情況,將整個識別工作分為三個部分。在進行圖書圖像檢索之前,首先對圖書圖像進行矩形矯正、歸一化再進行一系列特征提取以及基于聚類思想的學習與訓練,以得到圖書圖像庫的特征聚類中心;然后在識別階段根據得到的待檢索圖書圖像再進矩形矯正、行歸一化與特征提取,將所得特征放入圖書圖像庫模型中得到初始結果;最后再根據高斯概率分布理論對初始結果進行融合以得到最后的檢索結果。以上方法可以適應多種識別場景,并在相當的程度上提高了識別精度。
[0027]圖1為本發明實施例提供的一種基于數字圖像內容的圖書檢索方法流程示意框圖。如圖1所示,該方法包括步驟101-103:
[0028]在步驟101、將選取出的樣本圖書圖像進行分辨率歸一化操作,并進行多特征層面的圖像描述,然后對每種圖書進行學習訓練,以此得到不同的訓練識別模型。
[0029]具體地,在圖書圖像檢索的學習訓練階段,首先對相應的樣本圖書圖像進行矩形矯正、分辨率歸一化操作,再提取描述圖像整體邊緣信息的邊緣直方圖特征(提取方法流程圖如圖2所示)、描述圖像顏色信息的顏色矩特征(提取方法流程圖如圖3所示)和用于描述圖像角點的角點特征(提取方法流程圖如圖4所示),然后通過基于聚類思想的學習算法進行歸類學習,旨在為后續的具體識別過程提供良好的判別識別模型。
[0030]優選地,樣本圖書圖像在進行多類特征提取時,分辨率按照圖像的原始尺度,歸一化為合適的大小;樣本圖書像