基于深度學習的醫學氣體識別方法
【專利摘要】本發明公開了一種基于深度學習的醫學氣體識別方法,具體使用原始的頻率響應信號,對其進行簡單的歸一化,然后輸入棧式自編碼網絡,通過逐層提取,最終學習得到原始數據的抽象特征,整個網絡對外屏蔽了提取特征,降維,抑制漂移等過程,同時在網絡最后附加一個分類層,使得這些特征可以直接進入分類器進行分類。訓練過程分為預訓練與微調兩個步驟,可以有效地提高網絡的學習能力,訓練完成后,新樣本輸入網絡可以直接得到預測的類別。本發明的方法能自動提取醫學氣體有效區分特征,將特征提取、特征選擇和抑制漂移等步驟融合在了一起,極大地簡化了傳統方法的復雜度,提升了氣體檢測與識別的效率。
【專利說明】基于深度學習的醫學氣體識別方法
【技術領域】
[0001]本發明屬于生物醫學【技術領域】,具體涉及醫學氣體識別方法。
【背景技術】
[0002]機器嗅覺是一種人工智能系統,其基本原理是:氣味分子被傳感器陣列吸附,產生電信號,然后使用各種信號處理技術提取特征,再經計算機模式識別系統做出判斷,完成氣體識別和濃度測量等工作。電子鼻系統即是機器嗅覺的一個典型應用,在醫學領域發揮著非常重要的作用,例如診斷某些疾病,識別血液中的細菌種類,檢測對呼吸系統有害的氣體等。
[0003]傳感氣體檢測與識別在醫學領域有著重要的應用,例如可以利用電子鼻設備采集口腔、胸腔、血液內的樣本數據,然后使用各種信號處理技術以分析處理,再由計算機模式識別系統做出判斷,可以完成諸如疾病診斷、病菌識別、藥物濃度測定等任務。
[0004]傳統的氣體檢測與識別方法通常包含特征提取,特征選擇等步驟,最后通過分類、回歸或者聚類等手段達成預定目標。對于需要長期使用的設備,還必須使用有效的傳感器漂移補償技術來抑制漂移帶來的影響。在醫學應用中,由于這些傳統方法操作復雜,效率較低,往往需要在精確性與實時性之間折衷。
[0005]傳感器采樣得到的數據可以看作是一種時間序列信號,這種信號結構復雜,難以解釋,并且往往維度很高。為了更好的進行識別,通常需要根據信號的各種屬性設計特征,再經過特征選擇,如降維等,然后將他們作為分類算法的輸入進行分類,例如支持向量機。
[0006]傳感器漂移是指隨著時間的推移,傳感器的響應會發生緩慢而又隨機的變化。這種變化導致模式識別系統在當前學習得到的模式不能夠很好地應用于后續的待測樣本,從而使氣體檢測與識別的準確率逐漸降低。在醫學應用中,為了抑制傳感器漂移的影響,一般有兩種措施:⑴開發有效的漂移補償技術。這個過程往往與特征提取相互獨立,而且操作復雜,效率很低;⑵由于短時間內的漂移程度較小,通過定期對電子鼻設備進行維護更新以保證采樣數據穩定可靠,但是這無疑極大地增加了成本,減少了設備的使用壽命。
[0007]實際上,某些設計良好的特征對漂移有很好的魯棒性。從這一角度來考慮,可以簡單的通過提取更好的特征來抑制傳感器漂移,從而將兩個過程融合在一起。深度學習技術通過建立包含多個隱層的人工神經網絡,模擬人類大腦來進行分析學習和解釋數據,可以獲得數據的高度抽象的表示,善于發現數據中潛在的模式,在解決上述問題時非常適用。
[0008]在文獻“ M.Tr i ncave 11 i,S.Cor ade sch i,A.Lou t fi,B.Sdclcrquist,P.Thunberg, Direct identification ofbacteria in blood culture samples using anelectronic nose, IEEE Trans Biomedical Engineering57 (12), 2884 - 2890,2010”中提出了一種有效識別血液培養標本中的病原菌的方法,該方法首先由電子鼻設備米樣得到樣本數據,然后進行特征提取和降維,最后用支持向量機完成分類,其中在特征提取部分,針對信號總體波形,采用了穩態響應和響應導數兩種特征提取方法。
[0009]有時為了在復雜的問題中得到更高的識別準確率,需要更細致地分析信號波形,提取維度更高的特征。在文獻 “A.Vergaraa, S.Vembua, T.Ayhanb, M.A.R.Vitae, Μ.L.H.Vitae and R.Huertaa.Chemical gas sensor drift compensation using classiferensembles, Sensors andActuators B: Chemical, vol.166-167,pp.320-329,May2012,,研究了如何提高漂移下的乙醇等氣體的識別準確率,設計了 8種不同的特征。
[0010]在分類算法確定的情況下,氣體的識別準確率就只取決于特征的好壞程度。相比于原始信號中的頻率響應值,設計良好的特征可以大幅度的減少維度冗余,同時凸顯了不同類別之間的差異,通常可以得到比較好的識別準確率。
[0011]然而手工設計的特征往往針對某些特定的應用場合(氣體類型,傳感器類型,外界環境等),因而具有極強的目的性,通用性很差。而且由于傳感器的交叉敏感性,最終提取的特征維數仍然很高,通常需要尋找高效的降維算法,如PCA、LDA等。如果在某個新的應用中,使用現有特征的識別準確率都達不到要求,就需要設計更好的特征,這無疑進一步增加了這一任務的復雜程度。
[0012]目前抑制漂移最有效的方法是通過周期重校進行漂移補償,其大體思想是尋找一種線性變換對傳感器響應進行歸一化,使得分類器可以直接應用于這些變換后的數據。
[0013]CN1514239A公開了一種實現氣體傳感器漂移檢測和修正的方法。該方法通過綜合利用主元分析和小波變換技術,提高了傳感器漂移檢測的靈敏度和準確度。對檢測出的漂移傳感器,采用基于自適應漂移模型的修正方法,對傳感器輸出進行在線修正,同時漂移模型可進行在線更新,從而達到提高傳感器系統可靠性,延長系統使用壽命的目的。
[0014]在文獻“T.Artursson, T.Ekl5v, 1.Lundstr5m, P.Martensson, M.Sjostrom,; andM.Holmberg, “Drift correction for gas sensors using multivariatemethods,,,J.Chemom.,vol.14,n0.5-6, pp.711 - 723,2000”中用一種參考氣體來近似估計漂移方向,然后對待分析氣體的響應進行如下的修正。
[0015]然而這些方法都假設傳感器的漂移規律是線性的,這一點并沒有得到證實,而且往往需要一種化學性質隨時間相對穩定而又與待分析氣體在傳感器行為上高度相似的參考氣體,這個條件在實際應用中無疑是相當苛刻的。除此之外,這些方法在實際應用中操作相當復雜,效率很低。
【發明內容】
[0016]本發明的目的是簡化傳統氣體檢測與識別方法的復雜度,開發一種更簡單,更高效,對于傳感器漂移更魯棒的氣體檢測與識別方法。
[0017]本發明方案使用原始的頻率響應信號,對其進行簡單的歸一化,然后輸入棧式自編碼網絡,通過逐層提取,最終學習得到原始數據的抽象特征,整個網絡對外屏蔽了提取特征,降維,抑制漂移等過程,同時在網絡最后附加一個分類層,使得這些特征可以直接進入分類器進行分類。訓練過程分為預訓練與微調兩個步驟,可以有效地提高網絡的學習能力,訓練完成后,新樣本輸入網絡可以直接得到預測的類別。
[0018]本發明的技術方案為:一種基于深度學習的醫學氣體識別方法,具體步驟如下:
[0019]步驟1.數據歸一化,設有m個樣本,將每個樣本按以下形式組織,V= [S1, S2…,st],其中,Si是第i個頻率響應值,一共有t個響應值,整個氣體數據集和對應的標簽可以表示為:
【權利要求】
1.一種基于深度學習的醫學氣體識別方法,具體步驟如下: 步驟1.數據歸一化,設有m個樣本,將每個樣本按以下形式組織,¥=[81,^,\],其中,Si是第i個頻率響應值,一共有t個響應值,整個氣體數據集和對應的標簽可以表示為:
2.根據權利要求1所述的基于深度學習的醫學氣體識別方法,其特征在于,步驟步驟2.6中利用最小化損失函數來訓練權重矩陣Θ具體過程如下: 步驟2.6.1隨機初始化參數矩陣Θ ; 步驟2.6.2直接計算J(0)的導數,其中,Θ ^表示矩陣中的第j列;
【文檔編號】G06F19/00GK103544392SQ201310503402
【公開日】2014年1月29日 申請日期:2013年10月23日 優先權日:2013年10月23日
【發明者】劉啟和, 陳雷霆, 蔡洪斌, 邱航, 蒲曉蓉, 胡曉楠 申請人:電子科技大學