本發明屬于(yu)(yu)圖像(xiang)識別技(ji)術領域,尤(you)其涉及一種(zhong)構建(jian)城市道路車輛(liang)圖像(xiang)數據庫(ku)的方法(fa),可用于(yu)(yu)智能交通系(xi)統(tong)中的深度卷積神經(jing)網絡訓(xun)練(lian)。
背景技術:
我國城市(shi)道路(lu)交(jiao)(jiao)(jiao)通管理工作正面(mian)臨著相當嚴峻的(de)形勢。近(jin)年來,隨著社(she)會經濟的(de)迅速(su)發展和城市(shi)化的(de)快速(su)推廣,各類交(jiao)(jiao)(jiao)通出(chu)行工具均在(zai)不(bu)斷增(zeng)加,且(qie)呈現(xian)(xian)出(chu)多元(yuan)化快速(su)增(zeng)長趨(qu)勢。現(xian)(xian)有道路(lu)資源正在(zai)逐漸趨(qu)于飽和,不(bu)僅制約了社(she)會經濟發展,而且(qie)帶來了一系(xi)列(lie)的(de)交(jiao)(jiao)(jiao)通事故,如交(jiao)(jiao)(jiao)通擁堵(du)、車禍等(deng),嚴重影響了市(shi)民的(de)交(jiao)(jiao)(jiao)通出(chu)行。因此,改善交(jiao)(jiao)(jiao)通管理方(fang)法,提高管理水平,最(zui)大(da)限度(du)緩解(jie)現(xian)(xian)有交(jiao)(jiao)(jiao)通狀況已經刻不(bu)容緩。
車輛(liang)種(zhong)類以及(ji)數量(liang)的(de)(de)統(tong)計,是城市(shi)交通管理工作(zuo)的(de)(de)一項基(ji)本而重要的(de)(de)任務。如果沒(mei)有正(zheng)確(que)的(de)(de)車輛(liang)統(tong)計數據(ju),就不可能(neng)對(dui)道路(lu)車流(liu)量(liang)分布規律進(jin)行(xing)準確(que)的(de)(de)預測(ce)(ce),更不能(neng)為城市(shi)道路(lu)規劃做出正(zheng)確(que)的(de)(de)指導。因此,防治交通事故(gu),提(ti)高國民出行(xing)質(zhi)量(liang)的(de)(de)前(qian)提(ti)是正(zheng)確(que)地識別(bie)與計數各(ge)類道路(lu)車輛(liang),從而進(jin)一步掌握交通事故(gu)的(de)(de)發生(sheng)動(dong)態,為實(shi)時、準確(que)的(de)(de)預測(ce)(ce)預報提(ti)供(gong)理論依據(ju)。
傳統交(jiao)通管理(li)方法一(yi)般依靠(kao)人力或者基(ji)礎(chu)交(jiao)通設施(shi)(shi),但單純(chun)的(de)人力管理(li)勞動強度大、效率(lv)低(di)。因(yin)此,通過開發(fa)智能交(jiao)通系統遠程自動監測道(dao)路狀況,將有助于提(ti)高(gao)車輛的(de)檢測與(yu)計數的(de)準(zhun)確率(lv)和效率(lv),減少交(jiao)通事故帶來(lai)的(de)損失,進而促進城市(shi)道(dao)路規劃的(de)實(shi)施(shi)(shi),提(ti)高(gao)市(shi)民(min)生活質量。
深度(du)卷積神經(jing)網絡(luo)是(shi)目(mu)前(qian)圖(tu)像識別領域的前(qian)沿技術(shu),能(neng)夠滿足(zu)智能(neng)交通(tong)系統車(che)(che)(che)輛檢(jian)測(ce)與計數(shu)(shu)(shu)(shu)的要求。其本質上是(shi)一種特(te)征學(xue)習(xi)算法,采(cai)用監(jian)督學(xue)習(xi)策略,從(cong)數(shu)(shu)(shu)(shu)據(ju)(ju)庫(ku)(ku)(ku)中(zhong)提取不同類(lei)型車(che)(che)(che)輛的判別性(xing)特(te)征來實現(xian)車(che)(che)(che)輛的檢(jian)測(ce)和(he)分(fen)類(lei)。因(yin)此,訓練適用于(yu)(yu)(yu)智能(neng)交通(tong)系統的深度(du)卷積神經(jing)網絡(luo)需(xu)要提供(gong)一個包含(han)城市道路各種情況(kuang)的車(che)(che)(che)輛數(shu)(shu)(shu)(shu)據(ju)(ju)庫(ku)(ku)(ku)。目(mu)前(qian),國內(nei)外已存(cun)在(zai)一些車(che)(che)(che)輛圖(tu)像數(shu)(shu)(shu)(shu)據(ju)(ju)庫(ku)(ku)(ku),如德國卡爾斯魯厄技術(shu)學(xue)院(yuan)團隊于(yu)(yu)(yu)2013年公(gong)布的KITTI數(shu)(shu)(shu)(shu)據(ju)(ju)庫(ku)(ku)(ku)、2012年中(zhong)國科學(xue)院(yuan)建(jian)(jian)立(li)的拍(pai)攝于(yu)(yu)(yu)蘇州高速公(gong)路的數(shu)(shu)(shu)(shu)據(ju)(ju)庫(ku)(ku)(ku),但(dan)是(shi)這些數(shu)(shu)(shu)(shu)據(ju)(ju)庫(ku)(ku)(ku)均是(shi)針對特(te)定問題而構(gou)建(jian)(jian)的,所覆蓋車(che)(che)(che)輛類(lei)別、道路狀況(kuang)、天氣情況(kuang)和(he)拍(pai)攝角度(du)存(cun)在(zai)不足(zu),無(wu)法有效的描述中(zhong)國城市交通(tong),極(ji)易(yi)導(dao)致所建(jian)(jian)模型出(chu)現(xian)過擬合現(xian)象,檢(jian)測(ce)和(he)分(fen)類(lei)的魯棒性(xing)以及泛化能(neng)力不足(zu)。因(yin)此,對于(yu)(yu)(yu)國內(nei)的車(che)(che)(che)輛檢(jian)測(ce)領域,亟需(xu)建(jian)(jian)立(li)一個具有全天候、復雜場景、交通(tong)擁堵(du)、多種車(che)(che)(che)型等特(te)點的數(shu)(shu)(shu)(shu)據(ju)(ju)庫(ku)(ku)(ku)。
同時,深(shen)度卷積神經網絡的(de)訓練過程(cheng)需要(yao)(yao)大量大小一致(zhi)的(de)圖(tu)像(xiang)樣本,且每張輸入圖(tu)像(xiang)均需要(yao)(yao)對應(ying)的(de)標(biao)簽文件來說(shuo)明圖(tu)像(xiang)中目標(biao)信息的(de)類別和(he)位置。因此,需要(yao)(yao)一種樣本標(biao)定方法,來準確的(de)獲(huo)取車輛在(zai)圖(tu)像(xiang)中的(de)位置和(he)類別信息,建立完善的(de)數據庫用(yong)于網絡模型的(de)訓練。
技術實現要素:
本(ben)發(fa)明的(de)(de)(de)目(mu)的(de)(de)(de)在(zai)于(yu)針對現有技術存在(zai)的(de)(de)(de)不(bu)足(zu),提出(chu)一種構建城市道路車輛(liang)圖(tu)像數(shu)(shu)據庫的(de)(de)(de)方法,以有效的(de)(de)(de)描(miao)述車輛(liang)圖(tu)像,準確(que)的(de)(de)(de)給出(chu)車輛(liang)的(de)(de)(de)位置和類別信息,為智能交通系(xi)統中訓(xun)練深度(du)卷積神經網絡提供數(shu)(shu)據支撐(cheng)。
為實現(xian)上述(shu)目(mu)的,本發明(ming)的技術方案如下:
(1)根據車型種類(lei)、不同場(chang)景、拍攝角度、光(guang)照變化和天氣情況這些(xie)因素,確定(ding)數據采集方案并采集道路車輛原始視頻;
(2)將原(yuan)始(shi)(shi)視頻分解為原(yuan)始(shi)(shi)圖像,使用梯形(xing)框標定(ding)原(yuan)始(shi)(shi)圖像中的感興(xing)趣區域,并對梯形(xing)框外非感興(xing)趣區域進行模(mo)糊(hu)化(hua)處理;
(3)標注感興趣區域內車輛的類(lei)型和(he)位置,生成標簽文件;
(4)將標簽文(wen)件轉(zhuan)換(huan)為xml格式文(wen)件進行存(cun)儲,得到車輛(liang)圖像數據庫。
本發明具有以下優(you)點:
1.能準確的給出訓(xun)練深度卷積神經網(wang)絡所(suo)需(xu)的車輛位置和類別信(xin)息
現有城市交(jiao)(jiao)通(tong)車輛(liang)圖像(xiang)(xiang)數(shu)據庫由于使(shi)用全圖訓練(lian)(lian)深度卷積神(shen)經(jing)網絡模型,遠處(chu)道路上車輛(liang)過小的(de)(de)(de)情況以(yi)及道路兩側背景信息會為訓練(lian)(lian)智能(neng)交(jiao)(jiao)通(tong)系統(tong)的(de)(de)(de)深度卷積神(shen)經(jing)網絡提供了不必(bi)要的(de)(de)(de)計算量。因(yin)此,本(ben)發明提出的(de)(de)(de)城市道路車輛(liang)圖像(xiang)(xiang)數(shu)據庫的(de)(de)(de)構建方法,由于只標記感興趣(qu)區域內的(de)(de)(de)車輛(liang),因(yin)而能(neng)準確的(de)(de)(de)給出訓練(lian)(lian)網絡所需(xu)的(de)(de)(de)車輛(liang)位置和類(lei)別信息。
2.為訓練性能(neng)良(liang)好的車輛檢測與計(ji)數深度卷積神經網絡提供數據支(zhi)撐
深度卷(juan)積(ji)神經網(wang)絡(luo)網(wang)絡(luo)特(te)征(zheng)提取(qu)能力不(bu)僅僅取(qu)決于其網(wang)絡(luo)架構,還依賴(lai)于所(suo)使用的數(shu)(shu)據(ju)(ju)(ju)庫(ku)(ku),其本(ben)質上是一(yi)種(zhong)數(shu)(shu)據(ju)(ju)(ju)驅動方(fang)法。現有城市(shi)交(jiao)(jiao)通(tong)車(che)輛圖像數(shu)(shu)據(ju)(ju)(ju)庫(ku)(ku)由(you)于樣本(ben)數(shu)(shu)量不(bu)足,場景不(bu)夠豐(feng)富,其泛化能力不(bu)足,極易(yi)導致(zhi)所(suo)訓練的深度卷(juan)積(ji)神經網(wang)絡(luo)模型出現過擬合現象,因此本(ben)發明(ming)建立了(le)一(yi)個多(duo)種(zhong)類、多(duo)天氣和(he)多(duo)場景的車(che)輛圖像數(shu)(shu)據(ju)(ju)(ju)庫(ku)(ku),為訓練適用于多(duo)種(zhong)交(jiao)(jiao)通(tong)狀況的深度卷(juan)積(ji)神經網(wang)絡(luo)提供數(shu)(shu)據(ju)(ju)(ju)支撐。
附圖說明
圖1為本發明的(de)實(shi)現流(liu)程圖;
圖(tu)(tu)2為本發明中采集的原始圖(tu)(tu)像(xiang)樣本圖(tu)(tu);
圖(tu)3為(wei)本(ben)發明中模糊化后(hou)的圖(tu)像樣本(ben)圖(tu);
圖(tu)4為本發(fa)明中標注感興趣區域內的車輛示(shi)意圖(tu)。
具體實施方式:
下面結合實例(li)和(he)附圖對(dui)本發明進(jin)行詳細說明。
參照圖1,本(ben)發明的實現步驟如下(xia):
步驟一(yi):制定采集方案并(bing)采集原始視頻
本(ben)實例以西安(an)市交通路(lu)況為(wei)例,確定車輛數據拍攝地點(dian)和車輛類(lei)型。
車(che)輛數據(ju)采(cai)集(ji)地點(dian)如表1所示,這些采(cai)集(ji)地點(dian)包括大(da)學(xue)、商業區(qu)、公交(jiao)站(zhan)、十(shi)字(zi)路口和單(dan)車(che)道(dao)道(dao)路這些不同(tong)場(chang)景的(de)(de)人行天橋,并且(qie)在各場(chang)景下設定了不同(tong)的(de)(de)拍攝位置,采(cai)集(ji)能夠有效描述(shu)西安市(shi)交(jiao)通情況(kuang)的(de)(de)原(yuan)始視(shi)頻(pin);
車(che)(che)輛類型包括(kuo)8類:汽車(che)(che)、自行車(che)(che)、摩托(tuo)車(che)(che)、公交車(che)(che)、三輪車(che)(che)、緊急車(che)(che)、卡車(che)(che)和(he)泥罐車(che)(che);
具體拍(pai)攝方法為:在(zai)每個拍(pai)攝地點(dian)的人行天(tian)橋(qiao)上,使(shi)用(yong)三腳架(jia)固(gu)定DV相機(ji)或者(zhe)高像素手機(ji),在(zai)早(zao)上、中午、傍晚(wan)、晚(wan)上四(si)個時(shi)間段(duan)(duan),以俯視角度錄(lu)制(zhi)(zhi)天(tian)橋(qiao)兩側兩個車(che)道的車(che)輛正面通(tong)行視頻,錄(lu)制(zhi)(zhi)時(shi)長為10分鐘,錄(lu)制(zhi)(zhi)的路段(duan)(duan)長度為100米。
表1.車(che)輛(liang)檢測視頻數(shu)據采(cai)集地(di)點
視頻(pin)(pin)錄制完成之后,刪除時長不夠、清(qing)晰度(du)較差或者道路遮擋嚴重的(de)(de)視頻(pin)(pin),按地(di)點-時間-天(tian)氣的(de)(de)格(ge)式進行存放,如:公交(jiao)五公司(si)20160422_18:19陰,表示該視頻(pin)(pin)是2016年4月(yue)22號(hao)18點19分于公交(jiao)五公司(si)拍(pai)攝的(de)(de),當(dang)天(tian)天(tian)氣為陰天(tian)。
步驟二:分(fen)解原始視(shi)頻并進(jin)行模糊化處理
(2a)分解原(yuan)始視頻并保存原(yuan)始圖(tu)像:
根(gen)據原(yuan)(yuan)始(shi)(shi)視(shi)頻(pin)中道路擁堵情況,按(an)照(zhao)不同的(de)(de)幀數間隔(ge)將(jiang)(jiang)視(shi)頻(pin)分解為JPEG格式的(de)(de)RGB圖(tu)像(xiang):若(ruo)視(shi)頻(pin)中道路車輛過(guo)于擁堵,則以48幀為間隔(ge)從(cong)視(shi)頻(pin)中提取原(yuan)(yuan)始(shi)(shi)圖(tu)像(xiang);若(ruo)視(shi)頻(pin)中道路狀況通暢,則以24幀為間隔(ge)從(cong)視(shi)頻(pin)提取原(yuan)(yuan)始(shi)(shi)圖(tu)像(xiang),并將(jiang)(jiang)視(shi)頻(pin)分解得到(dao)的(de)(de)原(yuan)(yuan)始(shi)(shi)圖(tu)像(xiang)存放在與用該視(shi)頻(pin)名(ming)命名(ming)的(de)(de)文件(jian)夾中,提取的(de)(de)原(yuan)(yuan)始(shi)(shi)圖(tu)像(xiang)如圖(tu)2所示,這(zhe)些原(yuan)(yuan)始(shi)(shi)圖(tu)像(xiang)的(de)(de)大小為1280×720。
(2b)劃(hua)定感(gan)興趣區域:
為有效減少道路兩側背景信(xin)息(xi)以及遠處(chu)道路上(shang)車輛(liang)過(guo)小(xiao)的情況對訓(xun)練(lian)網絡(luo)模型的影響,設定原始圖像中的感興趣(qu)區域,即(ji)標注車輛(liang)信(xin)息(xi)時所重點關注的區域;
再使用(yong)梯形(xing)框(kuang)來標(biao)定原始圖(tu)像中(zhong)的感興趣區域,梯形(xing)框(kuang)的兩(liang)腰分(fen)別與道路兩(liang)側路沿平行,底邊(bian)與圖(tu)像底邊(bian)重合(he),上(shang)邊(bian)的選擇以(yi)保證能采(cai)集到同一(yi)輛車由(you)遠及近的漸變(bian)過程為準;
(2c)對非(fei)感興趣區域進行模(mo)糊化處(chu)理:
根據所劃定的(de)感(gan)興(xing)趣(qu)區域(yu)(yu),對原始(shi)圖像中(zhong)的(de)非感(gan)興(xing)趣(qu)區域(yu)(yu)進行簡單模(mo)糊處理,其步驟(zou)為:
(2c1)讀取原(yuan)始(shi)圖像(xiang),從圖像(xiang)中的第一(yi)個像(xiang)素(su)(su)點(dian)開始(shi),判斷其所(suo)在(zai)(zai)的區(qu)域(yu):若像(xiang)素(su)(su)點(dian)在(zai)(zai)感興趣區(qu)域(yu)內,則不作處理(li),跳轉(zhuan)到下一(yi)個像(xiang)素(su)(su)點(dian);若像(xiang)素(su)(su)點(dian)在(zai)(zai)非在(zai)(zai)感興趣區(qu)域(yu)內,則用(yong)它領域(yu)內像(xiang)素(su)(su)點(dian)的平(ping)均值代(dai)替該點(dian)的像(xiang)素(su)(su)值,然(ran)后跳轉(zhuan)下一(yi)個像(xiang)素(su)(su)點(dian);
(2c2)遍歷完圖(tu)片所有(you)像(xiang)素點(dian),完成圖(tu)像(xiang)的(de)模(mo)(mo)糊(hu)(hu)化處理(li)后,并將經過模(mo)(mo)糊(hu)(hu)處理(li)的(de)圖(tu)片保(bao)存(cun),如圖(tu)3所示,感興趣區域以白色梯形框標定,車道外(wai)的(de)事(shi)物以及不利于網絡去檢測識別的(de)過小的(de)車輛均被模(mo)(mo)糊(hu)(hu)化。
步驟三:標注車輛(liang)的(de)類別和位(wei)置信(xin)息并獲得xml格式(shi)標簽文件
(3a)在圖(tu)像中的(de)感興趣區域內,使用外接矩(ju)形框對車(che)輛(liang)進行(xing)分類和定位,即選擇車(che)身(shen)主體(ti)未被遮擋的(de)車(che)輛(liang),對公交車(che)只標(biao)(biao)注車(che)頭,對其他車(che)標(biao)(biao)注整體(ti),標(biao)(biao)注結果如圖(tu)4所示(shi),其中藍色(se)框標(biao)(biao)記(ji)了公交車(che)、黃色(se)框標(biao)(biao)記(ji)了摩托車(che)、綠色(se)框標(biao)(biao)記(ji)了汽(qi)車(che);
(3b)對模糊化后的(de)(de)圖像(xiang)一一進行感興(xing)趣區域內(nei)的(de)(de)車輛標(biao)注,記(ji)錄標(biao)注車輛所用的(de)(de)每(mei)個外接矩(ju)形(xing)框的(de)(de)各頂點坐標(biao)和(he)其代表(biao)的(de)(de)類別(bie),并將(jiang)每(mei)個矩(ju)形(xing)框的(de)(de)頂點坐標(biao)和(he)其代表(biao)的(de)(de)類別(bie)存入txt格式(shi)的(de)(de)標(biao)簽(qian)文(wen)(wen)件中,標(biao)注完成(cheng)后,每(mei)一張圖像(xiang)對應一個標(biao)簽(qian)文(wen)(wen)件;
當(dang)堵車時間過長時,從原始視頻中得(de)到的原始圖像往往會出(chu)現多張(zhang)相似(si)的情況,對于這(zhe)種(zhong)情況,刪除相似(si)的圖像,不進行重復標注(zhu);
(3c)合并所(suo)有(you)(you)標簽(qian)文件,并將文件txt格(ge)式(shi)(shi)(shi)轉換為(wei)xml格(ge)式(shi)(shi)(shi),獲(huo)得包含數據庫內所(suo)有(you)(you)車輛類別(bie)與位置信息的xml格(ge)式(shi)(shi)(shi)標簽(qian)文件。
步驟四:存儲標簽文件、圖像文件名和樣本(ben)圖像得(de)到(dao)完整數據庫
(4a)建(jian)立與深(shen)度(du)卷積神經網絡訓練過程(cheng)相對應的文件(jian)夾存儲數據:
由(you)于訓(xun)練(lian)深度卷積神經網絡(luo)包括自下而上的(de)非監督學習與(yu)自頂向下的(de)監督學習的(de)學習過(guo)程(cheng)(cheng)以(yi)及網絡(luo)測試(shi)過(guo)程(cheng)(cheng),每一個(ge)過(guo)程(cheng)(cheng)都會根據所提供(gong)樣本的(de)圖像文(wen)件(jian)名,尋(xun)找樣本圖片與(yu)對(dui)應樣本的(de)xml標(biao)簽(qian)信(xin)息。因而,本發明的(de)數據庫(ku)需要建(jian)立與(yu)網絡(luo)訓(xun)練(lian)過(guo)程(cheng)(cheng)相對(dui)應的(de)三個(ge)主(zhu)文(wen)件(jian)夾存(cun)儲數據。其(qi)中
第一個(ge)是ImageSets文(wen)(wen)件(jian)(jian)夾,用于存儲(chu)圖像文(wen)(wen)件(jian)(jian)名列表的(de)文(wen)(wen)件(jian)(jian),該文(wen)(wen)件(jian)(jian)夾內(nei)有一個(ge)名為(wei)Main的(de)子文(wen)(wen)件(jian)(jian)夾,存放(fang)著訓(xun)練(lian)深(shen)度卷積神經網(wang)絡不同過程所需的(de)圖片文(wen)(wen)件(jian)(jian)名,具體(ti)為(wei):
train.txt,存有訓練(lian)網絡的圖像文件的文件名(ming)列(lie)表,
trianval.txt,存有訓練(lian)和驗證網絡的圖(tu)像(xiang)文件(jian)的文件(jian)名列表,
val.txt,存有驗(yan)證網絡的圖像文件的文件名列表,
test.txt,存有測試(shi)網(wang)絡的圖像(xiang)文件(jian)的文件(jian)名(ming)列表;
第二個是Annotations文(wen)件夾,用于(yu)存儲包(bao)含車輛(liang)類別與位置信(xin)息的xml格式標(biao)簽文(wen)件;
第三(san)個是JPEGImages文件夾,用于(yu)存放(fang)樣(yang)本(ben)圖(tu)像;
(4b)合并所有文件夾(jia)獲得完整數據庫:
將(jiang)(4a)所建的Annotations、ImageSets和JPEGImages這(zhe)三(san)個(ge)(ge)文件(jian)夾整(zheng)合(he)到(dao)一(yi)個(ge)(ge)文件(jian)夾內,并命(ming)名為Vechile_Data,得(de)到(dao)完(wan)整(zheng)的城市道路車輛圖像數據庫。
本發明(ming)的(de)效果可通過(guo)以(yi)下(xia)應用(yong)實例進一步說明(ming)。
使用上述方法(fa)構建的(de)車輛圖(tu)像數據庫(ku)訓練現有的(de)深(shen)度卷積神經(jing)網絡模(mo)型,并計算最終測試結果的(de)召(zhao)回率,其(qi)應用過(guo)程如下:
第(di)一步,選擇深度神經(jing)網絡:
由于SSD網(wang)(wang)絡(luo)(luo)是一種多尺度(du)目標(biao)檢(jian)測深度(du)卷(juan)(juan)積神(shen)經網(wang)(wang)絡(luo)(luo)框架,可以用來(lai)實現對目標(biao)信息的(de)定位和分類(lei),滿(man)足(zu)智能交通系統要實現車輛檢(jian)測與技術的(de)要求,因此選擇SSD網(wang)(wang)絡(luo)(luo)模(mo)型進行(xing)訓(xun)練,同時(shi)在(zai)深度(du)卷(juan)(juan)積神(shen)經網(wang)(wang)絡(luo)(luo)SSD網(wang)(wang)絡(luo)(luo)框架的(de)基礎網(wang)(wang)絡(luo)(luo)VGG-16上,添(tian)加(jia)卷(juan)(juan)積層(ceng)和池化(hua)層(ceng),以增加(jia)整個網(wang)(wang)絡(luo)(luo)的(de)特征提取能力;
第二步,對網(wang)絡進行訓練并計算最終(zhong)測試結果的(de)召回(hui)率:
從已建立(li)的數據庫(ku)中(zhong)選(xuan)擇汽(qi)車、摩托(tuo)車和公交車這三(san)類(lei)道路(lu)最常見車輛的數據對SSD網絡進(jin)行訓練和測試(shi)。
實例中,使用(yong)(yong)SSD網(wang)(wang)絡框架中的(de)(de)VGG-16網(wang)(wang)絡的(de)(de)原始參數對(dui)(dui)基礎網(wang)(wang)絡進(jin)行(xing)初始化,用(yong)(yong)深(shen)度學習Xavier初始化方法(fa)對(dui)(dui)額外添加的(de)(de)卷積(ji)層和(he)池化層進(jin)行(xing)初始化,迭代次(ci)數選擇15000次(ci),對(dui)(dui)網(wang)(wang)絡模型進(jin)行(xing)訓(xun)練。訓(xun)練完(wan)成后,用(yong)(yong)一段(duan)時(shi)長(chang)為10分(fen)(fen)鐘的(de)(de)視頻對(dui)(dui)網(wang)(wang)絡進(jin)行(xing)測(ce)試并計算(suan)測(ce)試結(jie)果的(de)(de)召回率(lv)。經過(guo)計算(suan),測(ce)試結(jie)果中摩托車、汽車及公交車的(de)(de)召回率(lv)分(fen)(fen)別為:94%、99%、99%。
以(yi)(yi)上實(shi)例(li)以(yi)(yi)及(ji)最終的(de)測試效果表明利用本(ben)發明數據(ju)庫描述(shu)的(de)車(che)輛圖像以(yi)(yi)及(ji)準(zhun)確給(gei)出的(de)車(che)輛位置(zhi)和類別信(xin)息(xi),為智能交(jiao)通系(xi)統(tong)中(zhong)訓練(lian)深度卷積神經網絡提(ti)供(gong)了可靠的(de)數據(ju)支撐。