專利名稱:浮動車數據預處理裝置和方法
技術領域:
本 發明涉及智能交通領域,具體涉及一種數據預處理裝置和方法,其能夠對基于浮動車的交通數據進行預處理,從中去除臨時停車數據點。
背景技術:
目前,浮動車技術已廣泛應用于智能路況交通領域,利用基于浮動車的交通數據能夠進行路況分析、預測、監控等。在利用浮動車數據之前,通常需要對原始數據進行預處理,以去除錯誤和無用的數據,余下的數據才用于進一步的后續處理。這種預處理直接影響到計算的速度、強度和精確性,因此在以浮動車為基礎的路況計算、分析等過程中顯得十分重要。基于浮動車的原始交通數據通常包含各種不同類型的數據,例如正常行駛數據、臨時停車數據、長時間停車數據、錯誤數據等,這些數據中只有長時間停車和正常行駛數據才是比較有用的數據,能夠用于后續的路況分析、計算等處理,而其它數據會增加計算強度,減慢計算速度,并降低計算的精確性。從原始數據中去除這些其他數據并不容易。現有技術中數據預處理以全球定位系統GPS參數以及所關心的區域為基礎,從原始的交通數據中去除錯誤的數據和所關心的區域之外的數據。專利文獻1(CN200610168272.8)公開了一種浮動車數據預處理方法,該方法包括選擇一個周期內的浮動車數據,形成數據序列,逐個處理該數據序列的每一個數據;如果某一個數據不正確或者是該數據對應的位置的經度和緯度超出了所關心的區域,則從數據序列中去除該數據。上述方法盡管能夠去除錯誤和超出關心區域的數據,但不能去除其他干擾性的數據,例如臨時停車數據。在基于浮動車的交通數據采集、路況分析中,臨時停車數據是不可忽視的干擾數據,尤其在交通狀況復雜的市區環境中,車輛數目較大,交通不流暢,常常由于在前車輛、路口等因素,造成車輛暫停行駛或者行駛非常緩慢。在這種情況下采集到的浮動車數據是非正常數據(在本文中稱為臨時停車數據),會干擾對路況的正確計算和分析。 此外,在市區環境中,這種臨時停車數據出現的概率比較大,導致采集到的浮動車數據包含比較多的臨時停車數據。這種數據很容易被當作正常數據,如果在進行路況計算和分析之前不從浮動車數據中濾除這種數據,而直接將其作為正常數據,就會導致計算量的增加、計算速度的減慢以及計算精度的降低。因此,需要一種數據預處理方法,能夠去除臨時停車數據,降低浮動車為基礎的路況計算中后續計算的計算強度,提高計算的速度和精確性。
發明內容
為解決上述問題,本發明提出了一種數據預處理裝置,對基于浮動車的交通數據進行預處理,包括輸入單元,用于輸入包括多個數據點的交通數據,過濾單元,用于從所輸入的交通數據中濾除臨時停車數據點,以及輸出單元,用于輸出所述過濾單元濾除臨時停車數據點之后余下的數據點,作為預處理后的交通數據。優選地,過濾單元從多個數據點中作為參考點的數據點開始,逐個確定后續數據點中的每一個是否是臨時停車數據點,并將確定為臨時停車數據點的數據點濾除。優選地, 過濾單元根據數據點的位置信息和時間信息,確定數據點是否是臨時停車數據點。優選地,數據點的位置信息指示了該數據點對應的區域位置,數據點的時間信息指示了該數據點對應的采集時間;過濾單元比較參考點的后一數據點與參考點的區域位置之間的距離是否小于預定距離閾值,如果是,則進一步比較后一數據點與參考點的采集時間之間的時間間隔是否大于預定時間閾值,如果是,則確定該后一數據點是臨時停車數據點,如果區域位置之間的距離不小于預定距離閾值,或者采集時間之間的時間間隔不大于預定時間閾值,則確定該后一數據點不是臨時停車點。優選地,如果確定該后一數據點是臨時停車數據點,則過濾單元濾除該后一數據點,并繼續利用參考點,進行后續數據點的比較。優選地,如果確定該后一數據點不是臨時停車數據點,并利用其替代參考點,進行后續數據點的比較。優選地,多個數據點包括一個或多個預定周期內的數據點,數據預處理裝置逐周期地對數據點進行預處理。優選地,數據預處理裝置還包括排錯單元,用于從輸入單元輸入的多個數據點中排除錯誤的數據點和所需區域之外的數據點,其中,過濾單元對排錯單元處理后的數據點進行過濾。本發明還提出了一種數據預處理方法,對基于浮動車的交通數據進行預處理,包括輸入步驟,用于輸入包括多個數據點的交通數據,過濾步驟,用于從所輸入的交通數據中濾除臨時停車數據點,以及輸出單元,用于輸出在所述過濾步驟濾除臨時停車數據點之后余下的數據點,作為預處理后的交通數據。對于基于浮動車的交通數據,現有技術方法只能去除數據中錯誤的和所關心區域之外的數據點,而沒有考慮具有干擾性的臨時停車數據點。根據本發明的數據預處理裝置及方法在現有技術方法的基礎上,利用浮動車數據中各個數據點前后的關系,進一步濾除臨時停車數據點,從而能夠避免臨時停車數據的干擾,減少了要處理的數據量,減輕計算強度,提高計算速度和精度。
通過下面結合
本發明的優選實施例,將使本發明的上述及其它目的、特征和優點更加清楚,其中圖1示出了根據本發明示例實施例的數據預處理裝置的框圖;圖2示出了根據本發明示例實施例的數據預處理方法的流程圖3示出了根據本發明示例實施例的過濾單元的操作流程圖;圖4是用于描述本發明具體實施例的示意圖。
具體實施例方式在基于浮動車的路況計算和分析中,需要對原始浮動車數據進行預處理,以篩選出能夠用于后續計算的正常數據。本發明對現有技術的方法進行了改進,提出了一種數據預處理裝置和方法,其能夠利用浮動車數據中各個數據點的前后關系,從原始浮動車數據中濾除容易被當作正常數據的臨時停車數據點,從而避免臨時停車數據點對后續路況計算和分析的干擾,降低計算強度,提高計算速度和精度。以下參照附圖,對本發明的示例實施例進行詳細描述,本發明不限于下述示例實施例。為了清楚描述本發明的基本思想,附圖中僅示出了與本發明的技術方案密切相關的部件、功能或步驟,并且以下描述中省略了對已知技術、功能、部件或步驟的具體描述。圖1示出了根據本發明示例實施例的數據預處理裝置的框圖。數據預處理裝置 1用于對基于浮動車的交通數據進行預處理,其包括輸入單元30,用于輸入包括多個數據點的交通數據;過濾單元10,用于從所輸入的交通數據中濾除臨時停車數據點;以及輸出單元40,用于輸出所述過濾單元濾除臨時停車數據點之后余下的數據點,作為預處理后的交通數據。優選地,數據預處理裝置1還包括排錯單元20,用于從輸入單元30輸入的多個數據點中排除錯誤的數據點和所需區域之外的數據點,過濾單元10對排錯單元20處理后的數據點進行過濾。排錯單元20可以采用如專利文獻1中的傳統技術來排除錯誤和所需區域之外的數據點,在此不對其操作進行詳細的描述。優選地,輸入單元30輸入的交通數據是原始的基于浮動車數據的交通數據。優選地,基于浮動車的交通數據可以包括一個或多個預定周期內的數據點,預定周期可以是對交通數據進行處理的處理周期,例如GPS系統中的數據處理周期,或者根據需求、應用和經驗等因素設定的周期。數據預處理裝置1可以逐周期地對數據點進行預處理。對于每一個周期,數據預處理裝置1可以從第一個數據點或作為參考點的數據點開始, 逐個地進行預處理,直到該周期中的所有數據點都處理完畢。一般而言,每一個周期中的數據點原始是按照時間或采集的順序排列的,但是也可以在預處理之前或由數據預處理裝置1對數據點重新進行排列。每一個數據點具有位置信息和時間信息,位置信息指示了該數據點對應的區域位置,時間信息指示了該數據點對應的采集時間。例如,數據點可以與地理空間中車輛的位置相對應,并且可以繪制在相應的電子地圖上,如圖4所示。作為示例, 數據點的位置信息可以是基于GPS系統的經度和緯度信息,可以是電子地圖上的坐標點信息,也可以是本領域技術人員能夠設想到的任何適當的位置信息。時間信息指示的數據點對應的采集時間可以是絕對時間,也可以是相對時間。本領域技術人員可以根據需求和應用的不同,對位置信息和時間信息的內容、類型以及獲取方式進行適當選擇。過濾單元10利用每一個周期中各個數據點的前后關系,從交通數據中濾除臨時停車數據點。具體而言,過濾單元10可以從每一個周期中第一個數據點或作為參考點的數據點開始,根據數據點的位置信息和時間信息,比較參考點的后一數據點與參考點的區域位置之間的距離是否小于預定距離閾值,如果是,則進一步比較后一數據點與參考點的采集時間之間的時間間隔是否大于預定時間閾值,如果是,則確定該后一數據點是臨時停車數據點。如果區域位置之間的距離不小于預定距離閾值,或者采集時間之間的時間間隔不大于預定時間閾值,則確定該后一數據點不是臨時停車點。如果確定該后一數據點是臨時停車數據點,則過濾單元10濾除該后一數據點,并繼續利用參考點,進行后續數據點的比較。如果確定該后一數據點不是臨時停車數據點,并利用其替代參考點,進行后續數據點的比較。按照上述方式,過濾單元10逐個確定數據點是否是臨時停車數據點,并將確定為臨時停車數據點的數據點濾除,直到處理完該周期中所有數據點為止。下面結合圖2,對數據預處理裝置1的操作進行描述。圖2示出了數據預處理裝置 1的數據預處理方法的流程圖。在步驟200,數據預處理裝置1通過輸入單元30輸入包括多個數據點的浮動車交通數據,這些數據點可以是一個或多個預定周期的數據點,數據預處理裝置1逐周期地預處理數據點。在步驟202,排錯單元20確定當前周期內的多個數據點中的錯誤數據點以及所關心區域之外的數據點,并將確定的數據點排除。在步驟204,過濾單元10對排錯單元20處理后的數據點進行逐個過濾。在步驟206,判斷是否還有數據點需要處理,即,當前周期中所有的數據點是否處理完畢,如果是,則在步驟208,輸出單元40 輸出經過濾單元10處理后余下的數據點,作為預處理后的數據點,用于后續處理。如果還沒有處理完,則流程返回步驟204。步驟206的判斷可以由過濾單元10在處理完每一個數據點后進行。通過上述步驟,數據預處理裝置1對各個周期的數據點進行預處理,去除了錯誤的、關心區域之外的以及臨時停車的數據點,得到了能夠用于后續處理的數據點,包括正常行駛數據點和長時間停車數據點。圖3示出了根據本發明示例實施例的過濾單元10的操作流程圖,即,圖2所示步驟204中過濾單元10的具體操作。如圖3所示,過濾單元10從當前周期中第一個數據點或作為參考點的數據點開始進行處理。優選地,參考點可以是車輛啟動時采集的數據點或者是行駛期間的正常行駛數據點。在步驟300,過濾單元10計算參考點的后一數據點與參考點的區域位置之間的距離,并在步驟302將計算的距離與預定距離閾值相比較。例如,數據點的位置信息可以是包括經度和緯度的坐標信息,過濾單元10可以通過計算數據點的位置坐標之間的差值,得到兩個數據點的位置之間的距離。預定距離閾值可以是根據需求、 應用和/或經驗而設定的。如果在步驟302的比較結果為計算的距離小于預定距離閾值, 則過濾單元10在步驟304計算參考點的后一數據與參考點的數據采集時間之間的時間間隔,并在步驟306將計算的時間間隔與預定時間閾值相比較。預定時間閾值可以是根據需求、應用和/或經驗而設定的。如果時間間隔大于預定時間閾值,則在步驟308,過濾單元 10確定該后一數據點是臨時停車數據點,并濾除該后一數據點。如果在步驟302的比較結果為數據點位置之間的距離不小于預定距離閾值,則流程直接前進到步驟310,在此過濾 單元10確定該后一數據點不是臨時停車數據點,而是作為正常數據點保留。此外,如果在步驟306的比較結果是時間間隔不大于預定時間閾值,則流程也前進到步驟310。如果濾除該后一數據點,則過濾單元10繼續利用參考點,返回到步驟300,對下一個數據進行處理。反之,如果確定該后一數據點不是臨時停車數據點而將其保留,并利用該后一數據點替代參考點,返回到步驟300,對下一個數據進行處理。換言之,將該后一數據點當作參考點,進行后續數據點的過濾。過濾單元10逐個地對數據點執行如上步驟,直到在圖2的步驟206判斷當前周期中所有的數據點已處理完畢。 以上描述了根據本發明示例實施例的數據預處理裝置及方法。下面結合圖4給出一個具體示例,以更加清楚地闡釋本發明的基本思想。圖4是用于描述本發明具體實施例的示意圖,如圖4所示,以一個數據處理周期的浮動車數據所包括的11個數據點為例,每個數據點具有位置坐標信息和采集時間信息。同時,假定市區中車輛行駛的速度一般為35-45公里/小時。從11個數據點中選擇時間信息為10:21:20的數據點為參考點,開始本發明的數據預處理方法。該參考點的后一數據點是 10:21:50的數據點。從圖4可以看出,該數據點相對于參考點的位移很少。通過數據預處理裝置1的過濾單元10,可以計算并確定該數據點與參考點的位置之間的距離小于預定距離閾值,例如預定距離閾值可以在110-160米的范圍內。過濾單元10進一步計算該數據點和參考點之間的時間間隔(即,30秒)又多于預定時間閾值,例如預定時間閾值可以在10-20 秒的范圍內。由此,可以確定10:21:50的數據點為臨時停車點,過濾單元10將其濾除。然后,過濾單元10仍然將10:21:20的數據點作為參考點,對下一個數據點,即10:22:20的數據點進行處理。同樣,該數據點相對于參考點的位置距離不大,少于預定距離閾值,并且該數據點和參考點的時間間隔多于預定時間閾值,因此該數據點也濾除掉。依次處理下去,直到10:23:50的數據點,該數據點和參考點的位置之間的距離大于預定距離閾值,過濾單元 10可以確定該點是正常行駛的數據點。接著,過濾單元10利用10:23:50的數據點替代原參考點,以10:23:50的數據點作為新的參考點,進行后續數據點的處理。從圖4可以看到,當10:24:50的數據點為正常行駛的數據點時,過濾單元10以其作為參考點,對10:24:55的數據點進行處理。兩個數據點的位置之間的距離小于預定距離閾值,但是時間間隔只有5秒,不大于預定時間閾值,由此過濾單元10確定10:24:55的數據點不是臨時停車點,將其作為正常行駛點而保留。經過過濾后的余下數據點只有7個,減少了后續處理中的數據量,從而可以提高計算速度,減輕計算強度,并提高計算精度。以上描述了根據本發明示例實施例的數據預處理裝置和方法。在以上的描述中, 僅以示例的方式,示出了本發明的優選實施例,但并不意味著本發明局限于上述步驟和單元結構。在可能的情形下,可以根據需要對步驟和單元進行調整、取舍和組合。此外,某些步驟和單元并非實施本發明的總體發明思想所必需的元素。因此,本發明所必需的技術特征僅受限于能夠實現本發明的總體發明思想的最低要求,而不受以上具體實例的限制。至此已經結合優選實施例對本發明進行了描述。應該理解,本領域技術人員在不脫離本發明的精神和范圍的情況下,可以進行各種其它的改變、替換和添加。因此,本發明的范圍不局限于上述特定實施例,而應由所附權利要求所限定。
權利要求
1.一種數據預處理裝置,對基于浮動車的交通數據進行預處理,包括輸入單元,用于輸入包括多個數據點的交通數據,過濾單元,用于從所輸入的交通數據中濾除臨時停車數據點,以及輸出單元,用于輸出所述過濾單元濾除臨時停車數據點之后余下的數據點,作為預處理后的交通數據。
2.根據權利要求1所述的裝置,其中,過濾單元從多個數據點中作為參考點的數據點開始,逐個確定后續數據點中的每一個是否是臨時停車數據點,并將確定為臨時停車數據點的數據點濾除。
3.根據權利要求2所述的裝置,其中,過濾單元根據數據點的位置信息和時間信息,確定數據點是否是臨時停車數據點。
4.根據權利要求3所述的裝置,其中,數據點的位置信息指示了該數據點對應的區域位置,數據點的時間信息指示了該數據點對應的采集時間;過濾單元比較參考點的后一數據點與參考點的區域位置之間的距離是否小于預定距離閾值,如果是,則進一步比較后一數據點與參考點的采集時間之間的時間間隔是否大于預定時間閾值,如果是,則確定該后一數據點是臨時停車數據點,如果區域位置之間的距離不小于預定距離閾值,或者采集時間之間的時間間隔不大于預定時間閾值,則確定該后一數據點不是臨時停車點。
5.根據權利要求3所述的裝置,其中,如果確定該后一數據點是臨時停車數據點,則過濾單元濾除該后一數據點,并繼續利用參考點,進行后續數據點的比較。
6.根據權利要求3所述的裝置,其中,如果確定該后一數據點不是臨時停車數據點,并利用其替代參考點,進行后續數據點的比較。
7.根據權利要求1所述的裝置,其中,多個數據點包括一個或多個預定周期內的數據占,數據預處理裝置逐周期地對數據點進行預處理。
8.根據權利要求1所述的裝置,還包括排錯單元,用于從輸入單元輸入的多個數據點中排除錯誤的數據點和所需區域之外的數據點,其中,過濾單元對排錯單元處理后的數據點進行過濾。
9.一種數據預處理方法,對基于浮動車的交通數據進行預處理,包括輸入步驟,用于輸入包括多個數據點的交通數據,過濾步驟,用于從所輸入的的交通數據中濾除臨時停車數據點,以及輸出單元,用于輸出在所述過濾步驟濾除臨時停車數據點之后余下的數據點,作為預處理后的交通數據。
10.根據權利要求9所述的方法,其中,在過濾步驟中,從多個數據點中作為參考點的數據點開始,比較參考點的后一數據點與參考點的區域位置之間的距離是否小于預定距離閾值,如果是,則進一步比較后一數據點與參考點的采集時間之間的時間間隔是否大于預定時間閾值,如果是,則確定該后一數據點是臨時停車數據點,如果區域位置之間的距離不小于預定距離閾值,或者采集時間之間的時間間隔不大于預定時間閾值,則確定該后一數據點不是臨時停車點。
全文摘要
本發明提出了一種數據預處理裝置及方法,對基于浮動車的交通數據進行預處理,包括輸入單元,用于輸入包括多個數據點的交通數據;過濾單元,用于從所輸入的交通數據中濾除臨時停車數據點;以及輸出單元,用于輸出所述過濾單元濾除臨時停車數據點之后余下的數據點,作為預處理后的交通數據。本發明能夠去除臨時停車數據,降低浮動車為基礎的路況計算中后續計算的計算強度,提高計算的速度和精確性。
文檔編號G08G1/01GK102201166SQ20101015090
公開日2011年9月28日 申請日期2010年3月23日 優先權日2010年3月23日
發明者何君艦, 劉曉煒, 史敬威, 王少亞, 胡衛松, 饒佳 申請人:日電(中國)有限公司