中文字幕无码日韩视频无码三区

駕駛方法及系統的制作方法

文檔(dang)序號:9389080閱讀:476來源:國知(zhi)局(ju)
駕駛方法及系統的制作方法
【技術領域】
[0001] 本發明涉及車輛安全技術領域,特別涉及一種駕駛方法及系統。
【背景技術】
[0002] 隨著電子技術的快速發展,車輛等車輛已經成為生活中必不可少的交通工具。而 伴隨著車輛的普及,道路上的車輛越來越密集,行車安全也越來越重要。
[0003] 通常,駕駛員在駕駛車輛行駛的過程中,可能會發生一些諸如插車、障礙物阻擋等 突發事件,此時,駕駛員可以手動操作方向盤,油門,剎車等以避免車輛與障礙物發生碰撞, 但是由于在發生突發事件時,駕駛員通常處于緊張狀態,駕駛員對方向盤,油門、剎車等操 作的準確性較低。為此,相關技術提供了一種駕駛系統,該駕駛系統包括:環境感知模塊和 避撞控制模塊,避撞控制模塊中存儲有駕駛員根據駕駛車輛過程中的避撞經驗設置的環境 狀態量與決策動作的對應關系,其中,環境狀態量可以為障礙物的位置,環境感知模塊可以 在車輛的行駛環境中存在由障礙物引發的突發事件時獲取車輛當前的環境狀態量,避撞控 制模塊可以根據車輛當前的環境狀態量從環境狀態量與決策動作的對應關系中確定與車 輛當前的環境狀態量對應的目標決策動作,然后根據該目標決策動作控制車輛行駛,從而 避免車輛與障礙物發生碰撞。
[0004] 在實現本發明的過程中,發明人發現相關技術至少存在以下問題:
[0005] 相關技術中的駕駛系統是以駕駛員的避撞經驗為依據控制車輛行駛的,受駕駛員 經驗的限制,駕駛系統具有一定的局限性,且由于是以駕駛員的避撞經驗為依據控制車輛 行駛的,因此,駕駛系統的穩定性較低,靈活性較差。

【發明內容】

[0006] 為了解決相關技術中駕駛系統具有局限性,穩定性較低,靈活性較差的問題,本發 明提供一種駕駛方法及系統。所述技術方案如下:
[0007] 第一方面,提供一種駕駛系統,所述駕駛系統包括:環境感知模塊和避撞控制模 塊,
[0008] 所述環境感知模塊用于在車輛行駛過程中監測所述車輛的行駛環境;預測所述車 輛的行駛環境中是否會發生由障礙物引發的突發事件;在所述車輛的行駛環境中會發生由 障礙物引發的突發事件時,獲取所述障礙物的位置;
[0009] 所述避撞控制模塊用于根據所述障礙物的位置,采用機器學習算法確定目標決策 動作;根據所述目標決策動作控制所述車輛行駛。
[0010] 可選地,所述避撞控制模塊用于:
[0011] 從經驗存儲庫中確定與所述障礙物的位置對應的目標可執行動作,所述經驗存儲 庫中記錄了預先通過機器學習算法確定的障礙物的位置與可執行動作的對應關系,每個障 礙物的位置對應至少一個可執行動作,每個可執行動作包括決策動作和與所述決策動作 一一對應的增強信號,所述增強信號用于指示與所述增強信號一一對應的決策動作在執行 時的立即回報;
[0012] 計算所述目標可執行動作中的每個決策動作的未來無窮回報累加和;
[0013] 將所述未來無窮回報累加和最大的決策動作作為所述目標決策動作。
[0014] 可選地,所述避撞控制模塊用于獲取駕駛員的決策動作;
[0015] 所述環境感知模塊用于獲取執行所述駕駛員的決策動作之后所述障礙物的第一 位置;
[0016] 所述避撞控制模塊用于從經驗存儲庫中確定與所述障礙物的第一位置對應的目 標可執行動作,所述經驗存儲庫中記錄了預先通過機器學習算法確定的障礙物的位置與可 執行動作的對應關系,每個障礙物的位置對應至少一個可執行動作,每個可執行動作包括 決策動作和與所述決策動作一一對應的增強信號,所述增強信號用于指示與所述增強信號 一一對應的決策動作在執行時的立即回報;
[0017] 所述避撞控制模塊用于計算所述目標可執行動作中的每個決策動作的未來無窮 回報累加和;將所述未來無窮回報累加和最大的決策動作作為所述目標決策動作。
[0018] 可選地,所述避撞控制模塊用于:
[0019] 計算所述駕駛員的決策動作對應的未來n個狀態的增強信號,得到n個增強信號, 所述n為大于或者等于1的整數;
[0020] 判斷所述n個增強信號中是否存在符合預設條件的增強信號;
[0021] 在所述n個增強信號中存在符合預設條件的增強信號時,觸發所述環境感知模塊 獲取執行所述駕駛員的決策動作之后所述障礙物的第一位置;
[0022] 其中,在執行所述符合預設條件的增強信號對應的決策動作時,所述車輛與所述 車輛的行駛環境中的障礙物會發生碰撞。
[0023] 可選地,所述環境感知模塊用于:
[0024] 判斷所述車輛的行駛環境中是否存在障礙物;
[0025] 在所述車輛的行駛環境中存在障礙物時,判斷所述障礙物是否處于預設范圍內;
[0026] 在所述障礙物處于所述預設范圍時,確定所述車輛的行駛環境中會發生由所述障 礙物引發的突發事件。
[0027] 第二方面,提供一種駕駛方法,所述方法包括:
[0028] 在車輛行駛過程中監測所述車輛的行駛環境;
[0029] 預測所述車輛的行駛環境中是否會發生由障礙物引發的突發事件;
[0030] 若所述車輛的行駛環境中會發生由障礙物引發的突發事件,則獲取所述障礙物的 位置;
[0031] 根據所述障礙物的位置,采用機器學習算法確定目標決策動作;
[0032] 根據所述目標決策動作控制所述車輛行駛。
[0033] 可選地,所述根據所述障礙物的位置,采用機器學習算法確定目標決策動作,包 括:
[0034] 從經驗存儲庫中確定與所述障礙物的位置對應的目標可執行動作,所述經驗存儲 庫中記錄了預先通過機器學習算法確定的障礙物的位置與可執行動作的對應關系,每個障 礙物的位置對應至少一個可執行動作,每個可執行動作包括決策動作和與所述決策動作 一一對應的增強信號,所述增強信號用于指示與所述增強信號一一對應的決策動作在執行 時的立即回報;
[0035] 計算所述目標可執行動作中的每個決策動作的未來無窮回報累加和;
[0036] 將所述未來無窮回報累加和最大的決策動作作為所述目標決策動作。
[0037] 可選地,所述根據所述障礙物的位置,采用機器學習算法確定目標決策動作,包 括:
[0038] 獲取駕駛員的決策動作;
[0039] 獲取執行所述駕駛員的決策動作之后所述障礙物的第一位置;
[0040] 從經驗存儲庫中確定與所述障礙物的第一位置對應的目標可執行動作,所述經驗 存儲庫中記錄了預先通過機器學習算法確定的障礙物的位置與可執行動作的對應關系,每 個障礙物的位置對應至少一個可執行動作,每個可執行動作包括決策動作和與所述決策動 作一一對應的增強信號,所述增強信號用于指示與所述增強信號一一對應的決策動作在執 行時的立即回報;
[0041] 計算所述目標可執行動作中的每個決策動作的未來無窮回報累加和;
[0042] 將所述未來無窮回報累加和最大的決策動作作為所述目標決策動作。
[0043] 可選地,所述獲取執行所述駕駛員的決策動作之后所述障礙物的第一位置,包 括:
[0044] 計算所述駕駛員的決策動作對應的未來n個狀態的增強信號,得到n個增強信號, 所述n為大于或者等于1的整數;
[0045] 判斷所述n個增強信號中是否存在符合預設條件的增強信號;
[0046] 若所述n個增強信號中存在符合預設條件的增強信號,則獲取執行所述駕駛員的 決策動作之后所述障礙物的第一位置;
[0047] 其中,在執行所述符合預設條件的增強信號對應的決策動作時,所述車輛與所述 車輛的行駛環境中的障礙物會發生碰撞。
[0048] 可選地,所述預測所述車輛的行駛環境中是否會發生由障礙物引發的突發事件, 包括:
[0049] 判斷所述車輛的行駛環境中是否存在障礙物;
[0050] 若所述車輛的行駛環境中存在障礙物,則判斷所述障礙物是否處于預設范圍內;
[0051] 若所述障礙物處于所述預設范圍內,則確定所述車輛的行駛環境中會發生由所述 障礙物引發的突發事件。
[0052] 本發明提供的技術方案帶來的有益效果是:
[0053] 本發明實施例提供的駕駛方法及系統,駕駛系統包括:環境感知模塊和避撞控制 模塊,環境感知模塊用于在車輛行駛過程中監測車輛的行駛環境;預測車輛的行駛環境中 是否會發生由障礙物引發的突發事件;在車輛的行駛環境中會發生由障礙物引發的突發事 件時,獲取障礙物的位置;避撞控制模塊用于根據障礙物的位置,采用機器學習算法確定目 標決策動作;根據目標決策動作控制車輛行駛。由于本發明采用機器學習算法確定目標決 策動作,目標決策動作的確定不受駕駛員的經驗的限制,解決了相關技術中的駕駛系統具 有局限性,穩定性較低,靈活性較差的問題,達到了擴大駕駛系統的應用范圍,提高駕駛系 統的穩定性和靈活性的有益效果。
[0054] 應當理解的是,以上的一般描述和后文的細節描述僅是示例性的,并不能限制本 發明。
【附圖說明】
[0055] 為了更清楚地說明本發明實施例中的技術方案,下面將對實施例描述中所需要使 用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于 本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他 的附圖。
[0056] 圖1是本發明各個實施例提供的駕駛方法所涉及的一種實施環境的結構示意圖;
當前第1頁1 2 3 4 5 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1