中文字幕无码日韩视频无码三区

基于麥克風陣列的音頻采集方法和裝置的制造方法

文檔序號:10727068閱讀:786來源:國知局(ju)
基于麥克風陣列的音頻采集方法和裝置的制造方法
【專利摘要】本發明公開了一種基于麥克風陣列的音頻采集方法和裝置。該方法包括:通過第一麥克風陣列在全方向上搜索音頻,第二麥克風陣列在第一波束指向上采集第一目標音頻;判斷第一麥克風陣列搜索到的觸發音頻是否滿足預定切換觸發條件;若滿足將其作為第二目標音頻,并將其聲源定位信息發送給第二麥克風陣列;判斷發出第二目標音頻的第二聲源所在的第二位置與發出第一目標音頻的第一聲源所在的第一位置是否相同;若第二位置與第一位置不同,則控制第二麥克風陣列進行波束指向切換,以在第二波束指向上采集第二目標音頻。本發明解決了相關技術中由于單個麥克風陣列的音頻采集方向固定所導致的無法采集其他方向上的音頻的技術問題。
【專利說明】
基于麥克風陣列的音頻采集方法和裝置
技術領域
[0001] 本發明涉及計算機領域,具體而言,涉及一種基于麥克風陣列的音頻采集方法和 裝置。
【背景技術】
[0002] 目前,語音定位識別被廣泛應用,例如機器人通過語音定位說話人方位以實現與 說話人進行語音交互。相關技術通常采用由多個麥克風組成的麥克風陣列采集音頻并定位 聲源的位置,該麥克風陣列在定位聲源的位置后,固定音頻采集方向只采集該位置處聲源 所發出的音頻,以達到增強采集到的音頻信號的信噪比的目的。但是,由于單個麥克風陣列 的音頻采集方向固定,將會導致該麥克風陣列無法采集到其他方向上的音頻。而且當聲源 位置發生改變時,該麥克風陣列便不能采集改變后的位置處的聲源所發出的音頻,這種局 限性將會使得麥克風陣列不能滿足實際應用需求。
[0003] 針對上述的問題,目前尚未提出有效的解決方案。

【發明內容】

[0004] 本發明實施例提供了一種基于麥克風陣列的音頻采集方法和裝置,以至少解決相 關技術中由于單個麥克風陣列的音頻采集方向固定所導致的無法采集其他方向上的音頻 的技術問題。
[0005] 根據本發明實施例的一個方面,提供了一種基于麥克風陣列的音頻采集方法,包 括:通過第一麥克風陣列在全方向上搜索音頻,通過第二麥克風陣列在第一波束指向上采 集第一目標音頻;在第一麥克風陣列搜索到觸發音頻時,判斷觸發音頻是否滿足預定切換 觸發條件,其中,觸發音頻與第一目標音頻不同;將滿足預定切換觸發條件的觸發音頻作為 第二目標音頻,并將第二目標音頻的聲源定位信息發送給第二麥克風陣列,其中,聲源定位 信息用于指示發出第二目標音頻的第二聲源所在的第二位置;判斷第二聲源所在的第二位 置與第一聲源所在的第一位置是否相同,其中,第一聲源為第二麥克風陣列在第一波束指 向上采集的第一目標音頻的聲源,第一位置為第一聲源所在的位置;以及在判斷出第二位 置與第一位置不同時,控制第二麥克風陣列進行波束指向切換,以在第二波束指向上采集 第二目標音頻。
[0006] 根據本發明實施例的另一方面,還提供了一種基于麥克風陣列的音頻采集裝置, 包括:第一麥克風陣列,用于在全方向上搜索音頻;第二麥克風陣列,用于在第一波束指向 上采集第一目標音頻;控制器,分別與第一麥克風陣列和第二麥克風陣列連接,用于判斷第 一麥克風陣列搜索到的觸發音頻是否滿足預定切換觸發條件,其中,觸發音頻與第一目標 音頻不同;將滿足預定切換觸發條件的觸發音頻作為第二目標音頻,并將第二目標音頻的 聲源定位信息發送給第二麥克風陣列,其中,聲源定位信息用于指示發出第二目標音頻的 第二聲源所在的第二位置;判斷第二聲源所在的第二位置與第一聲源所在的第一位置是否 相同,其中,第一聲源為第二麥克風陣列在第一波束指向上采集的第一目標音頻的聲源,第 一位置為第一聲源所在的位置;在判斷出第二位置與第一位置不同時,控制第二麥克風陣 列進行波束指向切換,以在第二波束指向上采集第二目標音頻。
[0007] 根據本發明實施例的另一方面,還提供了一種基于麥克風陣列的音頻采集裝置, 包括:搜索單元,用于通過第一麥克風陣列在全方向上搜索音頻,通過第二麥克風陣列在第 一波束指向上采集第一目標音頻;第一判斷單元,用于在第一麥克風陣列搜索到觸發音頻 時,判斷觸發音頻是否滿足預定切換觸發條件,其中,觸發音頻與第一目標音頻不同;發送 單元,用于將滿足預定切換觸發條件的觸發音頻作為第二目標音頻,并將第二目標音頻的 聲源定位信息發送給第二麥克風陣列,其中,聲源定位信息用于指示發出第二目標音頻的 第二聲源所在的第二位置;第二判斷單元,用于判斷第二聲源所在的第二位置與第一聲源 所在的第一位置是否相同,其中,第一聲源為第二麥克風陣列在第一波束指向上采集的第 一目標音頻的聲源,第一位置為第一聲源所在的位置;以及控制單元,用于在判斷出第二位 置與第一位置不同時,控制第二麥克風陣列進行波束指向切換,以在第二波束指向上采集 第二目標音頻。
[0008] 在本發明實施例中,通過第一麥克風陣列在全方向上搜索音頻,第二麥克風陣列 在第一波束指向上采集第一目標音頻;在第一麥克風陣列搜索到的觸發音頻時,判斷其是 否滿足預定切換觸發條件;若滿足將其作為第二目標音頻,并將其聲源定位信息發送給第 二麥克風陣列;然后判斷發出第二目標音頻的第二聲源所在的第二位置與發出第一目標音 頻的第一聲源所在的第一位置是否相同;若不同則控制第二麥克風陣列進行波束指向切 換,以在第二波束指向上采集第二目標音頻,以達到自由切換波束指向以采集不同方向上 的音頻的目的,進而解決了相關技術中由于單個麥克風陣列的音頻采集方向固定所導致的 無法采集其他方向上的音頻的技術問題,實現了在不同方向上均能增強采集到的音頻信號 的信噪比的技術效果。
【附圖說明】
[0009] 此處所說明的附圖用來提供對本發明的進一步理解,構成本申請的一部分,本發 明的示意性實施例及其說明用于解釋本發明,并不構成對本發明的不當限定。在附圖中: [0010]圖1是根據本發明實施例的基于麥克風陣列的音頻采集方法的硬件環境的示意 圖;
[0011] 圖2是根據本發明實施例的一種可選的基于麥克風陣列的音頻采集方法的流程 圖;
[0012] 圖3是根據本發明實施例的基于麥克風陣列的音頻采集裝置的示意圖;
[0013] 圖4是根據本發明優選實施例的多麥克風陣列定位識別系統的示意圖;
[0014] 圖5是根據本發明優選實施例的波束指向說話人1的示意圖;
[0015] 圖6是根據本發明優選實施例的波束指向說話人2的示意圖;
[0016] 圖7是根據本發明實施例的一種可選的基于麥克風陣列的音頻采集裝置的示意 圖;
[0017] 圖8是根據本發明實施例的另一種可選的基于麥克風陣列的音頻采集裝置的示意 圖;
[0018] 圖9是根據本發明實施例的另一種可選的基于麥克風陣列的音頻采集裝置的示意 圖;
[0019] 圖10是根據本發明實施例的另一種可選的基于麥克風陣列的音頻采集裝置的示 意圖;
[0020] 圖11是根據本發明實施例的另一種可選的基于麥克風陣列的音頻采集裝置的示 意圖;以及
[0021 ]圖12是根據本發明實施例的一種終端的結構框圖。
【具體實施方式】
[0022]為了使本技術領域的人員更好地理解本發明方案,下面將結合本發明實施例中的 附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是 本發明一部分的實施例,而不是全部的實施例。基于本發明中的實施例,本領域普通技術人 員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都應當屬于本發明保護的范 圍。
[0023]需要說明的是,本發明的說明書和權利要求書及上述附圖中的術語"第一"、"第 二"等是用于區別類似的對象,而不必用于描述特定的順序或先后次序。應該理解這樣使用 的數據在適當情況下可以互換,以便這里描述的本發明的實施例能夠以除了在這里圖示或 描述的那些以外的順序實施。此外,術語"包括"和"具有"以及他們的任何變形,意圖在于覆 蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統、產品或設備不必限于 清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或對于這些過程、方法、產品 或設備固有的其它步驟或單元。
[0024] 首先,在對本發明實施例進行描述的過程中出現的部分名詞或者術語適用于如下 解釋:
[0025] 麥克風陣列:是由多個麥克風組成的音頻前端采集系統、并以這些麥克風對音頻 進行采集,獲取來源方向,形成波束指向,達到增強音頻信號的信噪比的目的。
[0026] 多麥克風陣列:由多個組麥克風陣列組成的系統,可以用來完成多個音頻的定位 和波束指向的切換。
[0027] 波束指向:麥克風陣列只采集特定方向的音頻,抑制其他方向的音頻的行為。
[0028] 實施例1
[0029] 根據本發明實施例,提供了一種基于麥克風陣列的音頻采集方法的方法實施例。
[0030] 可選地,在本實施例中,上述基于麥克風陣列的音頻采集方法可以應用于如圖1所 示的由服務器102和終端104所構成的硬件環境中。如圖1所示,服務器102通過網絡與終端 104進行連接,上述網絡包括但不限于:廣域網、城域網或局域網,終端104并不限定于PC、手 機、平板電腦等。本發明實施例的基于麥克風陣列的音頻采集方法可以由服務器102來執 行,也可以由終端104來執行,還可以是由服務器102和終端104共同執行。其中,終端104執 行本發明實施例的基于麥克風陣列的音頻采集方法也可以是由安裝在其上的客戶端來執 行。
[0031] 圖2是根據本發明實施例的一種可選的基于麥克風陣列的音頻采集方法的流程 圖,如圖2所示,該方法可以包括以下步驟:
[0032]步驟S202,通過第一麥克風陣列在全方向上搜索音頻,通過第二麥克風陣列在第 一波束指向上采集第一目標音頻;
[0033]步驟S204,在第一麥克風陣列搜索到觸發音頻時,判斷觸發音頻是否滿足預定切 換觸發條件,其中,觸發音頻與第一目標音頻不同;
[0034]步驟S206,將滿足預定切換觸發條件的觸發音頻作為第二目標音頻,并將第二目 標音頻的聲源定位信息發送給第二麥克風陣列,其中,聲源定位信息用于指示發出第二目 標音頻的第二聲源所在的第二位置;
[0035]步驟S208,判斷第二聲源所在的第二位置與第一聲源所在的第一位置是否相同, 其中,第一聲源為第二麥克風陣列在第一波束指向上采集的第一目標音頻的聲源,第一位 置為第一聲源所在的位置;
[0036]步驟S210,在判斷出第二位置與第一位置不同時,控制第二麥克風陣列進行波束 指向切換,以在第二波束指向上采集第二目標音頻。
[0037] 通過上述步驟S202至步驟S210,通過第一麥克風陣列在全方向上搜索音頻,第二 麥克風陣列在第一波束指向上采集第一目標音頻;在第一麥克風陣列搜索到的觸發音頻 時,判斷其是否滿足預定切換觸發條件;若滿足將其作為第二目標音頻,并將其聲源定位信 息發送給第二麥克風陣列;然后判斷發出第二目標音頻的第二聲源所在的第二位置與發出 第一目標音頻的第一聲源所在的第一位置是否相同;若不同則控制第二麥克風陣列進行波 束指向切換,以在第二波束指向上采集第二目標音頻,以達到自由切換波束指向以采集不 同方向上的音頻的目的,進而解決了相關技術中由于單個麥克風陣列的音頻采集方向固定 所導致的無法采集其他方向上的音頻的技術問題,實現了在不同方向上均能增強采集到的 音頻信號的信噪比的技術效果。
[0038] 此處首先需要說明的是,上述步驟可以由控制器執行,本發明實施例對控制器的 類型不做具體限定,例如,控制器可以是可編程控制器等。上述步驟可以用于指示本發明實 施例的基于麥克風陣列的音頻采集方法的一個執行過程,在實際應用中,可以一直重復執 行上述過程,即在第二麥克風陣列在某一個波束指向上采集目標音頻時,第一麥克風陣列 可以在全方向上搜索音頻,待第一麥克風陣列搜索到的音頻滿足預定切換觸發條件時,可 以控制第二麥克風陣列進行波束指向切換,在另一個波束指向上采集目標音頻。
[0039] 在步驟S202提供的技術方案中,第一麥克風陣列可以為由多個麥克風組成的系 統,其中,本發明實施例對多個麥克風的個數和排列順序不做具體限定,例如,第一麥克風 陣列中的多個麥克風可以水平排序,也可以垂直排列,還可以隨機排序等。第一麥克風陣列 可以在全方向上搜索音頻,需要說明的是,此處的全方向可以為水平方向上的360度,也可 以為垂直方向上的360度。第一麥克風陣列在全方向上搜索到的音頻可以是一個,也可以是 多個。在第一麥克風陣列搜索到的音頻為多個時,每個音頻的來源方向可以不相同。此處需 要說明的是,本發明實施例以第一麥克風陣列搜索到的音頻包括多個音頻為例進行說明, 因為在實際應用場景中,聲音嘈雜,這樣能夠使得本發明更加符合實際應用需求。
[0040] 可選地,第一麥克風陣列在全方向上搜索到音頻后,可以保存搜索到的音頻,以便 于后續對該音頻進行解析。需要說明的是,第一麥克風陣列對搜索到的音頻的解析過程可 以包括但并不限于對音頻信號進行去噪處理、信號采樣、信號頻譜分析等。該實施例通過對 搜素到的音頻進行上述處理能夠提高第一麥克風陣列搜索到的音頻的信號質量,進而能夠 提高根據音頻的解析結果確定的音頻的聲源的位置的準確度。
[0041]該實施例中第二麥克風陣列也可以為由多個麥克風組成的系統,其中,本發明實 施例對第二麥克風陣列中多個麥克風的個數和排列順序也不做具體限定,例如,第二麥克 風陣列中的多個麥克風可以水平排序,也可以垂直排列,還可以隨機排序等。第二麥克風陣 列可以用于在第一波束指向上采集第一目標音頻,以達到增強采集到的第一目標音頻信號 的信噪比的目的。此處需要說明的是,第一目標音頻可以為第一聲源發出的音頻,第一聲源 所在的位置可以為第一位置,第一波束指向可以用于指示指向第一位置。還需要說明的是, 第一目標音頻的確定方法、第一位置的定位方法以及控制第二麥克風陣列在第一波束指向 上采集第一目標音頻的方法與下述步驟S204至步驟S210中記載的技術方案相似,此處先不 做具體說明,詳細介紹可以參見以下步驟的具體說明。
[0042]需要說明的是,步驟S202是一個執行過程的初始狀態,第二麥克風陣列在第一波 束指向上采集第一目標音頻時,第一麥克風陣列可以在全方向搜索音頻,如果第一麥克風 陣列搜索到觸發音頻時,則可以執行步驟S204。
[0043]在步驟S204提供的技術方案中,觸發音頻可以為第一麥克風陣列搜索到的音頻, 其中,觸發音頻與第二麥克風陣列在第一波束指向上采集的第一目標音頻不同。在第二麥 克風陣列在第一波束指向上采集第一目標音頻時,第一麥克風陣列可以在全方向上搜索音 頻,如果第一麥克風陣列搜索到上述觸發音頻時,第一麥克風陣列可以對搜索到的觸發音 頻進行解析,解析過程可以包括但并不限于去噪處理、信號采樣、信號頻譜分析等。該實施 例中的控制器可以根據第一麥克風陣列對觸發音頻的解析結果,判斷觸發音頻是否滿足預 定切換觸發條件,其中,預定切換觸發條件可以根據實際需求設定或調整,本發明實施例對 其不做具體限定。例如,預定切換觸發條件可以為觸發音頻的音量大于預定音頻、觸發音頻 的音調大于預定音調或者觸發音頻的識別信息中包括預定指示信息,例如預定詞語等,上 述只列舉了部分預定切換觸發條件,本發明實施例還可以根據實際需求設定預定切換觸發 條件為其他條件,此處不再一一舉例說明。
[0044] 作為一種可選的實施例,步驟S204在第一麥克風陣列搜索到觸發音頻時,控制器 判斷觸發音頻是否滿足預定切換觸發條件包括以下任意一個或多個步驟:
[0045] 步驟S2042,判斷從觸發音頻中識別出的信息是否包括預定詞語。
[0046] 需要說明的是,上述步驟中的預定詞語可以根據實際需求進行設定或他調整,例 如預定詞語可以是"你好"、"執行"、"開機"等。該實施例可以對觸發音頻進行解析從中識別 出相關信息,判斷從觸發音頻中識別出的信息中是否包括預定詞語,若包括則可以確定該 觸發音頻滿足預定切換觸發條件。
[0047]步驟S2044,判斷觸發音頻的音量是否滿足第一條件。
[0048]需要說明的是,對觸發音頻進行解析可以包括解析觸發音頻的音量,也即觸發音 頻信號的強度的大小,觸發音頻信號的強度越大說明音量越大,觸發音頻信號的強度越小 說明音量越小。該實施例可選地可以對觸發音頻進行解析,確定觸發音頻的音量,并判斷觸 發音頻的音量是否滿足第一條件,其中,第一條件可以根據實際需求設定或調整,第一條件 可以是音量大于預定音量,例如,音量大于10分貝。該實施例如果判斷出觸發音頻的音頻大 于預定音量時,則可以確定該觸發音頻滿足預定切換觸發條件。
[0049 ]步驟S2046,判斷觸發音頻的音調是否滿足第二條件。
[0050]需要說明的是,對觸發音頻進行解析還可以包括解析觸發音頻的音調,并判斷該 觸發音頻的音調是否滿足第二條件,其中,第二條件可以根據實際需求設定或調整,第二條 件可以是音調高于預定音調。該實施例在判斷出觸發音頻的音調高于預定音調時,則可以 確定該觸發音頻滿足預定切換觸發條件。
[0051] 還需要說明的是,如果第一麥克風陣列搜索到的觸發音頻滿足上述步驟中的任意 一個或者幾個,則可以確定第一麥克風陣列搜索到的觸發音頻滿足預定切換觸發條件。上 述步驟所列舉的判斷條件只是本發明的可選實施例,本發明還可以設置其他判斷條件判斷 觸發音頻是否滿足預定切換觸發條件,此處不再一一舉例說明。該實施例通過設置不同的 判斷條件判斷觸發音頻是否滿足預定切換觸發條件,能夠達到依據實際應用中的不同需求 進行相應判斷的目的,進而提高了判斷觸發音頻是否滿足預定切換觸發條件的準確度。
[0052] 在步驟S206提供的技術方案中,該實施例中的控制器在判斷出第一麥克風陣列搜 索到的觸發音頻滿足預定切換觸發條件時,可以將該觸發音頻作為第二目標音頻,并獲取 該第二目標音頻的聲源定位信息。此處需要說明的是,第二目標音頻的聲源定位信息可以 用于指示發出第二目標音頻的第二聲源所在的第二位置,其中,第二聲源可以為發出第二 目標音頻的聲源,第二位置可以為第二聲源所在的位置。可選地,該實施例在確定第二目標 音頻之后,可以對第二目標音頻進行解析,其解析過程可以包括但并不現限于信號去噪處 理、信號采樣、信號頻譜分析等,以增加第二目標音頻的信號質量。
[0053]作為一種可選的實施例,步驟S206將第二目標音頻的聲源定位信息發送給第二麥 克風陣列可以包括以下步驟:
[0054]步驟S2062,根據第二目標音頻到達第一麥克風陣列中每個麥克風的時間定位第 二位置;
[0055]步驟S2064,將第二位置發送給第二麥克風陣列。
[0056] 在上述步驟S2062提供的技術方案中,該實施例可以記錄第二目標音頻到達第一 麥克風陣列中每個麥克風的時間,并根據第二目標音頻到達第一麥克風陣列中每個麥克風 的時間定位第二位置。需要說明的是,本發明實施例對第一麥克風陣列中的麥克風的個數 和設置位置不做具體限定,此處假設第一麥克風陣列包括四個麥克風,分別為:第一麥克風 皿1,坐標為((1/2,0,0)、第二麥克風12,坐標為(0,(1/2,0)、第三麥克風13,坐標為(-(1/2,0, 〇)、第四麥克風14,坐標為(0,-(1/2,0),需要說明的是,上述麥克風的坐標為空間坐標系下 的坐標,其中,控制器可以根據第二目標音頻到達第一麥克風陣列中每個麥克風的時間,可 以利用以下方程定位第二位置:
[0057] (x-d/2) 2+y2+z2 = π2
[0058] x2+(y_d/2)2+z2 = (ri+cbi)2
[0059] (x+d/2)2+y2+z2 = (ri+d3i)2
[0060] x2+(y+d/2)2+z2 = (ri+cki)2
[0061] 其中,第二聲源的坐標為(x,y,z),坐標(x,y,z)可以用于指示第二位置,ri為第二 聲源到第一麥克風Ml的距離,du為第二聲源到第i麥克風Mi的距離與第二聲源到第一麥克 風Ml的距離的差,其中,duzTuXcju為第二聲源到達第i麥克風Mi的時間與第二聲源到 達第一麥克風Ml的時間的差,c為第二聲源在空氣中的傳播速度,其中,i = 2、3、4。
[0062] 通過上述方程組可以求解得到第二聲源的坐標(x,y,z),該坐標(x,y,z)可以用于 指示第二位置。需要說明的是,上述只列舉了第一麥克風陣列包括四個麥克風的情況,在實 際應用中,第一麥克風陣列還可以包括五個、十個或其他個數的麥克風,針對其他情況第二 位置的定位方法與上述方法類似,此處不再一一進行具體說明。還需要說明的是,上述定位 第二位置的方法只是本發明的一種可選實施例,本發明還可以通過其他方法定位第二位 置,此處不再一一舉例說明。
[0063] 在上述步驟S2064提供的技術方案中,控制器可以分別與第一麥克風陣列和第二 麥克風陣列通信連接,該通信連接可以為有線通信連接,也可以為無線通信連接,利用控制 器與第一麥克風陣列之間的通信連接控制器可以獲取第一麥克風陣列搜索到的觸發音頻, 利用控制器與第二麥克風陣列之間的通信連接控制器可以將根據第二目標音頻到達第一 麥克風陣列中每個麥克風的時間定位得到的第二位置發送給第二麥克風陣列,以供第二麥 克風陣列進行波束指向切換,此處需要說明的是,第二麥克風陣列可以自由切換波束指向, 在不同波束指向上采集目標音頻。該實施例中第二麥克風陣列進行波束指向切換的依據可 以為第二目標音頻的聲源定位信息,也即第二位置。該實施例中第二麥克風陣列根據接收 到的聲源定位信息可以進行波束指向的切換,以實現在其他波束指向上采集目標音頻,進 而達到在其他波束指向上增強采集到的目標音頻信號的信噪比的目的。
[0064] 在步驟S208提供的技術方案中,該實施例中的控制器在獲取到聲源定位信息,并 從中確定第二聲源所在的第二位置之后,可以判斷第二聲源所在的第二位置與第一聲源所 在的第一位置是否相同,其中,第一聲源可以為發出第二麥克風陣列在第一波束指向上采 集的第一目標音頻的聲源,第二位置可以為第二聲源所在的位置。該實施例中的控制器通 過判斷第二位置是否與第一位置相同,根據判斷結果可以控制第二麥克風陣列是否進行波 束指向切換。如果判斷出第二位置與第一位置相同,則說明第二麥克風陣列可以無需進行 波束指向切換,便可以在原有的第一波束指向上采集第二目標音頻;如果判斷出第二位置 與第一位置不同,則說明第二麥克風陣列需要進行波束指向切換,以實現采集第二位置處 第二聲源所發出的第二目標音頻。此處需要說明的是,當控制器判斷出第二位置與第一位 置相同時,有可能是第二聲源與第一聲源相同,第二聲源發出的第二目標音頻與第一聲源 發出的第一目標音頻也相同,或者,第二聲源與第一聲源相同,第二聲源發出的第二目標音 頻與第一聲源發出的第一目標音頻不同,或者,第二聲源與第一聲源不同,第二聲源發出的 第二目標音頻與第一聲源發出的第一目標音頻也不同。
[0065] 在步驟S210提供的技術方案中,當控制器判斷出第二位置與第一位置不同時,控 制器可以控制第二麥克風陣列進行波束指向的切換,將第一波數指向切換為第二波束指 向,使得第二麥克風陣列在第二波束指向上采集第二目標音頻,其中,第二波束指向可以指 向第二位置,第二目標音頻可以為第二位置處的第二聲源發出的音頻。需要說明的是,該實 施例通過控制第二麥克風陣列進行波束指向切換,能夠達到自由切換波束指向,進而采集 不同方向上的目標音頻,并對不同方向形成波束指向,進而增強不同方向上采集到的音頻 信號的信噪比。此處需要說明的是,波束指向可以指第二麥克風陣列只采集某一個方向上 的音頻,抑制其他方向的音頻的行為。
[0066] 作為一種可選的實施例,步驟S210在判斷出第二位置與第一位置不同時,控制第 二麥克風陣列進行波束指向切換,以在第二波束指向上采集第二目標音頻可以包括以下步 驟:
[0067] 步驟S2102,將第二麥克風陣列中的每個麥克風的音頻采集角度指向第二位置,形 成第二波數指向;
[0068] 步驟S2104,控制第二麥克風陣列中的每個麥克風在第二波束指向上采集第二目 標首頻。
[0069] 在上述步驟中,控制器在獲取到聲源定位信息之后,也即確定了第二位置之后,該 控制器可以控制第二麥克風陣列中的每個麥克風的音頻采集角度均指向第二位置,以實現 第二麥克風陣列形成第二波束指向,其中,第二波束指向可以用于指示指向第二位置。此處 需要說明的是,第二麥克風陣列中的每個麥克風形成第二波束指向時,每個麥克風的音頻 采集角度的偏轉角度可以不同,偏轉角度可以由每個麥克風在第二麥克風陣列中的設置位 置確定。在形成第二波束指向之后,第二麥克風陣列中的每個麥克風均可以在第二波束指 向上采集第二目標音頻,以實現增強采集到的第二目標音頻的信噪比的效果。
[0070] 該實施例通過控制第二麥克風陣列中的每個麥克風的音頻采集角度指向第二位 置,以形成第二波束指向,能夠達到提高在第二波束指向上采集到的第二目標音頻的信噪 比,提高第二目標音頻的信號質量的效果。
[0071] 針對本發明上述實施例,此處需要說明以下幾點:本發明實施例中的"第一"和"第 二"并不限定具體的順序,只是名稱上的區分。步驟S202至步驟S210描述了本發明實施例的 基于麥克風陣列的音頻采集方法的一個執行過程,在實際應用中,步驟S202至步驟S210所 示的執行過程可以重復執行,即每當第一麥克風陣列搜索到觸發音頻,且觸發音頻滿足預 定切換觸發條件時,均可以通過獲取觸發音頻的聲源定位信息,并將其發送給第二麥克風 陣列以使得第二麥克風陣列進行波束指向切換,在另一波束指向上采集目標音頻,進而解 決了相關技術中由于單個麥克風陣列的音頻采集方向固定所導致的無法采集其他方向上 的音頻的技術問題,實現了在不同方向上均能增強采集到的音頻信號的信噪比的技術效 果。
[0072] 作為一種可選的實施例,在步驟S208控制第二麥克風陣列進行波束指向切換,以 在第二波束指向上采集第二目標音頻之后,該實施例的音頻采集方法還可以包括以下步 驟:
[0073]步驟S212,對第二麥克風陣列在第二波束指向上采集到的第二目標音頻進行語音 識別,得到音頻識別結果;
[0074]步驟S214,輸出音頻識別結果。
[0075] 在上述步驟中,該實施例在利用第二麥克風陣列在第二波束指向上采集到第二目 標音頻之后,可以對采集到的第二目標音頻進行語音識別,并將音頻識別結果輸出顯示。需 要說明的是,本發明實施例對第二麥克風陣列采集到的第二目標音頻的語音識別過程不做 具體限定,對音頻識別結果的輸出顯示方式也不做具體限定。該實施例通過對第二麥克風 陣列采集到的第二目標音頻進行語音識別,并輸出顯示音頻識別結果,能夠便于用于直觀 清楚地查看,有效地提高了用戶的使用體驗。
[0076] 實施例2
[0077] 根據本發明實施例,還提供了一種基于麥克風陣列的音頻采集裝置。需要說明的 是,該實施例的基于麥克風陣列的音頻采集裝置可以用于實施本發明實施例1中的基于麥 克風陣列的首頻米集方法。
[0078] 圖3是根據本發明實施例的基于麥克風陣列的音頻采集裝置的示意圖,如圖3所 示,該裝置可以包括:第一麥克風陣列10、第二麥克風陣列20以及控制器30,具體地:
[0079] 第一麥克風陣列10,可以用于在全方向上搜索音頻。
[0080] 需要說明的是,第一麥克風陣列10可以為由多個麥克風組成的系統,其中,本發明 實施例對多個麥克風的個數和排列順序不做具體限定,例如,第一麥克風陣列10中的多個 麥克風可以水平排序,也可以垂直排列,還可以隨機排序等。第一麥克風陣列10可以在全方 向上搜索音頻,需要說明的是,此處的全方向可以為水平方向上的360度,也可以為垂直方 向上的360度。第一麥克風陣列10在全方向上搜索到的音頻可以是一個,也可以是多個。在 第一麥克風陣列10搜索到的音頻為多個時,每個音頻的來源方向可以不相同。
[0081] 可選地,第一麥克風陣列10在全方向上搜索到音頻后,可以保存搜索到的音頻,以 便于后續對該音頻進行解析。需要說明的是,第一麥克風陣列10對搜索到的音頻的解析過 程可以包括但并不限于對音頻信號進行去噪處理、信號采樣、信號頻譜分析等。該實施例通 過對搜素到的音頻進行上述處理能夠提高第一麥克風陣列10搜索到的音頻的信號質量,進 而能夠提高根據音頻的解析結果確定的音頻的聲源的位置的準確度。
[0082]第二麥克風陣列20,可以用于在第一波束指向上采集第一目標音頻。
[0083]需要說明的是,第二麥克風陣列20也可以為由多個麥克風組成的系統,其中,本發 明實施例對第二麥克風陣列20中多個麥克風的個數和排列順序也不做具體限定,例如,第 二麥克風陣列20中的多個麥克風可以水平排序,也可以垂直排列,還可以隨機排序等。第二 麥克風陣列20可以用于在第一波束指向上采集第一目標音頻,以達到增強采集到的第一目 標音頻信號的信噪比的目的。此處需要說明的是,第一目標音頻可以為第一聲源發出的音 頻,第一聲源所在的位置可以為第一位置,第一波束指向可以用于指示指向第一位置。 [0084]控制器30,可以分別與第一麥克風陣列10和第二麥克風陣列20連接,其中,該連接 可以是通信連接,例如,有線連接或者無線連接。此處需要說明的是,控制器30可以用于執 行本發明實施例1中的基于麥克風陣列的音頻采集中的所有步驟。利用控制器30與第一麥 克風陣列10之間的通信連接控制器30可以獲取第一麥克風陣列10搜索到的觸發音頻,并判 斷該觸發音頻是否滿足預定切換觸發條件,其中,觸發音頻與第一目標音頻不同;將滿足預 定切換觸發條件的觸發音頻作為第二目標音頻,并利用控制器30與第二麥克風陣列20之間 的通信連接將第二目標音頻的聲源定位信息發送給第二麥克風陣列20,其中,聲源定位信 息用于指示發出第二目標音頻的第二聲源所在的第二位置;判斷第二聲源所在的第二位置 與第一聲源所在的第一位置是否相同,其中,第一聲源為第二麥克風陣列20在第一波束指 向上采集的第一目標音頻的聲源,第一位置為第一聲源所在的位置;在判斷出第二位置與 第一位置不同時,控制第二麥克風陣列20進行波束指向切換,以在第二波束指向上采集第 二目標音頻。
[0085]需要說明的是,觸發音頻可以為第一麥克風陣列10搜索到的音頻,其中,觸發音頻 與第二麥克風陣列20在第一波束指向上采集的第一目標音頻不同。在第二麥克風陣列20在 第一波束指向上采集第一目標音頻時,第一麥克風陣列10可以在全方向上搜索音頻,如果 第一麥克風陣列10搜索到上述觸發音頻時,第一麥克風陣列10可以對搜索到的觸發音頻進 行解析,解析過程可以包括但并不限于去噪處理、信號采樣、信號頻譜分析等。該實施例中 的控制器30可以根據第一麥克風陣列10對觸發音頻的解析結果,判斷觸發音頻是否滿足預 定切換觸發條件,其中,預定切換觸發條件可以根據實際需求設定或調整,本發明實施例對 其不做具體限定。例如,預定切換觸發條件可以為觸發音頻的音量大于預定音頻、觸發音頻 的音調大于預定音調或者觸發音頻的識別信息中包括預定指示信息,例如預定詞語等,上 述只列舉了部分預定切換觸發條件,本發明實施例還可以根據實際需求設定預定切換觸發 條件為其他條件,此處不再一一舉例說明。
[0086] 作為一種可選的實施例,在第一麥克風陣列10搜索到觸發音頻時,控制器判斷觸 發音頻是否滿足預定切換觸發條件包括:
[0087] 判斷從觸發音頻中識別出的信息是否包括預定詞語。
[0088] 需要說明的是,上述步驟中的預定詞語可以根據實際需求進行設定或他調整,例 如預定詞語可以是"你好"、"執行"、"開機"等。該實施例可以對觸發音頻進行解析從中識別 出相關信息,判斷從觸發音頻中識別出的信息中是否包括預定詞語,若包括則可以確定該 觸發音頻滿足預定切換觸發條件。
[0089]判斷觸發音頻的音量是否滿足第一條件。
[0090] 需要說明的是,對觸發音頻進行解析可以包括解析觸發音頻的音量,也即觸發音 頻信號的強度的大小,觸發音頻信號的強度越大說明音量越大,觸發音頻信號的強度越小 說明音量越小。該實施例可選地可以對觸發音頻進行解析,確定觸發音頻的音量,并判斷觸 發音頻的音量是否滿足第一條件,其中,第一條件可以根據實際需求設定或調整,第一條件 可以是音量大于預定音量,例如,音量大于10分貝。該實施例如果判斷出觸發音頻的音頻大 于預定音量時,則可以確定該觸發音頻滿足預定切換觸發條件。
[0091] 判斷觸發音頻的音調是否滿足第二條件。
[0092] 需要說明的是,對觸發音頻進行解析還可以包括解析觸發音頻的音調,并判斷該 觸發音頻的音調是否滿足第二條件,其中,第二條件可以根據實際需求設定或調整,第二條 件可以是音調高于預定音調。該實施例在判斷出觸發音頻的音調高于預定音調時,則可以 確定該觸發音頻滿足預定切換觸發條件。
[0093] 還需要說明的是,如果第一麥克風陣列10搜索到的觸發音頻滿足上述步驟中的任 意一個或者幾個,則可以確定第一麥克風陣列10搜索到的觸發音頻滿足預定切換觸發條 件。上述步驟所列舉的判斷條件只是本發明的可選實施例,本發明還可以設置其他判斷條 件判斷觸發音頻是否滿足預定切換觸發條件,此處不再一一舉例說明。該實施例通過設置 不同的判斷條件判斷觸發音頻是否滿足預定切換觸發條件,能夠達到依據實際應用中的不 同需求進行相應判斷的目的,進而提高了判斷觸發音頻是否滿足預定切換觸發條件的準確 度。
[0094] 控制器在判斷出第一麥克風陣列10搜索到的觸發音頻滿足預定切換觸發條件時, 可以將該觸發音頻作為第二目標音頻,并獲取該第二目標音頻的聲源定位信息。此處需要 說明的是,第二目標音頻的聲源定位信息可以用于指示發出第二目標音頻的第二聲源所在 的第二位置,其中,第二聲源可以為發出第二目標音頻的聲源,第二位置可以為第二聲源所 在的位置。可選地,該實施例在確定第二目標音頻之后,可以對第二目標音頻進行解析,其 解析過程可以包括但并不現限于信號去噪處理、信號采樣、信號頻譜分析等,以增加第二目 標音頻的信號質量。
[0095]作為一種可選的實施例,該實施例中的控制器30可以包括第一處理單元和傳輸接 口,其中,第一處理單元可以用于執行本發明實施例1中的步驟S2062,即第一處理單元可以 用于根據第二目標音頻到達第一麥克風陣列10中每個麥克風的時間定位第二位置;傳輸接 口可以用于執行本發明實施例1中的步驟S2064,即傳輸接口可以用于將第二位置發送給第 二麥克風陣列20。
[0096] 需要說明的是,該實施例可以記錄第二目標音頻到達第一麥克風陣列10中每個麥 克風的時間,并根據第二目標音頻到達第一麥克風陣列10中每個麥克風的時間定位第二位 置。需要說明的是,本發明實施例對第一麥克風陣列10中的麥克風的個數和設置位置不做 具體限定,此處假設第一麥克風陣列10包括四個麥克風,分別為:第一麥克風Ml,坐標為(d/ 2,0,0)、第二麥克風12,坐標為(0,(1/2,0)、第三麥克風13,坐標為(-(1/2,0,0)、第四麥克風 M4,坐標為(0,-(1/2,0),需要說明的是,上述麥克風的坐標為空間坐標系下的坐標,其中,第 一處理單元可以根據第二目標音頻到達第一麥克風陣列10中每個麥克風的時間,可以利用 以下方程定位第二位置:
[0097] (x-d/2) 2+y2+z2 = π2
[0098] x2+(y_d/2)2+z2 = (ri+cbi)2
[0099] (x+d/2)2+y2+z2 = (ri+d3i)2
[0100] x2+(y+d/2)2+z2 = (ri+cki)2
[0101] 其中,第二聲源的坐標為(x,y,z),坐標(x,y,z)可以用于指示第二位置,ri為第二 聲源到第一麥克風Ml的距離,du為第二聲源到第i麥克風Mi的距離與第二聲源到第一麥克 風Ml的距離的差,其中,duzTuXcju為第二聲源到達第i麥克風Mi的時間與第二聲源到 達第一麥克風Ml的時間的差,c為第二聲源在空氣中的傳播速度,其中,i = 2、3、4。
[0102] 通過上述方程組可以求解得到第二聲源的坐標(x,y,z),該坐標(x,y,z)可以用于 指示第二位置。需要說明的是,上述只列舉了第一麥克風陣列10包括四個麥克風的情況,在 實際應用中,第一麥克風陣列10還可以包括五個、十個或其他個數的麥克風,針對其他情況 第二位置的定位方法與上述方法類似,此處不再一一進行具體說明。還需要說明的是,上述 定位第二位置的方法只是本發明的一種可選實施例,本發明還可以通過其他方法定位第二 位置,此處不再一一舉例說明。
[0103] 控制器30在將根據第二目標音頻到達第一麥克風陣列10中每個麥克風的時間定 位得到的第二位置發送給第二麥克風陣列20之后,第二麥克風陣列20可以根據第二位置進 行波束指向切換,此處需要說明的是,第二麥克風陣列20可以自由切換波束指向,在不同波 束指向上采集目標音頻。該實施例中第二麥克風陣列20進行波束指向切換的依據可以為第 二目標音頻的聲源定位信息,也即第二位置。該實施例中第二麥克風陣列20根據接收到的 聲源定位信息可以進行波束指向的切換,以實現在其他波束指向上采集目標音頻,進而達 到在其他波束指向上增強采集到的目標音頻信號的信噪比的目的。
[0104] 還需要說明的是,控制器30在獲取到聲源定位信息,并從中確定第二聲源所在的 第二位置之后,可以判斷第二聲源所在的第二位置與第一聲源所在的第一位置是否相同, 其中,第一聲源可以為發出第二麥克風陣列20在第一波束指向上采集的第一目標音頻的聲 源,第二位置可以為第二聲源所在的位置。該實施例中的控制器30通過判斷第二位置是否 與第一位置相同,根據判斷結果可以控制第二麥克風陣列20是否進行波束指向切換。如果 判斷出第二位置與第一位置相同,則說明第二麥克風陣列20可以無需進行波束指向切換, 便可以在原有的第一波束指向上采集第二目標音頻;如果判斷出第二位置與第一位置不 同,則說明第二麥克風陣列20需要進行波束指向切換,以實現采集第二位置處第二聲源所 發出的第二目標音頻。此處需要說明的是,當控制器30判斷出第二位置與第一位置相同時, 有可能是第二聲源與第一聲源相同,第二聲源發出的第二目標音頻與第一聲源發出的第一 目標音頻也相同,或者,第二聲源與第一聲源相同,第二聲源發出的第二目標音頻與第一聲 源發出的第一目標音頻不同,或者,第二聲源與第一聲源不同,第二聲源發出的第二目標音 頻與第一聲源發出的第一目標音頻也不同。
[0105] 當控制器30判斷出第二位置與第一位置不同時,可以控制第二麥克風陣列20進行 波束指向的切換,將第一波數指向切換為第二波束指向,使得第二麥克風陣列20在第二波 束指向上采集第二目標音頻,其中,第二波束指向可以指向第二位置,第二目標音頻可以為 第二位置處的第二聲源發出的音頻。需要說明的是,該實施例通過控制第二麥克風陣列20 進行波束指向切換,能夠達到自由切換波束指向,進而采集不同方向上的目標音頻,并對不 同方向形成波束指向,進而增強不同方向上采集到的音頻信號的信噪比。此處需要說明的 是,波束指向可以指第二麥克風陣列20只采集某一個方向上的音頻,抑制其他方向的音頻 的行為。
[0106] 作為一種可選的實施例,該實施例中的控制器30還可以包括第二處理單元,其中, 第二處理單元可以與第一處理單元相同,也可以與第一處理單元不同,此處不做具體限定。 第二處理單元可以用于執行本發明實施例1中的步驟S2102至步驟S2104,即第二處理單元 可以用于將第二麥克風陣列20中的每個麥克風的音頻采集角度指向第二位置,形成第二波 數指向;控制第二麥克風陣列20中的每個麥克風在第二波束指向上采集第二目標音頻。
[0107] 需要說明的是,第二處理單元可以控制第二麥克風陣列20中的每個麥克風的音頻 采集角度均指向第二位置,以實現第二麥克風陣列20形成第二波束指向,其中,第二波束指 向可以用于指示指向第二位置。此處需要說明的是,第二麥克風陣列20中的每個麥克風形 成第二波束指向時,每個麥克風的音頻采集角度的偏轉角度可以不同,偏轉角度可以由每 個麥克風在第二麥克風陣列20中的設置位置確定。在形成第二波束指向之后,第二麥克風 陣列20中的每個麥克風均可以在第二波束指向上采集第二目標音頻,以實現增強采集到的 第二目標音頻的信噪比的效果。
[0108] 該實施例通過控制第二麥克風陣列20中的每個麥克風的音頻采集角度指向第二 位置,以形成第二波束指向,能夠達到提高在第二波束指向上采集到的第二目標音頻的信 噪比,提高第二目標音頻的信號質量的效果。
[0109] 作為一種可選的實施例,該實施例的基于麥克風陣列的音頻采集裝置還可以包括 語音識別單元和輸出接口,其中,語音識別單元可以用于執行本發明實施例1中的步驟 S212,用于在控制第二麥克風陣列進行波束指向切換,以在第二波束指向上采集第二目標 音頻之后,對第二麥克風陣列在第二波束指向上采集到的第二目標音頻進行語音識別,得 到音頻識別結果;輸出接口可以用于執行本發明實施例1中的步驟S214,用于輸出音頻識別 結果。
[0110]需要說明的是,在利用第二麥克風陣列20在第二波束指向上采集到第二目標音頻 之后,可以利用語音識別單元對采集到的第二目標音頻進行語音識別,并利用輸出接口將 音頻識別結果輸出顯示。需要說明的是,本發明實施例對第二麥克風陣列20采集到的第二 目標音頻的語音識別過程不做具體限定,對音頻識別結果的輸出顯示方式也不做具體限 定。該實施例通過對第二麥克風陣列20采集到的第二目標音頻進行語音識別,并輸出顯示 音頻識別結果,能夠便于用于直觀清楚地查看,有效地提高了用戶的使用體驗。
[0111] 本發明還提供了一種優選實施例,該優選實施例提供了一種多麥克風陣列定位識 別系統,該系統中多個麥克風陣列能夠兼顧增強采集特定方向聲音和切換不同方位說話 人,同時加入喚醒詞識別,可以有效地避免誤切換,保證用戶良好的使用體驗。需要說明的 是,該優選實施例可以應用于機器人,尤其適用于人機交互應用場景中。該優選實施例還可 以應用于其他領域,此處不做具體限定。
[0112] 圖4是根據本發明優選實施例的多麥克風陣列定位識別系統的示意圖,如圖4所 示,該系統可以包括麥克風陣列1、喚醒詞識別裝置以及麥克風陣列2,具體地,麥克風陣列1 可以采集平面360度范圍內的聲音,無方向指向,當麥克風陣列1采集到聲音時,可以將采集 到的聲音輸送至喚醒詞識別裝置中進行識別,其中,喚醒詞識別裝置中存儲有預先設置的 喚醒詞,其中,喚醒詞可以為本發明上述實施例中的預定詞語。當喚醒詞識別裝置識別出該 聲音中包括預先設置的喚醒詞時,可以對該聲音進行解析以獲取聲源定位信息,并將獲取 到的方向角發送給麥克風陣列2,其中,此處的方向角可以理解為本發明上述實施例中的第 二位置。麥克風陣列2可以根據接收到的方向角進行波束指向的定向增強,并把在該方向角 所指示的方向上采集到的聲音輸入至云端語音識別和對話系統中,以完成人機對話的過 程。此處需要說明的是,波束指向是指假定信號方向為Θ,無關方向為Φ,波束指向就是求取 最優的參數W,使得輸入信號X序列,經過變換后得到Y序列,即y (k) =WHx(k)是希望的信號。 具體方法就是最小化,目標函數(Rx為輸入信號的相關函數),限定 卜]求得,其中d(0,co) = [l e_2⑷... βΗ{φ,ω)\ L0 _
[0113] 例如,當麥克風陣列1發現說話人1說出喚醒詞后,麥克風陣列2可以對說話人1形 成波束指向,如圖5所示,在麥克風陣列2形成波束指向后,說話人1的聲音得到增強,不再波 束指向范圍內的噪音都被屏蔽,說話人2不再波束指向范圍內,故說話人2的聲音無法采集 到。需要說明的是,圖5中所示的多麥克風陣列包括麥克風陣列1和麥克風陣列2。在麥克風 陣列2波束指向說話人1的時候,麥克風陣列1仍在360度范圍內采集聲音,當麥克風陣列1發 現說話人2說出喚醒詞后,麥克風陣列2可以進行波束切換,切換至說話人2,說話人2的聲音 得到增強,如圖6所示。
[0114] 本發明中的切換流程采用了多麥克風陣列喚醒詞切換的方案,使得在說話人方向 的聲音得到增強,同時在和機器人對話過程中能自由的切換不同方位的說話人,也保證正 常對話過程不會由于其他方向的無關聲音打斷。
[0115]需要說明的是,對于前述的各方法實施例,為了簡單描述,故將其都表述為一系列 的動作組合,但是本領域技術人員應該知悉,本發明并不受所描述的動作順序的限制,因為 依據本發明,某些步驟可以采用其他順序或者同時進行。其次,本領域技術人員也應該知 悉,說明書中所描述的實施例均屬于優選實施例,所涉及的動作和模塊并不一定是本發明 所必須的。
[0116]通過以上的實施方式的描述,本領域的技術人員可以清楚地了解到根據上述實施 例的方法可借助軟件加必需的通用硬件平臺的方式來實現,當然也可以通過硬件,但很多 情況下前者是更佳的實施方式。基于這樣的理解,本發明的技術方案本質上或者說對現有 技術做出貢獻的部分可以以軟件產品的形式體現出來,該計算機軟件產品存儲在一個存儲 介質(如ROM/RAM、磁碟、光盤)中,包括若干指令用以使得一臺終端設備(可以是手機,計算 機,服務器,或者網絡設備等)執行本發明各個實施例所述的方法。
[0117] 實施例3
[0118] 根據本發明實施例,還提供了一種用于實施上述基于麥克風陣列的音頻采集方法 的基于麥克風陣列的音頻采集裝置。此處需要說明的是,該實施例中所涉及到的所有單元 均可以設置在本發明實施例2中的控制器30中。圖7是根據本發明實施例的一種可選的基于 麥克風陣列的音頻采集裝置的示意圖,如圖7所示,該裝置可以包括:
[0119] 搜索單元22,用于通過第一麥克風陣列在全方向上搜索音頻,通過第二麥克風陣 列在第一波數指向上采集第一目標音頻;第一判斷單元24,用于在第一麥克風陣列搜索到 觸發音頻時,判斷觸發音頻是否滿足預定切換觸發條件,其中,觸發音頻與第一目標音頻不 同;發送單元26,用于將滿足預定切換觸發條件的觸發音頻作為第二目標音頻,并將第二目 標音頻的聲源定位信息發送給第二麥克風陣列,其中,聲源定位信息用于指示發出第二目 標音頻的第二聲源所在的第二位置;第二判斷單元28,用于判斷第二聲源所在的第二位置 與第一聲源所在的第一位置是否相同,其中,第一聲源為第二麥克風陣列在第一波數指向 上采集的第一目標音頻的聲源,第一位置為第一聲源所在的位置;以及控制單元210,用于 在判斷出第二位置與第一位置不同時,控制第二麥克風陣列進行波束指向切換,以在第二 波束指向上采集第二目標音頻。
[0120] 需要說明的是,該實施例中的搜索單元22可以用于執行本申請實施例1中的步驟 S202,該實施例中的第一判斷單元24可以用于執行本申請實施例1中的步驟S204,該實施例 中的發送單元26可以用于執行本申請實施例1中的步驟S206,該實施例中的第二判斷單元 28可以用于執行本申請實施例1中的步驟S208,該實施例中的控制單元210可以用于執行本 申請實施例1中的步驟S210。
[0121]此處需要說明的是,上述模塊與對應的步驟所實現的示例和應用場景相同,但不 限于上述實施例1所公開的內容。需要說明的是,上述模塊作為裝置的一部分可以運行在如 圖1所示的硬件環境中,可以通過軟件實現,也可以通過硬件實現。
[0122] 作為一種可選的實施例,如圖8所示,發送單元26可以包括:定位模塊262,用于根 據第二目標音頻到達第一麥克風陣列中每個麥克風的時間定位第二位置;發送模塊264,用 于將第二位置發送給第二麥克風陣列。
[0123] 需要說明的是,該實施例中的定位模塊262可以用于執行本申請實施例1中的步驟 S2062,該實施例中的發送模塊264可以用于執行本申請實施例1中的步驟S2064。
[0124] 此處需要說明的是,上述模塊與對應的步驟所實現的示例和應用場景相同,但不 限于上述實施例1所公開的內容。需要說明的是,上述模塊作為裝置的一部分可以運行在如 圖1所示的硬件環境中,可以通過軟件實現,也可以通過硬件實現。
[0125] 作為一種可選的實施例,第一麥克風陣列可以包括:第一麥克風Ml,坐標為(d/2, 〇,〇)、第二麥克風M2,坐標為(0,d/2,0)、第三麥克風M3,坐標為(_d/2,0,0)、第四麥克風M4, 坐標為(〇,_d/2,0),其中,定位模塊262可以用于利用以下方程定位第二位置:
[0126] (x-d/2)2+y2+z2 = π2
[0127] x2+(y_d/2)2+z2 = (ri+cbi)2
[0128] (x+d/2)2+y2+z2 = (ri+d3i)2
[0129] x2+(y+d/2)2+z2 = (ri+cki)2
[0130] 其中,第二聲源的坐標為(x,y,z),坐標(x,y,z)用于指示第二位置,ri為第二聲源 到第一麥克風Ml的距離,du為第二聲源到第i麥克風Mi的距離與第二聲源到第一麥克風Ml 的距離的差,其中,du = τη Xc,tu為第二聲源到達第i麥克風Mi的時間與第二聲源到達第 一麥克風Ml的時間的差,c為第二聲源在空氣中的傳播速度,其中,i = 2、3、4。
[0131] 作為一種可選的實施例,如圖9所示,控制單元210可以包括:指向模塊2102,用于 將第二麥克風陣列中的每個麥克風的音頻采集角度指向第二位置,形成第二波數指向;采 集模塊2104,用于控制第二麥克風陣列中的每個麥克風在第二波束指向上采集第二目標音 頻。
[0132] 需要說明的是,該實施例中的指向模塊2102可以用于執行本申請實施例1中的步 驟S2102,該實施例中的采集模塊2104可以用于執行本申請實施例1中的步驟S2104。
[0133] 此處需要說明的是,上述模塊與對應的步驟所實現的示例和應用場景相同,但不 限于上述實施例1所公開的內容。需要說明的是,上述模塊作為裝置的一部分可以運行在如 圖1所示的硬件環境中,可以通過軟件實現,也可以通過硬件實現。
[0134] 作為一種可選的實施例,如圖10所示,第一判斷單元24可以包括:第一判斷模塊 242,用于判斷從觸發音頻中識別出的信息是否包括預定詞語;或第二判斷模塊244,用于判 斷觸發音頻的音量是否滿足第一條件;或第三判斷模塊246,用于判斷觸發音頻的音調是否 滿足第二條件。
[0135] 需要說明的是,該實施例中的第一判斷模塊242可以用于執行本申請實施例1中的 步驟S2042,該實施例中的第二判斷模塊244可以用于執行本申請實施例1中的步驟S2044, 該實施例中的第三判斷模塊246可以用于執行本申請實施例1中的步驟S2046。
[0136] 此處需要說明的是,上述模塊與對應的步驟所實現的示例和應用場景相同,但不 限于上述實施例1所公開的內容。需要說明的是,上述模塊作為裝置的一部分可以運行在如 圖1所示的硬件環境中,可以通過軟件實現,也可以通過硬件實現。
[0137] 作為一種可選的實施例,如圖11所示,該實施例的音頻采集裝置還可以包括:識別 單元212,用于在控制第二麥克風陣列進行波束指向切換,以在第二波束指向上采集第二目 標音頻之后,對第二麥克風陣列在第二波束指向上采集到的第二目標音頻進行語音識別, 得到音頻識別結果;輸出單元214,用于輸出音頻識別結果。
[0138] 需要說明的是,該實施例中的識別單元212可以用于執行本申請實施例1中的步驟 S212,該實施例中的輸出單元214可以用于執行本申請實施例1中的步驟S214。
[0139] 此處需要說明的是,上述模塊與對應的步驟所實現的示例和應用場景相同,但不 限于上述實施例1所公開的內容。需要說明的是,上述模塊作為裝置的一部分可以運行在如 圖1所示的硬件環境中,可以通過軟件實現,也可以通過硬件實現。
[0140] 通過上述模塊,達到了在確定音頻的來源方向并形成波束指向后,仍可以繼續切 換至其他來源方向并形成波束指向的目的,進而解決了相關技術中由于單個麥克風陣列的 音頻采集方向固定所導致的無法采集其他方向上的音頻的技術問題,實現了在不同方向上 均能增強采集到的音頻信號的信噪比的技術效果。
[0141] 實施例4
[0142] 根據本發明實施例,還提供了一種用于實施上述基于麥克風陣列的音頻采集方法 的服務器或終端。
[0143] 圖12是根據本發明實施例的一種終端的結構框圖,如圖12所示,該終端可以包括: 一個或多個(圖中僅示出一個)處理器201、存儲器203、以及傳輸裝置205(如上述實施例中 的發送裝置),如圖12所示,該終端還可以包括輸入輸出設備207。
[0144] 其中,存儲器203可用于存儲軟件程序以及模塊,如本發明實施例中的基于麥克風 陣列的音頻采集方法和裝置對應的程序指令/模塊,處理器201通過運行存儲在存儲器203 內的軟件程序以及模塊,從而執行各種功能應用以及數據處理,即實現上述的基于麥克風 陣列的音頻采集方法。存儲器203可包括高速隨機存儲器,還可以包括非易失性存儲器,如 一個或者多個磁性存儲裝置、閃存、或者其他非易失性固態存儲器。在一些實例中,存儲器 203可進一步包括相對于處理器201遠程設置的存儲器,這些遠程存儲器可以通過網絡連接 至終端。上述網絡的實例包括但不限于互聯網、企業內部網、局域網、移動通信網及其組合。
[0145] 上述的傳輸裝置205用于經由一個網絡接收或者發送數據,還可以用于處理器與 存儲器之間的數據傳輸。上述的網絡具體實例可包括有線網絡及無線網絡。在一個實例中, 傳輸裝置205包括一個網絡適配器(Network Interface Controller,NIC),其可通過網線 與其他網絡設備與路由器相連從而可與互聯網或局域網進行通訊。在一個實例中,傳輸裝 置205為射頻(Radio Frequency,RF)模塊,其用于通過無線方式與互聯網進行通訊。
[0146] 其中,具體地,存儲器203用于存儲應用程序。
[0147] 處理器201可以通過傳輸裝置205調用存儲器203存儲的應用程序,以執行下述步 驟:通過第一麥克風陣列在全方向上搜索音頻,通過第二麥克風陣列在第一波數指向上采 集第一目標音頻;在第一麥克風陣列搜索到觸發音頻時,判斷觸發音頻是否滿足預定切換 觸發條件,其中,觸發音頻與第一目標音頻不同;將滿足預定切換觸發條件的觸發音頻作為 第二目標音頻,并將第二目標音頻的聲源定位信息發送給第二麥克風陣列,其中,聲源定位 信息用于指示發出第二目標音頻的第二聲源所在的第二位置;判斷第二聲源所在的第二位 置與第一聲源所在的第一位置是否相同,其中,第一聲源為第二麥克風陣列在第一波數指 向上采集的第一目標音頻的聲源,第一位置為第一聲源所在的位置;以及在判斷出第二位 置與第一位置不同時,控制第二麥克風陣列進行波束指向切換,以在第二波束指向上采集 第二目標音頻。
[0148] 處理器201還用于執行下述步驟:根據第二目標音頻到達第一麥克風陣列中每個 麥克風的時間定位第二位置;將第二位置發送給第二麥克風陣列。
[0149] 處理器201還用于執行下述步驟:第一麥克風陣列包括:第一麥克風Ml,坐標為(d/ 2,0,0)、第二麥克風12,坐標為(0,(1/2,0)、第三麥克風13,坐標為(-(1/2,0,0)、第四麥克風 M4,坐標為(0,-(1/2,0),其中,根據第二目標音頻到達第一麥克風陣列中每個麥克風的時間 (x-d / 2)2 + y2 + z1 = r{ x1 +(v-d/2)1 +z2 =(r, +dn)2 定位第二位置包括:利用以下方程定位第二位置3 2 ~ 其中,第二 (x + d/2) + y +z - (f\ + ) x~ + (v + ?/ / 2)" + z- = (/j + )~ 聲源的坐標為(x,y,z),坐標(x,y,z)用于指示第二位置,Γ1為第二聲源到第一麥克風Ml的 距離,du為第二聲源到第i麥克風Mi的距離與第二聲源到第一麥克風Ml的距離的差,其中, (1η = τηΧ(3,τη為第二聲源到達第i麥克風Mi的時間與第二聲源到達第一麥克風Ml的時間 的差,c為第二聲源在空氣中的傳播速度,其中,i = 2、3、4。
[0150]處理器201還用于執行下述步驟:將第二麥克風陣列中的每個麥克風的音頻采集 角度指向第二位置,形成第二波數指向;控制第二麥克風陣列中的每個麥克風在第二波束 指向上采集第二目標音頻。
[0151]處理器201還用于執行下述步驟:判斷從觸發音頻中識別出的信息是否包括預定 詞語;或判斷觸發音頻的音量是否滿足第一條件;或判斷觸發音頻的音調是否滿足第二條 件。
[0152]處理器201還用于執行下述步驟:在控制第二麥克風陣列進行波束指向切換,以在 第二波束指向上采集第二目標音頻之后,對第二麥克風陣列在第二波束指向上采集到的第 二目標音頻進行語音識別,得到音頻識別結果;輸出音頻識別結果。
[0153] 采用本發明實施例,提供了一種基于麥克風陣列的音頻采集的方案。通過第一麥 克風陣列在全方向上搜索音頻,第二麥克風陣列在第一波束指向上采集第一目標音頻;在 第一麥克風陣列搜索到的觸發音頻時,判斷其是否滿足預定切換觸發條件;若滿足將其作 為第二目標音頻,并將其聲源定位信息發送給第二麥克風陣列;然后判斷發出第二目標音 頻的第二聲源所在的第二位置與發出第一目標音頻的第一聲源所在的第一位置是否相同; 若不同則控制第二麥克風陣列進行波束指向切換,以在第二波束指向上采集第二目標音 頻,以達到自由切換波束指向以采集不同方向上的音頻的目的,進而解決了相關技術中由 于單個麥克風陣列的音頻采集方向固定所導致的無法采集其他方向上的音頻的技術問題, 實現了在不同方向上均能增強采集到的音頻信號的信噪比的技術效果。
[0154] 可選地,本實施例中的具體示例可以參考上述實施例1至實施例3中所描述的示 例,本實施例在此不再贅述。
[0155] 本領域普通技術人員可以理解,圖12所示的結構僅為示意,終端可以是智能手機 (如Android手機、iOS手機等)、平板電腦、掌上電腦以及移動互聯網設備(Mobile Internet Devices,MID)、PAD等終端設備。圖12其并不對上述電子裝置的結構造成限定。例如,終端還 可包括比圖12中所示更多或者更少的組件(如網絡接口、顯示裝置等),或者具有與圖12所 示不同的配置。
[0156] 本領域普通技術人員可以理解上述實施例的各種方法中的全部或部分步驟是可 以通過程序來指令終端設備相關的硬件來完成,該程序可以存儲于一計算機可讀存儲介質 中,存儲介質可以包括:閃存盤、只讀存儲器(Read-Only Memory,ROM)、隨機存取器(Random Access Memory,RAM)、磁盤或光盤等。
[0157] 實施例5
[0158] 本發明的實施例還提供了一種存儲介質。可選地,在本實施例中,上述存儲介質可 以用于執行基于麥克風陣列的音頻采集方法的程序代碼。
[0159] 可選地,在本實施例中,上述存儲介質可以位于上述實施例所示的網絡中的多個 網絡設備中的至少一個網絡設備上。
[0160] 可選地,在本實施例中,存儲介質被設置為存儲用于執行以下步驟的程序代碼:
[0161] SI,通過第一麥克風陣列在全方向上搜索音頻,通過第二麥克風陣列在第一波數 指向上采集第一目標音頻;
[0162] S2,在第一麥克風陣列搜索到觸發音頻時,判斷觸發音頻是否滿足預定切換觸發 條件,其中,觸發音頻與第一目標音頻不同;
[0163] S3,將滿足預定切換觸發條件的觸發音頻作為第二目標音頻,并將第二目標音頻 的聲源定位信息發送給第二麥克風陣列,其中,聲源定位信息用于指示發出第二目標音頻 的第二聲源所在的第二位置;
[0164] S4,判斷第二聲源所在的第二位置與第一聲源所在的第一位置是否相同,其中,第 一聲源為第二麥克風陣列在第一波數指向上采集的第一目標音頻的聲源,第一位置為第一 聲源所在的位置;
[0165] S5,在判斷出第二位置與第一位置不同時,控制第二麥克風陣列進行波束指向切 換,以在第二波束指向上采集第二目標音頻。
[0166] 可選地,存儲介質還被設置為存儲用于執行以下步驟的程序代碼:根據第二目標 音頻到達第一麥克風陣列中每個麥克風的時間定位第二位置;將第二位置發送給第二麥克 風陣列。
[0167] 可選地,存儲介質還被設置為存儲用于執行以下步驟的程序代碼:第一麥克風陣 列包括:第一麥克風Ml,坐標為(d/2,0,0)、第二麥克風M2,坐標為(0,d/2,0)、第三麥克風 M3,坐標為(_d/2,0,0)、第四麥克風M4,坐標為(0,-d/2,0),其中,根據第二目標音頻到達第 一麥克風陣列中每個麥克風的時間定位第二位置包括:利用以下方程定位第二位置: (x - d / 2.)2 + v2 + z'2 := r,2 X:2 +(y-d /2)2 +z2 = (/? + ??,)2 0 + 3/?2 + κ + # - 〇 +?/ f其中,第二聲源的坐標為(x,y,z),坐標(x, y,z)用于指示第 x~ + (v -\- d ? 2)" + ζ" - (rj + y 二位置,n為第二聲源到第一麥克風Ml的距離,du為第二聲源到第i麥克風Mi的距離與第二 聲源到第一麥克風Ml的距離的差,其中,dii = τη Xc,τη為第二聲源到達第i麥克風Mi的時 間與第二聲源到達第一麥克風Ml的時間的差,c為第二聲源在空氣中的傳播速度,其中,i = 2、3、4〇
[0168] 可選地,存儲介質還被設置為存儲用于執行以下步驟的程序代碼:將第二麥克風 陣列中的每個麥克風的音頻采集角度指向第二位置,形成第二波數指向;控制第二麥克風 陣列中的每個麥克風在第二波束指向上采集第二目標音頻。
[0169] 可選地,存儲介質還被設置為存儲用于執行以下步驟的程序代碼:判斷從觸發音 頻中識別出的信息是否包括預定詞語;或判斷觸發音頻的音量是否滿足第一條件;或判斷 觸發音頻的音調是否滿足第二條件。
[0170] 可選地,存儲介質還被設置為存儲用于執行以下步驟的程序代碼:在控制第二麥 克風陣列進行波束指向切換,以在第二波束指向上采集第二目標音頻之后,對第二麥克風 陣列在第二波束指向上采集到的第二目標音頻進行語音識別,得到音頻識別結果;輸出音 頻識別結果。
[0171] 可選地,本實施例中的具體示例可以參考上述實施例1至實施例3中所描述的示 例,本實施例在此不再贅述。
[0172] 可選地,在本實施例中,上述存儲介質可以包括但不限于:U盤、只讀存儲器(R0M, Read-Only Memory)、隨機存取存儲器(RAM,Random Access Memory)、移動硬盤、磁碟或者 光盤等各種可以存儲程序代碼的介質。
[0173] 上述本發明實施例序號僅僅為了描述,不代表實施例的優劣。
[0174] 上述實施例中的集成的單元如果以軟件功能單元的形式實現并作為獨立的產品 銷售或使用時,可以存儲在上述計算機可讀取的存儲介質中。基于這樣的理解,本發明的技 術方案本質上或者說對現有技術做出貢獻的部分或者該技術方案的全部或部分可以以軟 件產品的形式體現出來,該計算機軟件產品存儲在存儲介質中,包括若干指令用以使得一 臺或多臺計算機設備(可為個人計算機、服務器或者網絡設備等)執行本發明各個實施例所 述方法的全部或部分步驟。
[0175] 在本發明的上述實施例中,對各個實施例的描述都各有側重,某個實施例中沒有 詳述的部分,可以參見其他實施例的相關描述。
[0176] 在本申請所提供的幾個實施例中,應該理解到,所揭露的客戶端,可通過其它的方 式實現。其中,以上所描述的裝置實施例僅僅是示意性的,例如所述單元的劃分,僅僅為一 種邏輯功能劃分,實際實現時可以有另外的劃分方式,例如多個單元或組件可以結合或者 可以集成到另一個系統,或一些特征可以忽略,或不執行。另一點,所顯示或討論的相互之 間的耦合或直接耦合或通信連接可以是通過一些接口,單元或模塊的間接耦合或通信連 接,可以是電性或其它的形式。
[0177] 所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯 示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個 網絡單元上。可以根據實際的需要選擇其中的部分或者全部單元來實現本實施例方案的目 的。
[0178] 另外,在本發明各個實施例中的各功能單元可以集成在一個處理單元中,也可以 是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單 元既可以采用硬件的形式實現,也可以采用軟件功能單元的形式實現。
[0179]以上所述僅是本發明的優選實施方式,應當指出,對于本技術領域的普通技術人 員來說,在不脫離本發明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應 視為本發明的保護范圍。
【主權項】
1. 一種基于麥克風陣列的音頻采集方法,其特征在于,包括: 通過第一麥克風陣列在全方向上搜索音頻,通過第二麥克風陣列在第一波束指向上采 集弟一目標首頻; 在所述第一麥克風陣列搜索到觸發音頻時,判斷所述觸發音頻是否滿足預定切換觸發 條件,其中,所述觸發音頻與所述第一目標音頻不同; 將滿足所述預定切換觸發條件的觸發音頻作為第二目標音頻,并將所述第二目標音頻 的聲源定位信息發送給所述第二麥克風陣列,其中,所述聲源定位信息用于指示發出所述 第二目標音頻的第二聲源所在的第二位置; 判斷所述第二聲源所在的所述第二位置與第一聲源所在的第一位置是否相同,其中, 所述第一聲源為所述第二麥克風陣列在所述第一波束指向上采集的所述第一目標音頻的 聲源,所述第一位置為所述第一聲源所在的位置;以及 在判斷出所述第二位置與所述第一位置不同時,控制所述第二麥克風陣列進行波束指 向切換,以在第二波束指向上采集所述第二目標音頻。2. 根據權利要求1所述的方法,其特征在于,將所述第二目標音頻的聲源定位信息發送 給所述第二麥克風陣列包括: 根據所述第二目標音頻到達所述第一麥克風陣列中每個麥克風的時間定位所述第二 位置; 將所述第二位置發送給所述第二麥克風陣列。3. 根據權利要求2所述的方法,其特征在于,所述第一麥克風陣列包括:第一麥克風Ml, 坐標為(d/2,0,0)、第二麥克風M2,坐標為(0,d/2,0)、第三麥克風M3,坐標為(_d/2,0,0)、第 四麥克風M4,坐標為(0,-d/2,0),其中,根據所述第二目標音頻到達所述第一麥克風陣列中 每個麥克風的時間定位所述第二位置包括:利用以下方程定位所述第二位置: (x-d/2)2+y2+z2 = ri2 x2+(y-d/2)2+z2= (ri+d2i)2 (x+d/2)2+y2+z2= (ri+d3i)2 x2+(y+d/2)2+z2= (ri+cki)2 其中,所述第二聲源的坐標為(x,y,z),所述坐標(x,y,z)用于指示所述第二位置,^為 所述第二聲源到所述第一麥克風Ml的距離,du為所述第二聲源到第i麥克風Mi的距離與所 述第二聲源到所述第一麥克風Ml的距離的差,其中,為所述第二聲源到達第 i麥克風Mi的時間與所述第二聲源到達所述第一麥克風Ml的時間的差,c為所述第二聲源在 空氣中的傳播速度,其中,i = 2、3、4。4. 根據權利要求1所述的方法,其特征在于,在判斷出所述第二位置與所述第一位置不 同時,控制所述第二麥克風陣列進行波束指向切換,以在第二波束指向上采集所述第二目 標音頻包括: 將所述第二麥克風陣列中的每個麥克風的音頻采集角度指向所述第二位置,形成所述 第二波束指向; 控制所述第二麥克風陣列中的每個麥克風在所述第二波束指向上采集所述第二目標 音頻。5. 根據權利要求1至4中任一項所述的方法,其特征在于,在所述第一麥克風陣列搜索 到觸發音頻時,判斷所述觸發音頻是否滿足預定切換觸發條件包括: 判斷從所述觸發音頻中識別出的信息是否包括預定詞語;或 判斷所述觸發音頻的音量是否滿足第一條件;或 判斷所述觸發音頻的音調是否滿足第二條件。6. 根據權利要求1至4中任一項所述的方法,其特征在于,在控制所述第二麥克風陣列 進行波束指向切換,以在第二波束指向上采集所述第二目標音頻之后,所述方法還包括: 對所述第二麥克風陣列在所述第二波束指向上采集到的所述第二目標音頻進行語音 識別,得到音頻識別結果; 輸出所述音頻識別結果。7. -種基于麥克風陣列的音頻采集裝置,其特征在于,包括: 第一麥克風陣列,用于在全方向上搜索音頻; 第二麥克風陣列,用于在第一波束指向上采集第一目標音頻; 控制器,分別與所述第一麥克風陣列和所述第二麥克風陣列連接,用于判斷所述第一 麥克風陣列搜索到的觸發音頻是否滿足預定切換觸發條件,其中,所述觸發音頻與所述第 一目標音頻不同;將滿足所述預定切換觸發條件的觸發音頻作為第二目標音頻,并將所述 第二目標音頻的聲源定位信息發送給所述第二麥克風陣列,其中,所述聲源定位信息用于 指示發出所述第二目標音頻的第二聲源所在的第二位置;判斷所述第二聲源所在的所述第 二位置與第一聲源所在的第一位置是否相同,其中,所述第一聲源為所述第二麥克風陣列 在所述第一波束指向上采集的所述第一目標音頻的聲源,所述第一位置為所述第一聲源所 在的位置;在判斷出所述第二位置與所述第一位置不同時,控制所述第二麥克風陣列進行 波束指向切換,以在第二波束指向上采集所述第二目標音頻。8. 根據權利要求7所述的裝置,其特征在于,所述控制器包括: 第一處理單元,用于根據所述第二目標音頻到達所述第一麥克風陣列中每個麥克風的 時間定位所述第二位置; 傳輸接口,用于將所述第二位置發送給所述第二麥克風陣列。9. 根據權利要求8所述的裝置,其特征在于,所述第一麥克風陣列包括:第一麥克風Ml, 坐標為(d/2,0,0)、第二麥克風M2,坐標為(0,d/2,0)、第三麥克風M3,坐標為(_d/2,0,0)、第 四麥克風M4,坐標為(0,-(1/2,0),其中,所述第一處理單元用于利用以下方程定位所述第二 位置: (x-d/2)2+y2+z2 = ri2 x2+(y-d/2)2+z2= (ri+d2i)2 (x+d/2)2+y2+z2= (ri+d3i)2 x2+(y+d/2)2+z2= (ri+cki)2 其中,所述第二聲源的坐標為(x,y,z),所述坐標(x,y,z)用于指示所述第二位置,^為 所述第二聲源到所述第一麥克風Ml的距離,du為所述第二聲源到第i麥克風Mi的距離與所 述第二聲源到所述第一麥克風Ml的距離的差,其中,為所述第二聲源到達第 i麥克風Mi的時間與所述第二聲源到達所述第一麥克風Ml的時間的差,c為所述第二聲源在 空氣中的傳播速度,其中,i = 2、3、4。10. 根據權利要求7所述的裝置,其特征在于,所述控制器包括: 第二處理單元,用于將所述第二麥克風陣列中的每個麥克風的音頻采集角度指向所述 第二位置,形成所述第二波束指向;控制所述第二麥克風陣列中的每個麥克風在所述第二 波束指向上采集所述第二目標音頻。11. 根據權利要求7至10中任一項所述的裝置,其特征在于,所述控制器判斷所述觸發 音頻是否滿足預定切換觸發條件包括: 判斷從所述觸發音頻中識別出的信息是否包括預定詞語;或 判斷所述觸發音頻的音量是否滿足第一條件;或 判斷所述觸發音頻的音調是否滿足第二條件。12. 根據權利要求7至10中任一項所述的裝置,其特征在于,所述裝置還包括: 語音識別單元,用于在控制所述第二麥克風陣列進行波束指向切換,以在第二波束指 向上采集所述第二目標音頻之后,對所述第二麥克風陣列在所述第二波束指向上采集到的 所述第二目標音頻進行語音識別,得到音頻識別結果; 輸出接口,用于輸出所述音頻識別結果。13. -種基于麥克風陣列的音頻采集裝置,其特征在于,包括: 搜索單元,用于通過第一麥克風陣列在全方向上搜索音頻,通過第二麥克風陣列在第 一波束指向上采集第一目標音頻; 第一判斷單元,用于在所述第一麥克風陣列搜索到觸發音頻時,判斷所述觸發音頻是 否滿足預定切換觸發條件,其中,所述觸發音頻與所述第一目標音頻不同; 發送單元,用于將滿足所述預定切換觸發條件的觸發音頻作為第二目標音頻,并將所 述第二目標音頻的聲源定位信息發送給所述第二麥克風陣列,其中,所述聲源定位信息用 于指示發出所述第二目標音頻的第二聲源所在的第二位置; 第二判斷單元,用于判斷所述第二聲源所在的所述第二位置與第一聲源所在的第一位 置是否相同,其中,所述第一聲源為所述第二麥克風陣列在所述第一波束指向上采集的所 述第一目標音頻的聲源,所述第一位置為所述第一聲源所在的位置;以及 控制單元,用于在判斷出所述第二位置與所述第一位置不同時,控制所述第二麥克風 陣列進行波束指向切換,以在第二波束指向上采集所述第二目標音頻。14. 根據權利要求13所述的裝置,其特征在于,所述發送單元包括: 定位模塊,用于根據所述第二目標音頻到達所述第一麥克風陣列中每個麥克風的時間 定位所述第二位置; 發送模塊,用于將所述第二位置發送給所述第二麥克風陣列。15. 根據權利要求14所述的裝置,其特征在于,所述第一麥克風陣列包括:第一麥克風 皿1,坐標為((1/2,0,0)、第二麥克風12,坐標為(0,(1/2,0)、第三麥克風13,坐標為(-(1/2,0, 〇)、第四麥克風14,坐標為(0,-(1/2,0),其中,所述定位模塊用于利用以下方程定位所述第 二位置: (x-d/2)2+y2+z2 = ri2 x2+(y-d/2)2+z2= (ri+d2i)2 (x+d/2)2+y2+z2= (ri+d3i)2 x2+(y+d/2)2+z2= (ri+d4i)2 其中,所述第二聲源的坐標為U,y,z),所述坐標U,y,z)用于指示所述第二位置,n為 所述第二聲源到所述第一麥克風Ml的距離,du為所述第二聲源到第i麥克風Mi的距離與所 述第二聲源到所述第一麥克風Ml的距離的差,其中,為所述第二聲源到達第 i麥克風Mi的時間與所述第二聲源到達所述第一麥克風Ml的時間的差,c為所述第二聲源在 空氣中的傳播速度,其中,i = 2、3、4。16. 根據權利要求13所述的裝置,其特征在于,所述控制單元包括: 指向模塊,用于將所述第二麥克風陣列中的每個麥克風的音頻采集角度指向所述第二 位置,形成所述第二波束指向; 采集模塊,用于控制所述第二麥克風陣列中的每個麥克風在所述第二波束指向上采集 所述第二目標音頻。17. 根據權利要求13至16中任一項所述的裝置,其特征在于,所述第一判斷單元包括: 第一判斷模塊,用于判斷從所述觸發音頻中識別出的信息是否包括預定詞語;或 第二判斷模塊,用于判斷所述觸發音頻的音量是否滿足第一條件;或 第三判斷模塊,用于判斷所述觸發音頻的音調是否滿足第二條件。18. 根據權利要求13至16中任一項所述的裝置,其特征在于,所述裝置還包括: 識別單元,用于在控制所述第二麥克風陣列進行波束指向切換,以在第二波束指向上 采集所述第二目標音頻之后,對所述第二麥克風陣列在所述第二波束指向上采集到的所述 第二目標音頻進行語音識別,得到音頻識別結果; 輸出單元,用于輸出所述音頻識別結果。
【文檔編號】G10L21/0216GK106098075SQ201610643347
【公開日】2016年11月9日
【申請日】2016年8月8日 公開號201610643347.7, CN 106098075 A, CN 106098075A, CN 201610643347, CN-A-106098075, CN106098075 A, CN106098075A, CN201610643347, CN201610643347.7
【發明人】謝達東, 王爾玉, 馬建雄, 盧鯉, 劉海龍, 劉薦, 陳波
【申請人】騰訊科技(深圳)有限公司
網友詢問留言(yan) 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1