本發明(ming)涉及(ji)人(ren)工智能(neng)領域(yu),具(ju)體而(er)言,涉及(ji)一種語音意(yi)圖識別(bie)模型(xing)的決(jue)策邊界增強(qiang)方(fang)法及(ji)裝置。
背景技術:
1、在(zai)語(yu)音(yin)識別(bie)(bie)和自然語(yu)言處理領域,語(yu)音(yin)意圖(tu)(tu)識別(bie)(bie)模(mo)型(xing)廣(guang)泛應(ying)用于(yu)智能語(yu)音(yin)助手、自動客服(fu)、語(yu)音(yin)搜索等場景。然而(er),現有的(de)語(yu)音(yin)意圖(tu)(tu)識別(bie)(bie)模(mo)型(xing)在(zai)面對復雜、多變的(de)實際應(ying)用環境時,決(jue)策邊界不夠清(qing)晰,容易導致意圖(tu)(tu)識別(bie)(bie)錯誤,從而(er)影響(xiang)用戶體驗和系(xi)統(tong)的(de)可靠性。
2、語音意圖識別(bie)(bie)模(mo)型(xing)的(de)性能(neng)在(zai)很大(da)(da)程(cheng)度上依賴于模(mo)型(xing)的(de)決(jue)策邊界(jie),即模(mo)型(xing)在(zai)不同意圖類別(bie)(bie)之(zhi)間(jian)區分能(neng)力的(de)明(ming)確程(cheng)度。當前,常規的(de)訓(xun)練(lian)(lian)方法通(tong)常側重于最(zui)大(da)(da)化模(mo)型(xing)對訓(xun)練(lian)(lian)數據(ju)的(de)擬合能(neng)力,而忽略了模(mo)型(xing)對不同類別(bie)(bie)間(jian)差異的(de)敏感性,這導致(zhi)在(zai)訓(xun)練(lian)(lian)數據(ju)和真實應用數據(ju)存在(zai)差異時,模(mo)型(xing)的(de)識別(bie)(bie)性能(neng)下降(jiang)。
3、針對上述的問(wen)題(ti),目前尚未提(ti)出有(you)效的解決方案。
技術實現思路
1、本發明實(shi)施例提(ti)供(gong)了一種(zhong)語(yu)音意圖(tu)識(shi)別模(mo)型的(de)決策(ce)邊(bian)界(jie)增強方法及裝置,以至少解(jie)決語(yu)音意圖(tu)識(shi)別模(mo)型的(de)邊(bian)策(ce)邊(bian)界(jie)不清晰的(de)技術問題(ti)。
2、根據本發明實施例的(de)(de)(de)(de)(de)一個方面,提供了一種語音意(yi)(yi)圖識(shi)別(bie)模(mo)型的(de)(de)(de)(de)(de)決策邊界增強方法,包(bao)括(kuo):計算(suan)用(yong)于(yu)訓練(lian)語音意(yi)(yi)圖識(shi)別(bie)模(mo)型的(de)(de)(de)(de)(de)訓練(lian)數(shu)據中(zhong)的(de)(de)(de)(de)(de)語音識(shi)別(bie)文本和人(ren)工識(shi)別(bie)文本之間的(de)(de)(de)(de)(de)主成分差(cha)(cha)(cha)異,并基(ji)于(yu)所(suo)(suo)述(shu)(shu)(shu)主成分差(cha)(cha)(cha)異確(que)定(ding)(ding)差(cha)(cha)(cha)異度(du)權重系數(shu);基(ji)于(yu)所(suo)(suo)述(shu)(shu)(shu)差(cha)(cha)(cha)異度(du)權重系數(shu)來調整所(suo)(suo)述(shu)(shu)(shu)語音意(yi)(yi)圖識(shi)別(bie)模(mo)型的(de)(de)(de)(de)(de)損失函數(shu),以增強所(suo)(suo)述(shu)(shu)(shu)語音意(yi)(yi)圖識(shi)別(bie)模(mo)型的(de)(de)(de)(de)(de)決策邊界;其中(zhong),基(ji)于(yu)所(suo)(suo)述(shu)(shu)(shu)主成分差(cha)(cha)(cha)異確(que)定(ding)(ding)差(cha)(cha)(cha)異度(du)權重系數(shu)包(bao)括(kuo):確(que)定(ding)(ding)超參數(shu),其中(zhong),所(suo)(suo)述(shu)(shu)(shu)超參數(shu)用(yong)于(yu)控(kong)制所(suo)(suo)述(shu)(shu)(shu)主成分差(cha)(cha)(cha)異對(dui)所(suo)(suo)述(shu)(shu)(shu)損失函數(shu)的(de)(de)(de)(de)(de)權重的(de)(de)(de)(de)(de)影響程度(du);基(ji)于(yu)所(suo)(suo)述(shu)(shu)(shu)超參數(shu)和所(suo)(suo)述(shu)(shu)(shu)主成分差(cha)(cha)(cha)異,來確(que)定(ding)(ding)所(suo)(suo)述(shu)(shu)(shu)差(cha)(cha)(cha)異度(du)權重系數(shu)。
3、根(gen)據本發明實施例的(de)另一方面,還提供了一種語(yu)(yu)音(yin)意(yi)圖(tu)識(shi)(shi)(shi)別(bie)(bie)(bie)模(mo)(mo)型的(de)決策邊(bian)界(jie)增強(qiang)裝置,包括(kuo):計算模(mo)(mo)塊(kuai),被(bei)配置為計算用于(yu)(yu)訓練(lian)語(yu)(yu)音(yin)意(yi)圖(tu)識(shi)(shi)(shi)別(bie)(bie)(bie)模(mo)(mo)型的(de)訓練(lian)數(shu)據中的(de)語(yu)(yu)音(yin)識(shi)(shi)(shi)別(bie)(bie)(bie)文本和(he)人工識(shi)(shi)(shi)別(bie)(bie)(bie)文本之(zhi)間的(de)主(zhu)(zhu)成分(fen)(fen)差異(yi)(yi),并基(ji)于(yu)(yu)所(suo)(suo)述(shu)(shu)(shu)主(zhu)(zhu)成分(fen)(fen)差異(yi)(yi)確(que)定(ding)差異(yi)(yi)度(du)權(quan)重(zhong)系(xi)數(shu);增強(qiang)模(mo)(mo)塊(kuai),被(bei)配置為基(ji)于(yu)(yu)所(suo)(suo)述(shu)(shu)(shu)差異(yi)(yi)度(du)權(quan)重(zhong)系(xi)數(shu)來調整所(suo)(suo)述(shu)(shu)(shu)語(yu)(yu)音(yin)意(yi)圖(tu)識(shi)(shi)(shi)別(bie)(bie)(bie)模(mo)(mo)型的(de)損失函(han)數(shu),以增強(qiang)所(suo)(suo)述(shu)(shu)(shu)語(yu)(yu)音(yin)意(yi)圖(tu)識(shi)(shi)(shi)別(bie)(bie)(bie)模(mo)(mo)型的(de)決策邊(bian)界(jie);其中,基(ji)于(yu)(yu)所(suo)(suo)述(shu)(shu)(shu)主(zhu)(zhu)成分(fen)(fen)差異(yi)(yi)確(que)定(ding)差異(yi)(yi)度(du)權(quan)重(zhong)系(xi)數(shu)包括(kuo):確(que)定(ding)超(chao)參(can)數(shu),其中,所(suo)(suo)述(shu)(shu)(shu)超(chao)參(can)數(shu)用于(yu)(yu)控制所(suo)(suo)述(shu)(shu)(shu)主(zhu)(zhu)成分(fen)(fen)差異(yi)(yi)對所(suo)(suo)述(shu)(shu)(shu)損失函(han)數(shu)的(de)權(quan)重(zhong)的(de)影響程(cheng)度(du);基(ji)于(yu)(yu)所(suo)(suo)述(shu)(shu)(shu)超(chao)參(can)數(shu)和(he)所(suo)(suo)述(shu)(shu)(shu)主(zhu)(zhu)成分(fen)(fen)差異(yi)(yi),來確(que)定(ding)所(suo)(suo)述(shu)(shu)(shu)差異(yi)(yi)度(du)權(quan)重(zhong)系(xi)數(shu)。
4、在(zai)本(ben)發(fa)明(ming)實施例(li)中,計算(suan)用于訓(xun)練語(yu)(yu)音意(yi)(yi)圖識(shi)別模(mo)型的(de)(de)訓(xun)練數據中的(de)(de)語(yu)(yu)音識(shi)別文(wen)本(ben)和人工識(shi)別文(wen)本(ben)之間的(de)(de)主(zhu)(zhu)成分差異,并基于所述(shu)主(zhu)(zhu)成分差異確定差異度權重系數;基于所述(shu)差異度權重系數來調整所述(shu)語(yu)(yu)音意(yi)(yi)圖識(shi)別模(mo)型的(de)(de)損(sun)失函(han)數,以增強所述(shu)語(yu)(yu)音意(yi)(yi)圖識(shi)別模(mo)型的(de)(de)決(jue)策邊界(jie),從而(er)解(jie)決(jue)了語(yu)(yu)音意(yi)(yi)圖識(shi)別模(mo)型的(de)(de)邊策邊界(jie)不清晰(xi)技術問(wen)題(ti)。
1.一種語音意圖識別模型的決(jue)策邊界增強方法,其特(te)征在于,包括:
2.根據(ju)權利要求1所述的方法,其特(te)征在于(yu),確定超(chao)參數包括:
3.根(gen)據權利要求2所(suo)述(shu)(shu)的方法,其特征在于(yu),確定所(suo)述(shu)(shu)超參數采樣點與(yu)所(suo)述(shu)(shu)語音意圖識別模(mo)型之間關系的概(gai)率近似(si),包括:
4.根據權利要求3所述(shu)的方(fang)法,其特(te)征在于(yu),基于(yu)所述(shu)概率近似在所述(shu)超參數(shu)空間(jian)中選擇下一(yi)組采樣(yang)點作為所述(shu)超參數(shu)采樣(yang)點,包括(kuo):
5.根據(ju)權利要求1所(suo)(suo)述的方法,其特征在(zai)于,基(ji)于所(suo)(suo)述差異度權重(zhong)系數(shu)來調整所(suo)(suo)述語音意圖識別(bie)模型的損失(shi)函(han)數(shu),包括(kuo):
6.根(gen)據(ju)權利要求(qiu)1所述的方(fang)法,其特(te)征(zheng)在于,計算用于訓練語(yu)音意(yi)圖識(shi)別模型的訓練數(shu)據(ju)中(zhong)的語(yu)音識(shi)別文本和人工識(shi)別文本之(zhi)間的主(zhu)成分差異,包括:
7.一(yi)種語音(yin)意(yi)圖識(shi)別模(mo)型的決策(ce)邊界增強裝(zhuang)置,其(qi)特征在于,包(bao)括:
8.一種計算機(ji)可(ke)讀(du)存儲(chu)介(jie)質(zhi),其(qi)特征在于,所述計算機(ji)可(ke)讀(du)存儲(chu)介(jie)質(zhi)包(bao)括(kuo)存儲(chu)的程(cheng)序,其(qi)中,在所述程(cheng)序運行(xing)時控(kong)制所述計算機(ji)可(ke)讀(du)存儲(chu)介(jie)質(zhi)所在設備執行(xing)權利(li)要求1至6中任意一項所述的方法。
9.一種計算機設(she)備(bei),其特(te)征在于(yu),包括:存(cun)儲(chu)器(qi)和處理器(qi),
10.一(yi)種計(ji)(ji)算機(ji)(ji)程序產品,包(bao)括(kuo)計(ji)(ji)算機(ji)(ji)程序,其特征在于(yu),該計(ji)(ji)算機(ji)(ji)程序被(bei)處(chu)理(li)器執(zhi)行(xing)時(shi)實現權利要求1至6中任一(yi)項所述的(de)方法的(de)步驟。