本公開涉及(ji)自(zi)然語言(yan)處理(li),特別涉及(ji)一種(zhong)文本檢測方(fang)法及(ji)裝(zhuang)置、電子設備、可讀(du)介質。
背景技術:
1、自(zi)動語(yu)(yu)音(yin)識別(automatic?speech?recognition,asr)是(shi)一種將語(yu)(yu)音(yin)轉(zhuan)寫(xie)成文(wen)本的(de)技術。在通過(guo)asr模(mo)型(xing)(xing)對(dui)語(yu)(yu)音(yin)進行轉(zhuan)寫(xie)時,往(wang)往(wang)會出現語(yu)(yu)音(yin)轉(zhuan)寫(xie)錯誤(wu)。為提高(gao)asr模(mo)型(xing)(xing)的(de)轉(zhuan)寫(xie)質量(liang),需要(yao)對(dui)語(yu)(yu)音(yin)轉(zhuan)寫(xie)結(jie)果進行檢(jian)測,并基(ji)于檢(jian)測后的(de)語(yu)(yu)音(yin)轉(zhuan)寫(xie)結(jie)果對(dui)asr模(mo)型(xing)(xing)進行優化(hua)調(diao)整。然而,目前的(de)檢(jian)測方式對(dui)語(yu)(yu)音(yin)轉(zhuan)寫(xie)結(jie)果的(de)檢(jian)測準確率較低。
技術實現思路
1、本公開提供一(yi)種文本檢(jian)測(ce)方法及裝置、電子設備、可(ke)讀介質(zhi),可(ke)以提高(gao)語(yu)音轉寫結果檢(jian)測(ce)的(de)準確率。
2、第一(yi)方面,本(ben)公開提供(gong)了一(yi)種文本(ben)檢測方法,包括:
3、獲(huo)取語音轉(zhuan)寫(xie)結果,所述語音轉(zhuan)寫(xie)結果包(bao)含待檢測文(wen)本(ben)以及所述待檢測文(wen)本(ben)的識別概率;
4、對所述待檢測文本進行特(te)征提取,獲得所述待檢測文本的文本特(te)征;
5、根據所述待(dai)檢(jian)(jian)測(ce)文(wen)本的識別概率(lv)進行分數(shu)(shu)特(te)(te)征(zheng)提取,獲得所述待(dai)檢(jian)(jian)測(ce)文(wen)本的分數(shu)(shu)特(te)(te)征(zheng);
6、基于(yu)所述(shu)文本(ben)特(te)征和所述(shu)分數(shu)特(te)征確(que)(que)定所述(shu)語(yu)(yu)音(yin)轉寫結果(guo)的檢測分數(shu),所述(shu)檢測分數(shu)用于(yu)表征所述(shu)語(yu)(yu)音(yin)轉寫結果(guo)的準(zhun)確(que)(que)程度(du)。
7、第二(er)方面,本(ben)公開提供了一種文本(ben)檢測裝(zhuang)置(zhi),包括:
8、獲(huo)取模塊,用于獲(huo)取語(yu)音轉(zhuan)寫結果,所述(shu)語(yu)音轉(zhuan)寫結果包含待檢(jian)測文本以(yi)及(ji)所述(shu)待檢(jian)測文本的識別(bie)概率;
9、特征(zheng)(zheng)提(ti)取模(mo)塊,用于對所述待(dai)檢(jian)測文本進行特征(zheng)(zheng)提(ti)取,獲得所述待(dai)檢(jian)測文本的(de)文本特征(zheng)(zheng);
10、所(suo)(suo)述(shu)(shu)特征(zheng)提取模塊,還用于根據所(suo)(suo)述(shu)(shu)待檢(jian)測(ce)文本的(de)識別(bie)概率進行(xing)分數特征(zheng)提取,獲得所(suo)(suo)述(shu)(shu)待檢(jian)測(ce)文本的(de)分數特征(zheng);
11、確定模塊,用于基(ji)于所(suo)(suo)述(shu)文本特(te)征(zheng)和所(suo)(suo)述(shu)分數特(te)征(zheng)確定所(suo)(suo)述(shu)語(yu)音轉寫結果的(de)檢(jian)測分數,所(suo)(suo)述(shu)檢(jian)測分數用于表征(zheng)所(suo)(suo)述(shu)語(yu)音轉寫結果的(de)準確程度。
12、第(di)三方(fang)面,本公(gong)開提供了(le)一(yi)種電子(zi)(zi)設(she)備(bei),電子(zi)(zi)設(she)備(bei)包括:至(zhi)少(shao)(shao)一(yi)個(ge)(ge)處理(li)(li)器(qi)(qi)(qi);以及(ji)與所(suo)述(shu)至(zhi)少(shao)(shao)一(yi)個(ge)(ge)處理(li)(li)器(qi)(qi)(qi)通(tong)信連接的存儲(chu)器(qi)(qi)(qi);其(qi)中,所(suo)述(shu)存儲(chu)器(qi)(qi)(qi)存儲(chu)有可被(bei)所(suo)述(shu)至(zhi)少(shao)(shao)一(yi)個(ge)(ge)處理(li)(li)器(qi)(qi)(qi)執(zhi)行的一(yi)個(ge)(ge)或多個(ge)(ge)計算機程序(xu),一(yi)個(ge)(ge)或多個(ge)(ge)所(suo)述(shu)計算機程序(xu)被(bei)所(suo)述(shu)至(zhi)少(shao)(shao)一(yi)個(ge)(ge)處理(li)(li)器(qi)(qi)(qi)執(zhi)行,以使所(suo)述(shu)至(zhi)少(shao)(shao)一(yi)個(ge)(ge)處理(li)(li)器(qi)(qi)(qi)能夠執(zhi)行上述(shu)的文本檢測(ce)方(fang)法。
13、第(di)四方面,本公開提供了一種(zhong)計(ji)算(suan)機可讀(du)存(cun)儲(chu)介質,其(qi)上(shang)存(cun)儲(chu)有計(ji)算(suan)機程(cheng)序,其(qi)中,所述(shu)計(ji)算(suan)機程(cheng)序在被處(chu)理(li)器/處(chu)理(li)核(he)執行(xing)時實(shi)現上(shang)述(shu)的文本檢測方法。
14、本公開實施例(li)提(ti)(ti)供的(de)(de)文(wen)(wen)本檢(jian)(jian)(jian)(jian)測(ce)方法,獲(huo)(huo)取(qu)的(de)(de)語(yu)音轉寫結(jie)果(guo)包含待(dai)(dai)檢(jian)(jian)(jian)(jian)測(ce)文(wen)(wen)本以及(ji)所(suo)述(shu)(shu)待(dai)(dai)檢(jian)(jian)(jian)(jian)測(ce)文(wen)(wen)本的(de)(de)識別(bie)(bie)概(gai)率,對所(suo)述(shu)(shu)待(dai)(dai)檢(jian)(jian)(jian)(jian)測(ce)文(wen)(wen)本進(jin)行特征(zheng)提(ti)(ti)取(qu),獲(huo)(huo)得(de)所(suo)述(shu)(shu)待(dai)(dai)檢(jian)(jian)(jian)(jian)測(ce)文(wen)(wen)本的(de)(de)文(wen)(wen)本特征(zheng),根據所(suo)述(shu)(shu)待(dai)(dai)檢(jian)(jian)(jian)(jian)測(ce)文(wen)(wen)本的(de)(de)識別(bie)(bie)概(gai)率進(jin)行分數(shu)(shu)特征(zheng)提(ti)(ti)取(qu),獲(huo)(huo)得(de)所(suo)述(shu)(shu)待(dai)(dai)檢(jian)(jian)(jian)(jian)測(ce)文(wen)(wen)本的(de)(de)分數(shu)(shu)特征(zheng),基于所(suo)述(shu)(shu)文(wen)(wen)本特征(zheng)和(he)所(suo)述(shu)(shu)分數(shu)(shu)特征(zheng)確(que)定(ding)所(suo)述(shu)(shu)語(yu)音轉寫結(jie)果(guo)的(de)(de)檢(jian)(jian)(jian)(jian)測(ce)分數(shu)(shu),由于檢(jian)(jian)(jian)(jian)測(ce)分數(shu)(shu)是依(yi)據待(dai)(dai)檢(jian)(jian)(jian)(jian)測(ce)文(wen)(wen)本的(de)(de)文(wen)(wen)本特征(zheng)和(he)識別(bie)(bie)概(gai)率共(gong)同(tong)確(que)定(ding)的(de)(de),使得(de)對語(yu)音轉寫結(jie)果(guo)檢(jian)(jian)(jian)(jian)測(ce)的(de)(de)準確(que)度更(geng)高。
15、應當(dang)理(li)解,本部(bu)分所(suo)描述(shu)的(de)(de)(de)內容并非旨在標識本公(gong)開的(de)(de)(de)實(shi)施例(li)的(de)(de)(de)關鍵(jian)或重要特(te)(te)征,也不(bu)用于(yu)限制本公(gong)開的(de)(de)(de)范圍。本公(gong)開的(de)(de)(de)其它特(te)(te)征將通(tong)過以下的(de)(de)(de)說明書而(er)變得(de)容易理(li)解。
1.一種文本檢測(ce)方法(fa),其(qi)特(te)征在于,包括:
2.根據(ju)權利要求1所(suo)(suo)(suo)述(shu)的方(fang)法,其特(te)(te)征(zheng)在于,所(suo)(suo)(suo)述(shu)對所(suo)(suo)(suo)述(shu)待檢(jian)測(ce)文(wen)本進行(xing)特(te)(te)征(zheng)提(ti)取是檢(jian)測(ce)模型的文(wen)本特(te)(te)征(zheng)提(ti)取層(ceng)(ceng)執(zhi)行(xing)的;所(suo)(suo)(suo)述(shu)文(wen)本特(te)(te)征(zheng)包括(kuo)詞(ci)向量(liang)特(te)(te)征(zheng)、位置特(te)(te)征(zheng)以(yi)及分(fen)割向量(liang)特(te)(te)征(zheng)中至少一個;所(suo)(suo)(suo)述(shu)文(wen)本特(te)(te)征(zheng)提(ti)取層(ceng)(ceng)包括(kuo)詞(ci)向量(liang)特(te)(te)征(zheng)提(ti)取層(ceng)(ceng)、位置特(te)(te)征(zheng)提(ti)取層(ceng)(ceng)和分(fen)割向量(liang)特(te)(te)征(zheng)提(ti)取層(ceng)(ceng)至少之一;
3.根據權利(li)要(yao)求1所(suo)述(shu)的(de)方(fang)法,其特(te)征(zheng)(zheng)在于(yu),所(suo)述(shu)基于(yu)所(suo)述(shu)文本特(te)征(zheng)(zheng)和(he)所(suo)述(shu)分數特(te)征(zheng)(zheng)確定所(suo)述(shu)語音轉寫結(jie)果的(de)檢測(ce)分數,包括:
4.根據權利要求3所述的方法(fa),其特(te)征在于,所述對所述特(te)征編碼(ma)進(jin)行解碼(ma)處理,獲得所述語音轉寫結果(guo)的檢測分數,包括:
5.根據權(quan)利要(yao)求(qiu)1所(suo)述(shu)(shu)的方法,其特征在(zai)于(yu),所(suo)述(shu)(shu)根據所(suo)述(shu)(shu)待(dai)檢測文(wen)本的識別概率進行分數特征提取,包括:
6.根據權利要求1所述(shu)的(de)方法,其特征在于,所述(shu)待檢測文(wen)本(ben)是(shi)利用語(yu)(yu)音轉寫模型對(dui)目標語(yu)(yu)音進(jin)行語(yu)(yu)音識(shi)別處理后得到的(de);所述(shu)基于所述(shu)文(wen)本(ben)特征和所述(shu)分(fen)數(shu)特征確定所述(shu)語(yu)(yu)音轉寫結果的(de)檢測分(fen)數(shu)之后,還包括(kuo):
7.根(gen)據權利(li)要求6所(suo)(suo)(suo)述(shu)的(de)方(fang)法,其特征在(zai)于(yu),在(zai)所(suo)(suo)(suo)述(shu)語音(yin)轉(zhuan)寫結(jie)果的(de)檢測分數大于(yu)或(huo)等于(yu)所(suo)(suo)(suo)述(shu)分數閾值(zhi)的(de)情況下,將所(suo)(suo)(suo)述(shu)目(mu)標語音(yin)和所(suo)(suo)(suo)述(shu)語音(yin)轉(zhuan)寫結(jie)果關聯存儲,以便于(yu)根(gen)據所(suo)(suo)(suo)述(shu)語音(yin)轉(zhuan)寫結(jie)果執(zhi)行所(suo)(suo)(suo)述(shu)目(mu)標語音(yin)的(de)相關業務。
8.一種文本檢測裝置,其特征在(zai)于,包括:
9.一種(zhong)電子設(she)備,其特征(zheng)在于,包括(kuo):
10.一種計(ji)算(suan)機(ji)可(ke)讀(du)存儲介質,其上(shang)存儲有計(ji)算(suan)機(ji)程序(xu)(xu),其特征在于,所述計(ji)算(suan)機(ji)程序(xu)(xu)在被處(chu)理器執行時(shi)實現如權利要(yao)求1-7中任一項(xiang)所述的文本檢測方法(fa)。