本發明(ming)涉及檢索數據(ju),具體為(wei)基于nlp的檢索數據(ju)管理方法及系(xi)統。
背景技術:
1、自(zi)然語(yu)言(yan)處(chu)理(li)(nlp)是實(shi)現人與(yu)計算機之間用(yong)(yong)自(zi)然語(yu)言(yan)進行有(you)效(xiao)通信的各種(zhong)理(li)論和(he)方法,自(zi)然語(yu)言(yan)是人類發展過程中(zhong)形成的一種(zhong)信息交流的方式,包括口(kou)語(yu)及書面(mian)語(yu),反(fan)映了(le)人類的思(si)維,自(zi)然語(yu)言(yan)處(chu)理(li)主要應用(yong)(yong)于(yu)機器翻譯、輿情監測、自(zi)動摘要、觀點提取、文(wen)本分類、問(wen)題(ti)回答(da)、文(wen)本語(yu)義對比(bi)、語(yu)音(yin)識別、中(zhong)文(wen)ocr等方面(mian);
2、通常(chang)廠(chang)商對(dui)產(chan)(chan)(chan)品(pin)(pin)上市(shi)后(hou)會做一(yi)些基礎調(diao)研(yan)用于調(diao)整市(shi)場(chang)反饋方(fang)向上的產(chan)(chan)(chan)品(pin)(pin)布局,而調(diao)研(yan)的方(fang)式(shi)(shi)往(wang)往(wang)是(shi)通過利用nlp對(dui)與產(chan)(chan)(chan)品(pin)(pin)相關的文字信(xin)(xin)息(xi)(xi)進行分析,現有環(huan)境(jing)(jing)中,廠(chang)商的調(diao)研(yan)方(fang)式(shi)(shi)比較單一(yi),對(dui)于不同可(ke)能存(cun)在(zai)(zai)產(chan)(chan)(chan)品(pin)(pin)相關信(xin)(xin)息(xi)(xi)的平(ping)臺(tai)使用的分析方(fang)式(shi)(shi),即nlp應用檢索文本信(xin)(xin)息(xi)(xi)的作(zuo)用環(huan)境(jing)(jing),往(wang)往(wang)是(shi)不更換(huan)的,從(cong)而會產(chan)(chan)(chan)生同一(yi)產(chan)(chan)(chan)品(pin)(pin)在(zai)(zai)不同平(ping)臺(tai)上存(cun)在(zai)(zai)輿(yu)情(qing)分析差異化較大的情(qing)況(kuang),而此時并不能有效的確(que)定差異化的原因(yin)是(shi)產(chan)(chan)(chan)品(pin)(pin)本身還是(shi)調(diao)研(yan)方(fang)式(shi)(shi)帶(dai)來的影響(xiang),所以(yi)現有環(huan)境(jing)(jing)下(xia)急需(xu)一(yi)種可(ke)以(yi)結合(he)產(chan)(chan)(chan)品(pin)(pin)并基于記(ji)錄(lu)平(ping)臺(tai)的特性自適應調(diao)整實(shi)施(shi)nlp實(shi)現文本信(xin)(xin)息(xi)(xi)檢索作(zuo)用環(huan)境(jing)(jing)的智(zhi)能調(diao)整方(fang)案。
技術實現思路
1、本發明(ming)的目的在于(yu)(yu)提供基于(yu)(yu)nlp的檢索數據管(guan)理(li)方法及(ji)系(xi)統,以解決(jue)上述背景技術中提出的問題(ti)。
2、為(wei)了解(jie)決上述技(ji)術問(wen)題,本(ben)發明提供(gong)如下(xia)技(ji)術方案(an):基于nlp的檢索數據管理方法,包括以下(xia)分(fen)析(xi)步(bu)驟:
3、按照產(chan)品(pin)類(lei)型標準劃分管(guan)理(li)系統記錄的(de)(de)各產(chan)品(pin)為初(chu)(chu)始類(lei)別(bie)產(chan)品(pin),對每一類(lei)初(chu)(chu)始類(lei)別(bie)產(chan)品(pin)在不同記錄平臺上基于產(chan)品(pin)輿情分析模型輸出的(de)(de)產(chan)品(pin)輿情指數進行進一步的(de)(de)分類(lei)為目標類(lei)別(bie)產(chan)品(pin);
4、對存在(zai)于(yu)不(bu)同記(ji)錄平臺(tai)的(de)(de)產(chan)品(pin)輿情指數最(zui)大差值(zhi)(zhi)小于(yu)等于(yu)差值(zhi)(zhi)閾值(zhi)(zhi)的(de)(de)目標(biao)類型(xing)(xing)產(chan)品(pin)標(biao)記(ji)為第一類型(xing)(xing)產(chan)品(pin),提取第一類型(xing)(xing)產(chan)品(pin)基于(yu)產(chan)品(pin)輿情分析模型(xing)(xing)中在(zai)各(ge)記(ji)錄平臺(tai)利用nlp檢索(suo)文本信息的(de)(de)作(zuo)用場景;將第一類型(xing)(xing)產(chan)品(pin)與對應各(ge)記(ji)錄平臺(tai)的(de)(de)作(zuo)用場景進(jin)行關聯(lian)記(ji)錄;
5、將產品(pin)與作(zuo)用場(chang)景進(jin)行(xing)關聯記錄可(ke)以提高(gao)廠商(shang)基于(yu)不同(tong)平(ping)臺(tai)對產品(pin)進(jin)行(xing)輿(yu)情(qing)分(fen)(fen)析(xi)的精(jing)確性;使得廠商(shang)利用分(fen)(fen)析(xi)模型可(ke)以快速基于(yu)作(zuo)用場(chang)景進(jin)行(xing)檢索文(wen)本信(xin)息的分(fen)(fen)析(xi),降低(di)同(tong)一(yi)產品(pin)于(yu)不同(tong)平(ping)臺(tai)上(shang)分(fen)(fen)析(xi)輿(yu)情(qing)指數的差(cha)異性;
6、對存在于(yu)不同記(ji)錄平(ping)臺的產(chan)品(pin)(pin)輿情指數(shu)最大(da)(da)差值(zhi)大(da)(da)于(yu)差值(zhi)閾值(zhi)的目標類(lei)型(xing)(xing)產(chan)品(pin)(pin)標記(ji)為第(di)二類(lei)型(xing)(xing)產(chan)品(pin)(pin),提取(qu)第(di)二類(lei)型(xing)(xing)產(chan)品(pin)(pin)在對應各記(ji)錄平(ping)臺的作用場(chang)(chang)景類(lei)型(xing)(xing);基于(yu)作用場(chang)(chang)景類(lei)型(xing)(xing)數(shu)量判(pan)斷是否利用nlp檢索文本信息的作用場(chang)(chang)景進行更換分析(xi);
7、并基于判斷結果生成(cheng)第二類型產品的最優關(guan)聯記錄;
8、當(dang)存在(zai)對新增產品基(ji)于產品輿情分析模型在(zai)各平臺分析產品輿情指數時,匹配關(guan)聯記(ji)錄進行對應記(ji)錄平臺利用(yong)nlp作用(yong)場景的推薦。
9、推(tui)薦的(de)(de)目(mu)的(de)(de)是(shi):首(shou)先由于平臺(tai)(tai)(tai)的(de)(de)差異(yi)(yi)(yi),廠(chang)商要想對(dui)(dui)產(chan)品投入市場后(hou)的(de)(de)輿(yu)(yu)情(qing)進(jin)(jin)行(xing)監(jian)控時,不能單一的(de)(de)對(dui)(dui)某一平臺(tai)(tai)(tai)進(jin)(jin)行(xing)分(fen)(fen)(fen)析(xi)(xi),其次在分(fen)(fen)(fen)析(xi)(xi)不同平臺(tai)(tai)(tai)是(shi)要考量各平臺(tai)(tai)(tai)的(de)(de)構建特性差異(yi)(yi)(yi),來(lai)運行(xing)不同的(de)(de)分(fen)(fen)(fen)析(xi)(xi)模型,而(er)在利用(yong)nlp對(dui)(dui)文本(ben)信(xin)息(xi)進(jin)(jin)行(xing)檢(jian)索過(guo)程(cheng)中如(ru)若對(dui)(dui)不同平臺(tai)(tai)(tai)在同一作(zuo)用(yong)場景下進(jin)(jin)行(xing)檢(jian)索文本(ben)信(xin)息(xi)可能會出(chu)現最終(zhong)輸(shu)出(chu)結果差異(yi)(yi)(yi)較(jiao)大(da),從而(er)導致對(dui)(dui)同一產(chan)品的(de)(de)輿(yu)(yu)情(qing)分(fen)(fen)(fen)析(xi)(xi)差異(yi)(yi)(yi)化較(jiao)大(da)的(de)(de)問題,對(dui)(dui)廠(chang)商不具有明確的(de)(de)指(zhi)向性,所以如(ru)何調整(zheng)利用(yong)nlp分(fen)(fen)(fen)析(xi)(xi)方式來(lai)實現同一產(chan)品的(de)(de)較(jiao)小差異(yi)(yi)(yi)化輿(yu)(yu)情(qing)指(zhi)向,降低平臺(tai)(tai)(tai)自身(shen)原因帶來(lai)的(de)(de)對(dui)(dui)產(chan)品輿(yu)(yu)情(qing)影響(xiang)的(de)(de)誤差是(shi)值得分(fen)(fen)(fen)析(xi)(xi)的(de)(de)。
10、進(jin)一步的(de),對每一類(lei)(lei)初始類(lei)(lei)別產(chan)(chan)品(pin)(pin)在不(bu)同記錄平臺上基于產(chan)(chan)品(pin)(pin)輿情分(fen)析模型輸(shu)出的(de)產(chan)(chan)品(pin)(pin)輿情指數進(jin)行進(jin)一步的(de)分(fen)類(lei)(lei)為目標類(lei)(lei)別產(chan)(chan)品(pin)(pin),包(bao)括以下:
11、提取產品(pin)輿(yu)情分析模型中利用(yong)nlp檢(jian)索(suo)文本信息(xi)的(de)所(suo)有作(zuo)用(yong)場景(jing);獲取每(mei)類(lei)初始(shi)類(lei)別產品(pin)的(de)第(di)i個(ge)產品(pin)基于產品(pin)輿(yu)情分析模型利用(yong)nlp應用(yong)的(de)同一作(zuo)用(yong)場景(jing)在第(di)j個(ge)記錄平臺輸(shu)出(chu)的(de)產品(pin)輿(yu)情指數(shu)yij;
12、計算第(di)(di)i個(ge)(ge)產(chan)(chan)品基于產(chan)(chan)品輿(yu)情(qing)分(fen)析模(mo)型利用(yong)nlp應用(yong)的(de)同(tong)一作用(yong)場景的(de)輿(yu)情(qing)指(zhi)數(shu)最(zui)大差(cha)值(zhi)(zhi)(zhi)yimax,yimax=yijmax-yijmin,其中yijmax表示第(di)(di)i個(ge)(ge)產(chan)(chan)品在第(di)(di)j個(ge)(ge)記錄平臺(tai)輸出的(de)產(chan)(chan)品輿(yu)情(qing)指(zhi)數(shu)最(zui)大值(zhi)(zhi)(zhi),yijmin表示第(di)(di)i個(ge)(ge)產(chan)(chan)品在第(di)(di)j個(ge)(ge)記錄平臺(tai)輸出的(de)產(chan)(chan)品輿(yu)情(qing)指(zhi)數(shu)最(zui)小值(zhi)(zhi)(zhi);設(she)置差(cha)值(zhi)(zhi)(zhi)閾值(zhi)(zhi)(zhi)yi0;
13、遍歷計算(suan)利(li)用(yong)nlp檢索文本信息的(de)所有作用(yong)場(chang)景下(xia)對應同一(yi)類初始類別產品的(de)輿(yu)情指數最(zui)大差(cha)值以及(ji)最(zui)大差(cha)值與(yu)差(cha)值閾值的(de)大小關系;
14、當(dang)任一(yi)(yi)類作用(yong)場(chang)景下(xia)同(tong)一(yi)(yi)初始(shi)類別(bie)產品(pin)(pin)中存在(zai)產品(pin)(pin)輿(yu)(yu)情(qing)指數最大(da)(da)差(cha)(cha)值(zhi)與差(cha)(cha)值(zhi)閾(yu)值(zhi)的(de)大(da)(da)小(xiao)關系不唯一(yi)(yi)的(de)產品(pin)(pin)時,將相(xiang)同(tong)大(da)(da)小(xiao)關系的(de)產品(pin)(pin)進一(yi)(yi)步(bu)分類為同(tong)一(yi)(yi)目(mu)標類別(bie)產品(pin)(pin),同(tong)一(yi)(yi)目(mu)標類別(bie)產品(pin)(pin)對(dui)應(ying)的(de)輿(yu)(yu)情(qing)指數最大(da)(da)差(cha)(cha)值(zhi)與差(cha)(cha)值(zhi)閾(yu)值(zhi)的(de)大(da)(da)小(xiao)關系在(zai)不同(tong)利用(yong)nlp檢索文本信息的(de)作用(yong)場(chang)景下(xia)均相(xiang)同(tong)。
15、進一步(bu)的,提取第(di)二類型(xing)產品在(zai)對應各記錄平臺的作(zuo)用場景類型(xing);基于作(zuo)用場景類型(xing)數量(liang)判(pan)斷是否利用nlp檢索文(wen)本信息的作(zuo)用場景進行(xing)更換分(fen)析;包括以下:
16、當第(di)二類型(xing)產(chan)(chan)(chan)品(pin)(pin)(pin)在對應(ying)(ying)各(ge)記錄平(ping)臺(tai)的作用(yong)場景類型(xing)的個(ge)(ge)數為(wei)一(yi)時,提(ti)取第(di)二類型(xing)產(chan)(chan)(chan)品(pin)(pin)(pin)在第(di)j個(ge)(ge)記錄平(ping)臺(tai)利(li)用(yong)產(chan)(chan)(chan)品(pin)(pin)(pin)輿(yu)情(qing)分(fen)(fen)(fen)析(xi)(xi)模(mo)型(xing)輸(shu)出(chu)的產(chan)(chan)(chan)品(pin)(pin)(pin)輿(yu)情(qing)指(zhi)數yj,并計算產(chan)(chan)(chan)品(pin)(pin)(pin)輿(yu)情(qing)指(zhi)數平(ping)均(jun)值(zhi)(zhi)y0,c=(1/n)∑yj,n表示第(di)二類型(xing)產(chan)(chan)(chan)品(pin)(pin)(pin)利(li)用(yong)產(chan)(chan)(chan)品(pin)(pin)(pin)輿(yu)情(qing)分(fen)(fen)(fen)析(xi)(xi)模(mo)型(xing)實施(shi)分(fen)(fen)(fen)析(xi)(xi)的記錄平(ping)臺(tai)的個(ge)(ge)數;判斷輸(shu)出(chu)不(bu)利(li)用(yong)nlp檢索文本信息的作用(yong)場景進(jin)行更(geng)換(huan)分(fen)(fen)(fen)析(xi)(xi);并將產(chan)(chan)(chan)品(pin)(pin)(pin)輿(yu)情(qing)指(zhi)數平(ping)均(jun)值(zhi)(zhi)y0作為(wei)對應(ying)(ying)第(di)二類型(xing)產(chan)(chan)(chan)品(pin)(pin)(pin)的輸(shu)出(chu)值(zhi)(zhi)傳輸(shu)至監控系統中;
17、在(zai)第二(er)類型(xing)產品對(dui)應各記錄平臺的作用場景類型(xing)個數為一時說明(ming)沒(mei)有可(ke)以調整的其他作用場景,但(dan)此時該(gai)產品在(zai)不(bu)同(tong)記錄平臺基于(yu)產品輿情分析模型(xing)得到的產品輿情指(zhi)數差異(yi)較大,故通過(guo)取平均(jun)值的方(fang)式中和差異(yi)大帶(dai)來的不(bu)確定性(xing);
18、當第(di)二(er)類型產品在對應(ying)各記錄平臺的(de)(de)作(zuo)用(yong)場景類型的(de)(de)個數(shu)大于(yu)等于(yu)二(er)時,判斷輸出(chu)利用(yong)nlp檢索文(wen)本(ben)信(xin)息的(de)(de)作(zuo)用(yong)場景進行更(geng)換分析。
19、進(jin)一步的,基于判(pan)斷結果生成第二(er)類型產(chan)品的最優關聯記錄,包(bao)括(kuo)以下:
20、提取判斷(duan)輸出(chu)利(li)用(yong)nlp檢(jian)索文本信息的(de)(de)作(zuo)用(yong)場景(jing)進(jin)行更(geng)換分析(xi)時對應的(de)(de)第(di)二類(lei)型(xing)產品(pin)(pin),列(lie)舉第(di)二類(lei)型(xing)產品(pin)(pin)在各記(ji)錄(lu)平臺(tai)的(de)(de)所有作(zuo)用(yong)場景(jing),基(ji)于(yu)所有作(zuo)用(yong)場景(jing)進(jin)行排列(lie)組合,生成每一(yi)記(ji)錄(lu)平臺(tai)對應一(yi)個作(zuo)用(yong)場景(jing)時的(de)(de)第(di)二類(lei)型(xing)產品(pin)(pin)輿情(qing)(qing)鏈,第(di)二類(lei)型(xing)產品(pin)(pin)輿情(qing)(qing)鏈由第(di)二類(lei)型(xing)產品(pin)(pin)作(zuo)為主鏈、每一(yi)記(ji)錄(lu)平臺(tai)與在對應平臺(tai)中(zhong)利(li)用(yong)輿情(qing)(qing)分析(xi)模型(xing)實(shi)施(shi)nlp分析(xi)的(de)(de)作(zuo)用(yong)場景(jing)為子(zi)鏈構成;
21、獲取可構成的(de)所有第二類型產品輿(yu)(yu)情(qing)(qing)鏈,計(ji)算(suan)每一輿(yu)(yu)情(qing)(qing)鏈對應(ying)的(de)輿(yu)(yu)情(qing)(qing)指(zhi)數最大(da)差(cha)值;
22、若可(ke)構成(cheng)的所有第二類型(xing)(xing)(xing)產品輿(yu)情(qing)鏈(lian)的輿(yu)情(qing)指數(shu)最大差值均(jun)大于差值閾值,則(ze)計算每一第二類型(xing)(xing)(xing)產品輿(yu)情(qing)鏈(lian)對應的輿(yu)情(qing)指數(shu)平均(jun)值,并輸出第二類型(xing)(xing)(xing)產品的所有第二類型(xing)(xing)(xing)產品輿(yu)情(qing)鏈(lian)的輿(yu)情(qing)指數(shu)平均(jun)值的平均(jun)值為輸出值傳(chuan)輸至(zhi)監控系統中(zhong);
23、若可構(gou)成的(de)(de)(de)所有第(di)二類(lei)型(xing)產(chan)品(pin)輿(yu)情(qing)(qing)(qing)鏈(lian)(lian)(lian)的(de)(de)(de)輿(yu)情(qing)(qing)(qing)指數(shu)最(zui)(zui)大差值(zhi)存(cun)在(zai)小(xiao)于(yu)等(deng)于(yu)差值(zhi)閾(yu)值(zhi),提取輿(yu)情(qing)(qing)(qing)指數(shu)最(zui)(zui)大差值(zhi)小(xiao)于(yu)等(deng)于(yu)差值(zhi)閾(yu)值(zhi)時(shi),輿(yu)情(qing)(qing)(qing)指數(shu)最(zui)(zui)大差值(zhi)的(de)(de)(de)最(zui)(zui)小(xiao)值(zhi)所對(dui)應(ying)的(de)(de)(de)第(di)二類(lei)型(xing)產(chan)品(pin)輿(yu)情(qing)(qing)(qing)鏈(lian)(lian)(lian)為目標(biao)輿(yu)情(qing)(qing)(qing)鏈(lian)(lian)(lian),提取目標(biao)輿(yu)情(qing)(qing)(qing)鏈(lian)(lian)(lian)中的(de)(de)(de)子鏈(lian)(lian)(lian)作為第(di)二類(lei)型(xing)產(chan)品(pin)在(zai)各記(ji)錄平(ping)臺的(de)(de)(de)最(zui)(zui)優關(guan)聯記(ji)錄;最(zui)(zui)優關(guan)聯記(ji)錄是指每一記(ji)錄平(ping)臺對(dui)應(ying)最(zui)(zui)優應(ying)用nlp檢索文本信息(xi)的(de)(de)(de)作用場景(jing)。
24、進一步的,基于產(chan)品(pin)輿情分(fen)析模型輸出的產(chan)品(pin)輿情指數(shu),包(bao)括(kuo)以下:
25、獲(huo)取基(ji)于產品名(ming)稱應用nlp提取每個記錄平臺文(wen)本(ben)信(xin)息(xi)中的形容詞和(he)名(ming)詞,文(wen)本(ben)信(xin)息(xi)包括(kuo)由(you)視頻內容轉化的文(wen)本(ben)數據和(he)直接提取的文(wen)本(ben)數據;文(wen)本(ben)信(xin)息(xi)來源不同作(zuo)用場景;
26、在文本信息(xi)中(zhong)每一形容(rong)詞綁(bang)定相鄰最近的名詞構(gou)成數據(ju)包;
27、接收用戶輸入的(de)功(gong)能(neng)關(guan)鍵詞(ci)(ci)(ci),將功(gong)能(neng)性(xing)關(guan)鍵詞(ci)(ci)(ci)和產品名(ming)稱歸(gui)納(na)為名(ming)詞(ci)(ci)(ci),標記(ji)文本(ben)信息記(ji)錄功(gong)能(neng)性(xing)關(guan)鍵詞(ci)(ci)(ci)時的(de)數(shu)據包,提取(qu)數(shu)據包中形容詞(ci)(ci)(ci)的(de)詞(ci)(ci)(ci)性(xing),利用公式:
28、h=b1/(b1+b2);
29、計(ji)算文本信息(xi)(xi)的(de)信息(xi)(xi)評價值h,其中b1表示相同功能(neng)(neng)性關(guan)鍵(jian)詞(ci)時形(xing)容詞(ci)詞(ci)性為褒義(yi)詞(ci)的(de)數(shu)據(ju)包個數(shu),b2表示相同功能(neng)(neng)性關(guan)鍵(jian)詞(ci)時形(xing)容詞(ci)詞(ci)性為貶義(yi)詞(ci)的(de)數(shu)據(ju)包個數(shu);
30、獲(huo)取(qu)每個記錄(lu)平臺中文本信(xin)息提取(qu)來(lai)源(yuan)作(zuo)者(zhe)的(de)影響度(du)z,z=a1*s+a2*d,其中s表(biao)(biao)示來(lai)源(yuan)作(zuo)者(zhe)的(de)粉(fen)絲量,d表(biao)(biao)示來(lai)源(yuan)作(zuo)者(zhe)所有作(zuo)品的(de)平均點贊量;a1、a2表(biao)(biao)示對應(ying)參(can)考系數;
31、基于影(ying)響度z和文(wen)本信(xin)息(xi)的(de)信(xin)息(xi)評價值(zhi)h,對(dui)用(yong)戶輸入的(de)所有(you)功(gong)能(neng)關(guan)鍵詞(ci)計算產品輿情(qing)指(zhi)數q,q=∑{[(1/t)∑h]*z},t表示同一來(lai)(lai)源作(zuo)(zuo)者(zhe)的(de)功(gong)能(neng)性關(guan)鍵詞(ci)的(de)記錄類型數;(1/t)∑h表示對(dui)同一來(lai)(lai)源作(zuo)(zuo)者(zhe)的(de)文(wen)本信(xin)息(xi)的(de)信(xin)息(xi)評價值(zhi)均(jun)值(zhi);∑{[(1/t)∑h]*z}表示對(dui)所有(you)來(lai)(lai)源作(zuo)(zuo)者(zhe)的(de)影(ying)響度與對(dui)應(ying)信(xin)息(xi)平均(jun)值(zhi)均(jun)值(zhi)的(de)積求和。
32、綜合評價值越(yue)大說明(ming)產品的輿情越(yue)好(hao);
33、進一步(bu)的,匹配關聯記(ji)錄進行(xing)對應記(ji)錄平臺利用(yong)(yong)nlp作用(yong)(yong)場景的推薦,包括(kuo)以下:
34、匹配(pei)新增產品的類別(bie)于(yu)歷(li)史分析的目標(biao)類別(bie)產品,獲取相同目標(biao)類別(bie)產品的最優關聯記(ji)錄(lu),提取最優關聯記(ji)錄(lu)中(zhong)每一記(ji)錄(lu)平臺對應應用nlp檢索文(wen)本信息(xi)的作用場景為推薦,傳輸至管理(li)系統中(zhong),供管理(li)系統對各記(ji)錄(lu)平臺實施(shi)輿情分析模型作準備;
35、當匹配后相同目標(biao)類別產品對(dui)應記(ji)(ji)錄的作用場景(jing)唯一時,傳輸(shu)第一信(xin)號至管理系統中;第一信(xin)號是指響應對(dui)應產品在(zai)各記(ji)(ji)錄平臺中實施輿情(qing)分析模型的輿情(qing)指數平均(jun)值作為輸(shu)出值的信(xin)號。
36、基于(yu)nlp的檢索數據管(guan)理(li)系統,系統包括初始類別產(chan)品確定模(mo)(mo)塊(kuai)、目標類別產(chan)品劃分(fen)模(mo)(mo)塊(kuai)、關聯記錄(lu)模(mo)(mo)塊(kuai)、場(chang)景(jing)(jing)更(geng)換分(fen)析模(mo)(mo)塊(kuai)和輿情分(fen)析場(chang)景(jing)(jing)推薦模(mo)(mo)塊(kuai);
37、初始類(lei)別產(chan)品(pin)(pin)確定(ding)模塊用于按照產(chan)品(pin)(pin)類(lei)型標準劃分管理系統記錄的各產(chan)品(pin)(pin)為初始類(lei)別產(chan)品(pin)(pin);
38、目(mu)標(biao)類(lei)別產(chan)(chan)(chan)品(pin)劃分(fen)模塊用于(yu)對每(mei)一類(lei)初始類(lei)別產(chan)(chan)(chan)品(pin)在不同記錄平臺上(shang)基于(yu)產(chan)(chan)(chan)品(pin)輿情分(fen)析模型(xing)輸出的產(chan)(chan)(chan)品(pin)輿情指數進(jin)行進(jin)一步的分(fen)類(lei)為目(mu)標(biao)類(lei)別產(chan)(chan)(chan)品(pin);
39、關(guan)(guan)聯記(ji)錄(lu)模塊用(yong)于將第一類型產(chan)品與對應各記(ji)錄(lu)平臺的作用(yong)場景進行關(guan)(guan)聯記(ji)錄(lu);
40、場景更(geng)換分(fen)析模塊用于基于作(zuo)用場景類型數量判(pan)斷是否利用nlp檢(jian)索文本(ben)信息的作(zuo)用場景進行更(geng)換分(fen)析;
41、輿情分析場景(jing)推薦(jian)模塊用于基于判斷結果生成(cheng)第二類型(xing)產品的最優(you)關聯(lian)記錄,當存在對(dui)新(xin)增產品基于產品輿情分析模型(xing)在各(ge)平臺(tai)分析產品輿情指數時,匹(pi)配關聯(lian)記錄進行對(dui)應記錄平臺(tai)利用nlp作用場景(jing)的推薦(jian)。
42、進一步的,目標類別產品劃分模塊包括輿(yu)情(qing)指(zhi)數差值分析單(dan)元和產品關系(xi)匹配單(dan)元;
43、輿(yu)(yu)情(qing)指(zhi)(zhi)數差(cha)值分析單元(yuan)用于(yu)計算產(chan)品基于(yu)產(chan)品輿(yu)(yu)情(qing)分析模型利(li)用nlp應用的同一作(zuo)用場景的輿(yu)(yu)情(qing)指(zhi)(zhi)數最大(da)差(cha)值;
44、產(chan)品關(guan)系匹配單元用于遍歷計算(suan)同一類(lei)初(chu)始類(lei)別產(chan)品的(de)(de)輿(yu)情(qing)指數(shu)最大(da)差值(zhi)以及最大(da)差值(zhi)與差值(zhi)閾值(zhi)的(de)(de)大(da)小關(guan)系;基于大(da)小關(guan)系劃分目(mu)標類(lei)別產(chan)品。
45、進一(yi)步的,場(chang)景更(geng)換分(fen)析模塊包括作用場(chang)景類型分(fen)類單元和(he)場(chang)景更(geng)換判(pan)斷單元;
46、作用場景(jing)類(lei)型分類(lei)單元用于判斷第二類(lei)型產品在對應各記錄平臺的(de)作用場景(jing)類(lei)型的(de)個數;
47、場景(jing)更換判斷單(dan)元用(yong)于(yu)(yu)基(ji)于(yu)(yu)作用(yong)場景(jing)類(lei)別分類(lei)單(dan)元輸出結果判斷是否進行更換分析。
48、進一步(bu)的(de),輿情分析場景推(tui)薦模塊包(bao)括最優(you)關聯記錄生成單(dan)元、輿情分析模型建立單(dan)元和(he)新增產(chan)品匹配單(dan)元;
49、最(zui)優關(guan)聯記(ji)(ji)錄生成(cheng)(cheng)單元用于生成(cheng)(cheng)每一記(ji)(ji)錄平臺對應(ying)最(zui)優應(ying)用nlp檢索文本信(xin)息的(de)作(zuo)用場景作(zuo)為(wei)記(ji)(ji)錄;
50、輿情分析模(mo)型建立(li)單(dan)元用于(yu)基于(yu)nlp建立(li)輿情分析模(mo)型;
51、新增(zeng)產品匹配單(dan)元用(yong)(yong)于對新增(zeng)產品進行應用(yong)(yong)nlp檢索文本信息的(de)作用(yong)(yong)場景的(de)匹配。
52、與現(xian)有(you)技(ji)術相比,本發(fa)明所(suo)達到的(de)有(you)益效果是:本發(fa)明通(tong)過(guo)對(dui)歷史記錄(lu)各(ge)產(chan)品(pin)(pin)于(yu)不(bu)同(tong)記錄(lu)平臺(tai)上(shang)使(shi)用(yong)產(chan)品(pin)(pin)輿情(qing)分析(xi)(xi)模型輸出的(de)產(chan)品(pin)(pin)輿情(qing)指數作(zuo)(zuo)為數據基礎,對(dui)產(chan)品(pin)(pin)進行(xing)(xing)初步分類(lei),同(tong)時經過(guo)不(bu)同(tong)類(lei)別產(chan)品(pin)(pin)在可以實(shi)施利用(yong)nlp作(zuo)(zuo)用(yong)場(chang)景下(xia)的(de)調整(zheng)時,進行(xing)(xing)排(pai)列組合(he)全方位的(de)分析(xi)(xi)各(ge)種作(zuo)(zuo)用(yong)場(chang)景搭(da)配下(xia)的(de)偏差關系,使(shi)得通(tong)過(guo)調整(zheng)作(zuo)(zuo)用(yong)場(chang)景對(dui)應(ying)分析(xi)(xi)模型得到的(de)輿情(qing)指數在不(bu)同(tong)平臺(tai)時的(de)數據偏差合(he)理(li)化,提(ti)高(gao)輿情(qing)分析(xi)(xi)的(de)精確度,避免因模型自身問(wen)題(ti)帶(dai)來的(de)誤(wu)差降低分析(xi)(xi)的(de)有(you)效性;除此之外(wai),本技(ji)術對(dui)于(yu)新的(de)產(chan)品(pin)(pin)進行(xing)(xing)類(lei)別匹配,推(tui)薦類(lei)別相同(tong)情(qing)況下(xia)在不(bu)同(tong)記錄(lu)平臺(tai)上(shang)最優的(de)輿情(qing)分析(xi)(xi)模型所(suo)應(ying)用(yong)nlp實(shi)施的(de)作(zuo)(zuo)用(yong)場(chang)景,從而提(ti)高(gao)輿情(qing)分析(xi)(xi)的(de)智(zhi)能化。