本公開(kai)涉及(ji)電(dian)子(zi)裝(zhuang)置及(ji)其(qi)操作方法。更具體地,本公開(kai)涉及(ji)一(yi)種收集(ji)保證用戶隱私(si)的(de)字符串數據并將其(qi)發送給服務器的(de)電(dian)子(zi)裝(zhuang)置及(ji)其(qi)操作方法。
背景技術:
1、人(ren)工智(zhi)能(ai)系統是(shi)(shi)實現人(ren)類水平智(zhi)能的(de)計算機(ji)系統,并且(qie)包括機(ji)器學習(深(shen)度學習)和(he)使用(yong)機(ji)器學習的(de)元素(su)技術(shu)。機(ji)器學習是(shi)(shi)一種算法技術(shu),它(ta)本身(shen)可以對輸入(ru)數(shu)據的(de)特征進行(xing)分類和(he)學習。元素(su)技術(shu)是(shi)(shi)一種使用(yong)機(ji)器學習算法(例如(ru)深(shen)度學習)的(de)技術(shu),并且(qie)由例如(ru)語言理(li)(li)解(jie)、視覺理(li)(li)解(jie)、推理(li)(li)/預測、知識表達和(he)操作(zuo)控制等技術(shu)領域構(gou)成(cheng)。
2、語言(yan)理(li)解(jie)是識別和應用(yong)(yong)(yong)(yong)/處(chu)理(li)人(ren)類語言(yan)或(huo)文(wen)本(ben)的技術(shu),并(bing)且包括(kuo)自然語言(yan)處(chu)理(li)、機器翻譯、對話系統、回答詢(xun)問和語音識別/合成。已經提出了(le)用(yong)(yong)(yong)(yong)于收(shou)集(ji)和管理(li)語言(yan)理(li)解(jie)的各(ge)種數據(ju)(ju)(ju)的各(ge)種方法(fa)。例如,當用(yong)(yong)(yong)(yong)戶(hu)(hu)(hu)在智(zhi)能(neng)電話上輸(shu)(shu)入單(dan)(dan)詞(ci)時,現有(you)的技術(shu)分(fen)析(xi)輸(shu)(shu)入的單(dan)(dan)詞(ci),推薦用(yong)(yong)(yong)(yong)戶(hu)(hu)(hu)想要輸(shu)(shu)入的單(dan)(dan)詞(ci),或(huo)糾正(zheng)拼寫錯誤。為了(le)實現該(gai)技術(shu),可以(yi)通(tong)過(guo)各(ge)種方法(fa)(社交網絡服務(sns)服務器、多個用(yong)(yong)(yong)(yong)戶(hu)(hu)(hu)輸(shu)(shu)入詞(ci)、門戶(hu)(hu)(hu)關(guan)鍵(jian)字(zi)等)收(shou)集(ji)各(ge)種字(zi)符串數據(ju)(ju)(ju)。在這(zhe)種情況下,收(shou)集(ji)的各(ge)種字(zi)符串數據(ju)(ju)(ju)可以(yi)包括(kuo)各(ge)種字(zi)符串數據(ju)(ju)(ju),例如用(yong)(yong)(yong)(yong)戶(hu)(hu)(hu)輸(shu)(shu)入到搜索(suo)引擎中的關(guan)鍵(jian)字(zi)、關(guan)于用(yong)(yong)(yong)(yong)戶(hu)(hu)(hu)訪問的網站的歷(li)史信(xin)息(xi)以(yi)及文(wen)本(ben)消息(xi)。
3、安(an)全(quan)(quan)的(de)(de)重要(yao)性可(ke)(ke)能(neng)根據(ju)(ju)(ju)收集(ji)的(de)(de)各種數(shu)據(ju)(ju)(ju)的(de)(de)類型而不同。例如,與用(yong)(yong)戶(hu)輸入到搜索引擎的(de)(de)關鍵字(zi)(zi)數(shu)據(ju)(ju)(ju)相比,包括個人(ren)信息(例如用(yong)(yong)戶(hu)的(de)(de)居民登記號(hao)和(he)帳號(hao))的(de)(de)文(wen)本消息數(shu)據(ju)(ju)(ju)可(ke)(ke)能(neng)需要(yao)相對(dui)較高的(de)(de)安(an)全(quan)(quan)性。因此(ci),為了維護安(an)全(quan)(quan)性,用(yong)(yong)戶(hu)終(zhong)端可(ke)(ke)以在該(gai)用(yong)(yong)戶(hu)終(zhong)端收集(ji)的(de)(de)數(shu)據(ju)(ju)(ju)中插(cha)入噪聲以對(dui)其(qi)進行混淆,然后將(jiang)其(qi)發送(song)給服務器。然而,隨著(zhu)收集(ji)的(de)(de)字(zi)(zi)符串數(shu)據(ju)(ju)(ju)的(de)(de)長(chang)度增加(jia),用(yong)(yong)戶(hu)終(zhong)端進行的(de)(de)混淆和(he)編碼(ma)過程以及服務器進行的(de)(de)恢復和(he)驗(yan)證過程可(ke)(ke)能(neng)會變得(de)復雜。
4、提出(chu)以(yi)上信(xin)息作為背景信(xin)息,僅用于輔助理解本公(gong)開。不確定(ding)也不斷言以(yi)上任何內容可用作有關本公(gong)開的現有技(ji)術。
技術實現思路
1、技術問題
2、本公開(kai)的(de)(de)各方面是為了(le)至少(shao)(shao)處理(li)上述(shu)問題和/或不利之處,以及(ji)(ji)至少(shao)(shao)提(ti)供以下(xia)描述(shu)的(de)(de)優(you)點。因(yin)此,本公開(kai)的(de)(de)一方面在于提(ti)供一種(zhong)電(dian)子裝置(zhi)及(ji)(ji)其操(cao)作方法,該電(dian)子裝置(zhi)即使在收(shou)集相(xiang)對較長(chang)的(de)(de)字(zi)符串(chuan)數(shu)據(ju)時(shi),也能夠確保字(zi)符串(chuan)數(shu)據(ju)的(de)(de)統計數(shu)據(ju)的(de)(de)安(an)全,同(tong)時(shi)滿足與現(xian)有技術類(lei)似(si)的(de)(de)差異化(hua)隱私水平。
3、本(ben)公(gong)開的另一方面在于提供一種服(fu)務器及(ji)其操作(zuo)方法(fa),該服(fu)務器能夠恢(hui)復并有效(xiao)地驗證從電子(zi)裝置(zhi)收集(ji)的相對較長的字符串數據(ju)。
4、附加方面將(jiang)部(bu)分(fen)地在(zai)以(yi)下(xia)(xia)描(miao)述(shu)(shu)中(zhong)闡述(shu)(shu),且(qie)部(bu)分(fen)地將(jiang)通(tong)過以(yi)下(xia)(xia)描(miao)述(shu)(shu)而變得清(qing)楚明白(bai),或者可以(yi)通(tong)過實踐(jian)所呈(cheng)現的實施(shi)例來(lai)獲知(zhi)。
5、技術方案
6、根(gen)據(ju)(ju)(ju)本公開的一方(fang)面,提(ti)供了一種(zhong)電(dian)子裝(zhuang)置(zhi)。該電(dian)子裝(zhuang)置(zhi)包括通(tong)信電(dian)路和與(yu)通(tong)信電(dian)路功能(neng)性連(lian)接(jie)的至少一個(ge)處理器(qi)(qi)。至少一個(ge)處理器(qi)(qi)可以(yi)被配置(zhi)為獲取要(yao)發(fa)送給服務器(qi)(qi)的數(shu)(shu)(shu)據(ju)(ju)(ju),向(xiang)數(shu)(shu)(shu)據(ju)(ju)(ju)插入(ru)指紋(wen),將(jiang)插入(ru)指紋(wen)的數(shu)(shu)(shu)據(ju)(ju)(ju)分(fen)(fen)割成(cheng)第一大小以(yi)生成(cheng)多(duo)個(ge)分(fen)(fen)段(duan)(duan)數(shu)(shu)(shu)據(ju)(ju)(ju),使得在(zai)多(duo)個(ge)分(fen)(fen)段(duan)(duan)數(shu)(shu)(shu)據(ju)(ju)(ju)中的相鄰分(fen)(fen)段(duan)(duan)數(shu)(shu)(shu)據(ju)(ju)(ju)之間復(fu)制第二大小的數(shu)(shu)(shu)據(ju)(ju)(ju),根(gen)據(ju)(ju)(ju)針對多(duo)個(ge)分(fen)(fen)段(duan)(duan)數(shu)(shu)(shu)據(ju)(ju)(ju)的預設(she)的每(mei)位(wei)置(zhi)選(xuan)擇概(gai)率從多(duo)個(ge)分(fen)(fen)段(duan)(duan)數(shu)(shu)(shu)據(ju)(ju)(ju)中選(xuan)擇一個(ge)分(fen)(fen)段(duan)(duan)數(shu)(shu)(shu)據(ju)(ju)(ju),并向(xiang)服務器(qi)(qi)發(fa)送通(tong)過混淆所選(xuan)的一個(ge)分(fen)(fen)段(duan)(duan)數(shu)(shu)(shu)據(ju)(ju)(ju)而生成(cheng)的報(bao)告。
7、根據(ju)(ju)本(ben)公開的(de)(de)(de)(de)另一方(fang)面,提供了一種服(fu)務器。該(gai)服(fu)務器包括(kuo)通(tong)信電路和與通(tong)信電路功能性(xing)連(lian)接的(de)(de)(de)(de)至少一個處理器。至少一個處理器可以被(bei)配置為(wei)(wei)通(tong)過(guo)(guo)通(tong)信電路從(cong)電子裝置接收被(bei)應(ying)用(yong)了混淆(xiao)算法的(de)(de)(de)(de)多個分(fen)段(duan)數(shu)(shu)(shu)(shu)據(ju)(ju),選(xuan)擇頻(pin)率超過(guo)(guo)預定值(zhi)的(de)(de)(de)(de)分(fen)段(duan)數(shu)(shu)(shu)(shu)據(ju)(ju),所(suo)述頻(pin)率是針對(dui)每個分(fen)段(duan)數(shu)(shu)(shu)(shu)據(ju)(ju)估(gu)計的(de)(de)(de)(de),通(tong)過(guo)(guo)基(ji)于所(suo)選(xuan)分(fen)段(duan)數(shu)(shu)(shu)(shu)據(ju)(ju)之間的(de)(de)(de)(de)復(fu)制數(shu)(shu)(shu)(shu)據(ju)(ju)拼接所(suo)選(xuan)分(fen)段(duan)數(shu)(shu)(shu)(shu)據(ju)(ju)來恢(hui)復(fu)候(hou)選(xuan)數(shu)(shu)(shu)(shu)據(ju)(ju),并基(ji)于恢(hui)復(fu)的(de)(de)(de)(de)候(hou)選(xuan)數(shu)(shu)(shu)(shu)據(ju)(ju)中包括(kuo)的(de)(de)(de)(de)數(shu)(shu)(shu)(shu)據(ju)(ju)部分(fen)和指紋(wen)部分(fen)獲取恢(hui)復(fu)的(de)(de)(de)(de)候(hou)選(xuan)數(shu)(shu)(shu)(shu)據(ju)(ju)作(zuo)為(wei)(wei)最終(zhong)數(shu)(shu)(shu)(shu)據(ju)(ju)。
8、根據(ju)本公開(kai)的(de)(de)(de)另(ling)一(yi)方(fang)面,提供了一(yi)種操(cao)作電子裝(zhuang)置的(de)(de)(de)方(fang)法。該(gai)方(fang)法包括(kuo):獲取要發送給服務器(qi)的(de)(de)(de)數(shu)據(ju),向(xiang)數(shu)據(ju)插(cha)入指紋,將(jiang)插(cha)入指紋的(de)(de)(de)數(shu)據(ju)分(fen)(fen)(fen)(fen)割成第(di)一(yi)大小以生成多(duo)個(ge)分(fen)(fen)(fen)(fen)段(duan)(duan)數(shu)據(ju),使得在多(duo)個(ge)分(fen)(fen)(fen)(fen)段(duan)(duan)數(shu)據(ju)中的(de)(de)(de)相鄰分(fen)(fen)(fen)(fen)段(duan)(duan)數(shu)據(ju)之間復制(zhi)第(di)二大小的(de)(de)(de)數(shu)據(ju),根據(ju)針(zhen)對(dui)多(duo)個(ge)分(fen)(fen)(fen)(fen)段(duan)(duan)數(shu)據(ju)的(de)(de)(de)預設的(de)(de)(de)每(mei)位置選(xuan)擇概率從多(duo)個(ge)分(fen)(fen)(fen)(fen)段(duan)(duan)數(shu)據(ju)中選(xuan)擇一(yi)個(ge)分(fen)(fen)(fen)(fen)段(duan)(duan)數(shu)據(ju),并向(xiang)服務器(qi)發送通過(guo)混淆所選(xuan)的(de)(de)(de)一(yi)個(ge)分(fen)(fen)(fen)(fen)段(duan)(duan)數(shu)據(ju)而(er)生成的(de)(de)(de)報(bao)告。
9、根據本公(gong)開的(de)另(ling)一方面,提(ti)供了一種操作服務器的(de)方法(fa)(fa)。該方法(fa)(fa)包(bao)括(kuo):從電子裝置接收被應用了混淆(xiao)算(suan)法(fa)(fa)的(de)多個分(fen)(fen)(fen)段(duan)(duan)數(shu)據,選(xuan)(xuan)(xuan)(xuan)擇(ze)頻率超過預定值的(de)分(fen)(fen)(fen)段(duan)(duan)數(shu)據,所述頻率是針對(dui)每個分(fen)(fen)(fen)段(duan)(duan)數(shu)據估(gu)計的(de),通過基于(yu)所選(xuan)(xuan)(xuan)(xuan)分(fen)(fen)(fen)段(duan)(duan)數(shu)據之間的(de)復制(zhi)數(shu)據拼接所選(xuan)(xuan)(xuan)(xuan)分(fen)(fen)(fen)段(duan)(duan)數(shu)據來恢復候(hou)(hou)選(xuan)(xuan)(xuan)(xuan)數(shu)據,并基于(yu)恢復的(de)候(hou)(hou)選(xuan)(xuan)(xuan)(xuan)數(shu)據中包(bao)括(kuo)的(de)數(shu)據部分(fen)(fen)(fen)和(he)指紋(wen)部分(fen)(fen)(fen)獲取恢復的(de)候(hou)(hou)選(xuan)(xuan)(xuan)(xuan)數(shu)據作為最終數(shu)據。
10、有利效果
11、根據本(ben)公開的(de)各種(zhong)實施例(li),電子裝(zhuang)置及其操作方(fang)法即使在收集(ji)相(xiang)對(dui)較長的(de)字符串數(shu)據時(shi),也(ye)可以確保字符串數(shu)據的(de)統計數(shu)據的(de)安全,同時(shi)滿足與現(xian)有技術類似的(de)差異化隱(yin)私水平。
12、根據(ju)本公開的(de)各種實施例(li),服務器及其操作方(fang)法可以恢復并有效(xiao)地驗證從電子裝(zhuang)置收集的(de)相對較長的(de)字符串數(shu)據(ju)。
13、通(tong)過以下結合(he)附(fu)圖(tu)公(gong)開(kai)了(le)本(ben)(ben)公(gong)開(kai)的(de)各種(zhong)實(shi)施例(li)的(de)詳細描述,本(ben)(ben)公(gong)開(kai)的(de)其他方面、優(you)點(dian)和顯著(zhu)特征對于本(ben)(ben)領域技術人(ren)員將變得清楚明(ming)白。
1.一種(zhong)電子裝置,包括:
2.根據(ju)權(quan)利要(yao)求1所(suo)述(shu)的(de)電(dian)子裝(zhuang)置,其中,所(suo)述(shu)第二大小被設置為(wei)小于(yu)所(suo)述(shu)第一大小的(de)值。
3.根據權利要求1所(suo)(suo)(suo)述(shu)的電子(zi)裝置,其中,所(suo)(suo)(suo)述(shu)報告包括關于所(suo)(suo)(suo)述(shu)所(suo)(suo)(suo)選的一個分段數據的位置信息。
4.根(gen)據(ju)權利要求1所述的電子(zi)裝置,
5.根據權利(li)要(yao)求1所述(shu)的(de)電子(zi)裝置,其中,所述(shu)處理(li)器:
6.一種(zhong)服務器,包(bao)括(kuo):
7.根據權(quan)利要求6所(suo)述(shu)的服務(wu)器,其中,所(suo)述(shu)報(bao)告包括(kuo)關于(yu)所(suo)述(shu)分段數據的位置信息(xi)。
8.根據權利要求6所述的服務器(qi),
9.一(yi)種(zhong)用于(yu)操作電子裝置的方(fang)法,所述方(fang)法包括:
10.根據權利要(yao)求9所述(shu)的方法,其中(zhong),所述(shu)第二大小被(bei)設(she)置為(wei)小于所述(shu)第一大小的值,
11.根據(ju)權利要(yao)求(qiu)9所述的方法,
12.根據權(quan)利(li)要求(qiu)9所述(shu)(shu)的方法,其中,插入(ru)所述(shu)(shu)指紋(wen)包括(kuo):
13.一種用(yong)于(yu)操作服務(wu)器的方法,所(suo)述方法包括:
14.根(gen)據權(quan)利要求13所(suo)(suo)述(shu)的方法,其中,所(suo)(suo)述(shu)報告包括關于所(suo)(suo)述(shu)分段(duan)數據的位置信息(xi)。
15.根據權利(li)要求13所述的方法,