一種敏感數據識別方法和裝置的制造方法
【專利摘要】本發明實施例涉及信息安全領域,尤其涉及一種敏感數據識別方法和裝置,用以高效識別敏感數據。本發明實施例中,接收數據操作指令,數據操作指令用于指示根據第一操作對象生成第二操作對象;獲取第一操作對象中的敏感數據的第一位置信息;根據第二操作對象的數據結構以及第一位置信息,確定第二操作對象中的敏感數據的第二位置信息。由于第二操作對象由第一操作對象生成,從而可追蹤到第一操作對象中的數據在第二操作對象中的相應位置信息;進一步由于獲取了第一操作對象中的第一位置信息,因此可確定出第一操作對象中的敏感數據在第二操作對象中相對應的第二位置信息,進一步提高了識別敏感數據的效率。
【專利說明】
一種敏感數據識別方法和裝置
技術領域
[0001] 本發明實施例涉及信息安全領域,尤其涉及一種敏感數據識別方法和裝置。
【背景技術】
[0002] 敏感數據一般指用戶的隱私信息,電信運營商擁有大量用戶的隱私信息,不同用 戶對敏感數據進行操作時,經常會造成敏感數據的泄露,這不僅對運營商自身的核心機密、 同行業競爭力和市場聲譽造成了嚴重的影響,也對用戶的隱私和個人信息安全造成不同程 度的危害。因此,在整個數據生命周期中,識別敏感數據,以便對敏感數據進行模糊化處理 成為重中之重。
[0003]目前針對數據庫數據進行敏感識別,主要采用內容特征匹配方式,即根據預先設 置的關鍵字,對待識別數據進行匹配,識別出敏感數據后對敏感數據進行加密或模糊化處 理,以預防敏感數據的泄露。
[0004] 在具體實施過程中,數據表處于經常被訪問狀態,且會經常基于已有數據表產生 新數據表,當基于已有數據表產生新的數據表時,對新產生的數據表進行敏感數據識別時, 仍舊需要將新產生的數據表中的數據內容與關鍵字一個個進行匹配;若同時產生幾百個新 的數據表,則以現有技術的內容特征匹配的方式識別敏感數據的方式效率較低。
[0005] 綜上所述,亟需一種敏感數據識別方法和裝置,用以高效識別敏感數據。
【發明內容】
[0006] 本發明實施例提供一種敏感數據識別方法和裝置,用以高效識別敏感數據。
[0007] 本發明實施例提供的終端側實現的一種敏感數據識別方法,包括以下步驟:
[0008] 接收數據操作指令,數據操作指令用于指示根據第一操作對象生成第二操作對 象;
[0009] 獲取第一操作對象中的敏感數據的第一位置信息;
[0010] 執行數據操作指令得到第二操作對象,并根據第二操作對象的數據結構以及第一 位置信息,確定第二操作對象中的敏感數據的第二位置信息;
[0011] 根據第二位置信息,將第二操作對象中相應位置的數據確定為敏感數據。
[0012] 較佳的,第一位置信息為第一操作對象中的敏感數據所在位置的位置編碼;
[0013] 獲取第一操作對象中的敏感數據的第一位置信息,具體包括:
[0014] 將第一操作對象中所有數據的位置按預設規則轉換為對應的位置編碼;
[0015] 查詢預先設置的敏感數據表;其中,敏感數據表中包含第一操作對象的標識信息 以及第一操作對象中的N個敏感數據所在位置的N個位置編碼,N個位置編碼按照預設規 則由N個敏感數據所在的位置轉換得到,N為大于等于1的整數;
[0016] 判斷轉換后的位置編碼中是否存在與敏感數據表中第一操作對象對應的位置編 碼匹配的位置編碼,若是,則將與敏感數據表匹配的位置編碼確定為第一操作對象中的敏 感數據所在位置的位置編碼。
[0017] 較佳的,與敏感數據表匹配的位置編碼,是指:
[0018] 第一位置信息對應的位置編碼與敏感數據表的位置編碼完全匹配,或者,第一位 置信息對應的位置編碼與敏感數據表的位置編碼部分匹配。
[0019] 較佳的,針對敏感數據表中包含的第一操作對象中的N個敏感數據所在位置的N 個位置編碼,敏感數據表中還包括每個位置編碼所對應的多個操作碼;
[0020] 根據第二操作對象的數據結構以及第一位置信息,確定第二操作對象中的敏感數 據的第二位置信息,具體包括:
[0021] 根據數據操作指令中第一操作對象的標識信息和操作指令的操作碼,查詢敏感數 據表;
[0022] 根據查詢結果判斷敏感數據表中與第一位置信息匹配的位置編碼對應的操作碼 中是否存在數據操作指令中包含的操作碼;
[0023] 若是,則根據第二操作對象的數據結構以及第一位置信息,確定第二操作對象中 的敏感數據的第二位置信息。
[0024] 較佳的,根據第二位置信息,將第二操作對象中相應位置的數據確定為敏感數據 之后,還包括:
[0025] 在敏感數據表中查詢第一位置信息所對應的操作碼;
[0026] 在敏感數據表中添加第二操作對象的標識信息、第二位置信息,以及查詢到的第 一位置信息所對應的操作碼,并建立三者的對應關系。
[0027] 較佳的,第一操作對象為第一數據表,第二操作對象為第二數據表;
[0028] 數據操作指令為以下幾項中的一種:
[0029] 將第一數據表復制為第二數據表;
[0030] 將第一數據表剪切為第二數據表;
[0031] 將第一數據表另存為第二數據表。
[0032] 本發明實施例中由于數據操作指令用于指示根據第一操作對象生成第二操作對 象,因此第二操作對象由第一操作對象生成,從而可追蹤到第一操作對象中的數據在第二 操作對象中的相應位置信息;進一步由于獲取了第一操作對象中的敏感數據的第一位置信 息,因此結合追蹤到的第一操作對象中的數據在第二操作對象中的相應位置信息,可確定 出第一操作對象中的敏感數據在第二操作對象中相對應的位置,該位置即為第二操作對象 中的敏感數據的第二位置信息,可見,通過位置特征匹配的方式可快速識別出新生成的第 二操作對象中的敏感數據,進一步提高了識別敏感數據的效率。
[0033] 本發明實施例提供一種敏感數據識別裝置,包括接收單元、處理單元:
[0034] 接收單元,用于接收數據操作指令,數據操作指令用于指示根據第一操作對象生 成第二操作對象;
[0035] 處理單元,用于獲取第一操作對象中的敏感數據的第一位置信息;執行數據操作 指令得到第二操作對象,并根據第二操作對象的數據結構以及第一位置信息,確定第二操 作對象中的敏感數據的第二位置信息;根據第二位置信息,將第二操作對象中相應位置的 數據確定為敏感數據。
[0036] 較佳的,第一位置信息為第一操作對象中的敏感數據所在位置的位置編碼;
[0037] 處理單元,具體用于:
[0038] 將第一操作對象中所有數據的位置按預設規則轉換為對應的位置編碼;
[0039] 查詢預先設置的敏感數據表;其中,敏感數據表中包含第一操作對象的標識信息 以及第一操作對象中的N個敏感數據所在位置的N個位置編碼,N個位置編碼按照預設規 則由N個敏感數據所在的位置轉換得到,N為大于等于1的整數;
[0040] 判斷轉換后的位置編碼中是否存在與敏感數據表中第一操作對象對應的位置編 碼匹配的位置編碼,若是,則將與敏感數據表匹配的位置編碼確定為第一操作對象中的敏 感數據所在位置的位置編碼。
[0041] 較佳的,與敏感數據表匹配的位置編碼,是指:
[0042] 第一位置信息對應的位置編碼與敏感數據表的位置編碼完全匹配,或者,第一位 置信息對應的位置編碼與敏感數據表的位置編碼部分匹配。
[0043] 較佳的,針對敏感數據表中包含的第一操作對象中的N個敏感數據所在位置的N 個位置編碼,敏感數據表中還包括每個位置編碼所對應的多個操作碼;
[0044] 處理單元,具體用于:
[0045] 根據數據操作指令中第一操作對象的標識信息和操作指令的操作碼,查詢敏感數 據表;
[0046] 根據查詢結果判斷敏感數據表中與第一位置信息匹配的位置編碼對應的操作碼 中是否存在數據操作指令中包含的操作碼;
[0047] 若是,則根據第二操作對象的數據結構以及第一位置信息,確定第二操作對象中 的敏感數據的第二位置信息。
[0048] 較佳的,處理單元,還用于:
[0049] 在敏感數據表中查詢第一位置信息所對應的操作碼;
[0050] 在敏感數據表中添加第二操作對象的標識信息、第二位置信息,以及查詢到的第 一位置信息所對應的操作碼,并建立三者的對應關系。
[0051] 較佳的,第一操作對象為第一數據表,第二操作對象為第二數據表;
[0052] 數據操作指令為以下幾項中的一種:
[0053] 將第一數據表復制為第二數據表;
[0054] 將第一數據表剪切為第二數據表;
[0055] 將第一數據表另存為第二數據表。
[0056] 本發明實施例中,接收數據操作指令,數據操作指令用于指示根據第一操作對象 生成第二操作對象;獲取第一操作對象中的敏感數據的第一位置信息;執行數據操作指令 得到第二操作對象,并根據第二操作對象的數據結構以及第一位置信息,確定第二操作對 象中的敏感數據的第二位置信息;根據第二位置信息,將第二操作對象中相應位置的數據 確定為敏感數據。
[0057] 由于數據操作指令用于指示根據第一操作對象生成第二操作對象,因此第二操作 對象由第一操作對象生成,從而可追蹤到第一操作對象中的數據在第二操作對象中的相應 位置信息;進一步由于獲取了第一操作對象中的敏感數據的第一位置信息,因此結合追蹤 到的第一操作對象中的數據在第二操作對象中的相應位置信息,可確定出第一操作對象中 的敏感數據在第二操作對象中相對應的位置,該位置即為第二操作對象中的敏感數據的第 二位置信息,可見,通過位置特征匹配的方式可快速識別出新生成的第二操作對象中的敏 感數據,進一步提高了識別敏感數據的效率。
【附圖說明】
[0058] 為了更清楚地說明本發明實施例中的技術方案,下面將對實施例描述中所需要使 用的附圖作簡要介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本 領域的普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其 他的附圖。
[0059] 圖1為本發明實施例提供的一種敏感數據識別方法流程示意圖;
[0060] 圖2為本發明實施例提供的一種敏感數據識別裝置的結構示意圖。
【具體實施方式】
[0061] 為了使本發明的目的、技術方案及有益效果更加清楚明白,以下結合附圖及實施 例,對本發明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本發 明,并不用于限定本發明。
[0062] 本發明實施例所適用的應用場景可為多種,本發明實施例不做限制。本發明實施 例中以下應用場景為例進行介紹,如根據第一操作對象生成第二操作對象,即第一操作對 象中的數據需迀移、或發生改變之后迀移至第二操作對象中。較佳的,第一操作對象中的數 據可部分或全部迀移、或發生改變之后迀移至第二操作對象中。
[0063] 本發明實施例中以下述假設為前提進行介紹,本領域技術人員可知,不限于此。
[0064] 本發明實施例中的"多個"可為一個或多個。
[0065] 較佳的,本發明實施例中基于當前數據庫中的全部已有數據設置敏感數據表,本 發明實施例中假設數據庫中存儲數據表,已知所有數據表中每個數據表中的敏感數據的位 置信息,且通過人工判斷該每個數據表中的每個敏感數據所對應的操作碼,即該數據表中 的哪些數據在哪些對應的操作碼下才為敏感數據。此時,基于此信息設置該敏感數據表,該 敏感數據表包括多個操作對象標識,該不同操作對象標識對應不同的數據表,每個操作對 象標識對應多個該操作對象中的敏感數據的位置信息,且每個操作對象標識所對應的每個 該操作對象中的敏感數據對應多個操作碼。
[0066] 舉個例子,示例一,假設數據庫中包括三個數據表,已知數據表1中對應第一列的 "身份證號"信息在"復制"操作碼的作用下為敏感數據,表示表1中的"身份證號"信息在進 行"復制"操作時,比較重要,或容易發生泄漏,因此需將"身份證號"信息在對應"復制"操 作碼時設置為敏感數據,以便于后期在對表1進行"復制"操作時,將敏感數據"身份證號" 識別出來,并將該敏感數據進行加密或模糊化處理,以提高該數據的安全性。
[0067] 同樣的,假設數據表1中對應第二列的"電話號碼"信息在"復制"和"剪切"操作 碼的作用下為敏感數據;數據表2中對應的二列"姓名"信息在"另存為"操作碼的作用下 為敏感數據;數據表3中對應的第一列的第二行至第五行的"地址"信息在"另存為"操作 碼的作用下為敏感數據。
[0068] 將該示例一中的敏感數據表在表1中列出,如下:
[0069] 表1示例一中的敏感數據表
[0070]
[0071] 基于上述內容,圖1示出了本發明實施例提供的終端側實現的一種敏感數據識別 方法,包括以下步驟:
[0072] 步驟101,接收數據操作指令,數據操作指令用于指示根據第一操作對象生成第二 操作對象;
[0073] 步驟102,獲取第一操作對象中的敏感數據的第一位置信息;
[0074] 步驟103,執行數據操作指令得到第二操作對象,并根據第二操作對象的數據結構 以及第一位置信息,確定第二操作對象中的敏感數據的第二位置信息;
[0075] 步驟104,根據第二位置信息,將第二操作對象中相應位置的數據確定為敏感數 據。
[0076] 較佳的,本發明實施例中第一操作對象中的敏感數據的第一位置信息為第一操作 對象中的敏感數據所在位置的位置編碼,該位置編碼通過將第一操作對象中所有數據的位 置按所述預設規則轉換得到。同樣的,本發明實施例中第二操作對象中的敏感數據的第二 位置信息為第二操作對象中的敏感數據所在位置的位置編碼,該位置編碼通過將第二操作 對象中所有數據的位置按所述預設規則轉換得到。基于前述內容可知,敏感數據中存儲也 為敏感數據對應的位置信息,該位置信息為該敏感數據所在的位置按所述預設規則轉換得 到的位置編碼。
[0077] 較佳的,本發明實施例中根據數據的具體位置,將其位置轉換為位置編碼的"預設 規則"應一致,且將任一數據根據該"預設規則"轉換得到該數據的位置編碼后,該位置編碼 應能唯一確定出該數據的位置。的數據的位置本發明實施例對"預設規則"的具體內容不 做限制。
[0078] 舉一個例子,介紹本發明實施例中將數據對應位置信息按照"預設規則"轉換為位 置編碼的過程。
[0079] 假設預設規則為通過一個20位的整數定義某個敏感數據所在的位置,分四段,第 一段表示該敏感數據所在的域,第二段表示該敏感數據所在的庫,第三段表示該敏感數據 所在的表,第四段表示該敏感數據所在的該表中的具體位置。
[0080] 例如:該敏感數據位于CRM系統CRMDB11庫中Customer表的第一列,
[0081] 預設規則為中,CRM系統用10001表示,CRDBll庫用9273表示,Customer表用89 表示,第一列用1表示,則該敏感數據可用以下位置編碼唯一指定該敏感數據的位置:
[0082] 10001*103*5+9273*10W5+89*10 1>N5+1*10W5= 008900001
[0083] 通過上述示例詳細介紹了將數據根據預設規則轉換為該數據對應的
[0084] 較佳的,第一位置信息為第一操作對象中的敏感數據所在位置的位置編碼。將第 一操作對象中所有數據的位置按預設規則轉換為對應的位置編碼;查詢預先設置的敏感數 據表;其中,敏感數據表中包含第一操作對象的標識信息以及第一操作對象中的N個敏感 數據所在位置的N個位置編碼,N個位置編碼按照預設規則由N個敏感數據所在的位置轉 換得到,N為大于等于1的整數;判斷轉換后的位置編碼中是否存在與敏感數據表中第一操 作對象對應的位置編碼匹配的位置編碼,若是,則將與敏感數據表匹配的位置編碼確定為 第一操作對象中的敏感數據所在位置的位置編碼。
[0085] 具體來說,獲取第一操作對象中的敏感數據的第一位置信息時,可根據預先設置 的敏感數據表獲取。本發明實施例中的第一操作對象的敏感數據對應的位置信息已經預設 在敏感數據表中,即敏感數據表中包含第一操作對象的標識信息以及第一操作對象中的N 個敏感數據所在位置的N個位置編碼,N個位置編碼按照預設規則由N個敏感數據所在的 位置轉換得到,N為大于等于1的整數。
[0086] 首先將第一操作對象中所有數據的位置按預設規則轉換為對應的位置編碼,該預 設規則與敏感數據表中所提及的預設規則為同一規則。查詢并判斷第一操作對象的轉換后 的位置編碼中是否存在與敏感數據表中第一操作對象對應的位置編碼匹配的位置編碼,即 判斷敏感數據表中是否定義了第一操作對象的某些位置為敏感數據所在的位置。若是,則 將與敏感數據表匹配的位置編碼確定為第一操作對象中的敏感數據所在位置的位置編碼。
[0087] 由于數據在經常訪問的過程中,可能會改變內容特征,如某一敏感數據經常被訪 問,因此該敏感數據的內容被重新組織,該敏感數據可能被加密,但該敏感數據的位置并未 發生變化,此時,若使用現有技術中的內容匹配的方式來識別該敏感數據,則由于該敏感數 據內容已發生變化,因此不能識別出。但使用本發明實施例所提供的方法就可迅速識別出 即使內容發生變化的敏感數據。
[0088] 舉一個例子,由于本發明實施例中已經預先設置某個字段為敏感字段,且在敏感 數據表中將該敏感字段對應的位置信息進行存儲,當后續對該敏感數據進行訪問時,由于 該敏感數據的位置未發生變化,因此可查詢敏感數據表,從而快速確定該敏感數據所在的 位置為已定義過的敏感數據對應的位置,因此將該位置對應的數據確定為敏感數據。可見, 本發明實施例中根據敏感數據的位置特征對敏感數據進行匹配,即使敏感數據的內容發生 改變,本發明實施例也可高效識別敏感數據。
[0089] 通過上述示例可見,本發明實施例也適用于另一種情況,即僅對第一操作對象進 行一些操作,并未根據第一操作對象生成第二操作對象,此時也可查詢敏感數據表中預先 設置的敏感數據的對應的位置信息,并根據敏感數據表中預先設置的敏感數據,確定第一 操作對象中是否存在敏感數據。僅對第一操作對象進行一些操作,并未根據第一操作對象 生成第二操作對象的操作有很多,例如:查詢、修改、刪除等。
[0090] 較佳的,第一操作對象為第一數據表,第二操作對象為第二數據表。較佳的,本發 明實施例中所定義的第一操作對象的敏感數據可為第一數據表中某一列,或為第一數據表 中的幾列、幾列的幾行、幾行,或為第一數據表中某幾列的某幾個字段,同樣的,本發明實施 例中所定義的第二操作對象的敏感數據可為第二數據表中某一列,或為第一數據表中的幾 列、幾列的幾行、幾行,或為第二數據表中某幾列的某幾個字段。
[0091] 較佳的,本發明實施例中的數據操作指令為以下幾項中的一種:將第一數據表復 制為第二數據表;將第一數據表剪切為第二數據表;將第一數據表另存為第二數據表。本 發明實施例中的第二操作對象為對第一操作對象執行數據操作指令所得到的。
[0092] 較佳的,與敏感數據表匹配的位置編碼,是指:第一位置信息對應的位置編碼與敏 感數據表的位置編碼完全匹配,或者,第一位置信息對應的位置編碼與敏感數據表的位置 編碼部分匹配。
[0093] 具體來說,本發明實施例中的位置編碼為分段的編碼,不同的段代表不同的數據 范圍級別,為了擴大搜索范圍,可確定出第一操作對象中的第一位置信息與敏感數據表部 分匹配的數據,并將該與敏感數據表部分匹配的數據確定為敏感數據。
[0094] 舉一個例子,假設第一位置信息為位于CRM系統CRMDB11庫中Customer表的第一 列,CRM系統用10001表示,CRDBll庫用9273表示,Customer表用89表示,第一列用1表 示,則該第一位置信息可用以下位置編碼唯一指定該敏感數據的位置:10001 09273 00089 00001。此時需要查詢CRM系統中的所有庫的Customer表的敏感數據,此時將10001 09273 00089 00001中代表庫的9273忽略,例如,可通過掩碼將9273掩去,此時敏感數據表中 的CRM系統所有庫中Customer表的第一列的位置碼為10001 00000 00089 00001,所有 庫00000即表示該敏感數據的位置碼中的庫不做限定,此時該位置碼10001 00000 00089 00001可用于匹配CRM系統中的所有庫的Customer表的第一列的敏感數據。
[0095] 可見,第一位置信息對應的位置編碼與敏感數據表的位置編碼部分匹配時,可擴 大搜索范圍,較佳的,可迅速確定同樣數據結構的數據表中的敏感數據。第一位置信息對應 的位置編碼與敏感數據表的位置編碼完全匹配,則可提高匹配精度。
[0096] 本發明實施例中所提到的用掩碼方式將位置編碼中的某一段掩去,為現有技術, 在此做簡略介紹。掩碼即使用一段位數相同的字符替代原位置編碼的某一段,例如將原 位置編碼中的代表庫的某一段字符更換為掩碼,則在匹配過程中,會忽略待匹配字符中代 表庫的那段字符。例如,上述示例中敏感數據表中的位置編碼10001 〇〇〇〇〇 00089 00001 可與待匹配數據的位置編碼為10001 02101 00089 00001匹配,此時即確定10001 02101 00089 00001所對應的數據為敏感數據。
[0097] 較佳的,針對敏感數據表中包含的第一操作對象中的N個敏感數據所在位置的N 個位置編碼,敏感數據表中還包括每個位置編碼所對應的多個操作碼;
[0098] 根據第二操作對象的數據結構以及第一位置信息,確定第二操作對象中的敏感數 據的第二位置信息,具體過程如下:
[0099] 根據數據操作指令中第一操作對象的標識信息和操作指令的操作碼,查詢敏感數 據表;根據查詢結果判斷敏感數據表中與第一位置信息匹配的位置編碼對應的操作碼中是 否存在數據操作指令中包含的操作碼;若是,則根據第二操作對象的數據結構以及第一位 置信息,確定第二操作對象中的敏感數據的第二位置信息。
[0100] 具體來說,本發明實施例中敏感數據表中包含的第一操作對象中的N個敏感數據 所在位置的N個位置編碼,敏感數據表中還包括每個位置編碼所對應的多個操作碼,具體 來說,多個操作碼可為一個或多個。
[0101] 較佳的,根據查詢結果判斷敏感數據表中與第一位置信息匹配的位置編碼對應的 操作碼中是否存在數據操作指令中包含的操作碼,也可依據其它操作指令的相關參數來進 行輔助判定。例如,其它操作指令的相關參數可為數據操作指令主體、操作碼參數、數據操 作指令的處理通道、數據操作指令中多個操作碼的前后關聯性、數據操作指令所處的時間、 數據操作指令所對應的操作行為持續時間等。
[0102] 通過這些其它操作指令的相關參數可幫助更加精確的判斷該數據操作指令所對 應的操作碼,較佳的,在敏感數據的中預先為敏感數據的位置編碼對應設置操作碼時,可增 加該操作碼相關的輔助參數信息。
[0103] 較佳的,本發明實施例中的操作對象的標識信息即為數據操作指令中的被執行對 象的標識,例如數據操作指令中對CRM系統CRMDB11庫中Customer表進行操作,則CRM系 統CRMDBl 1庫中Customer表即為操作對象的標識信息,根據該操作對象的標識信息進一步 確定該操作對象在敏感數據表中所對應的敏感數據信息的位置編碼。
[0104] 較佳的,本發明實施例中可將每次數據操作指令對應的標識號,以及該數據操作 指令所對應的敏感數據的位置編碼,以及該數據操作示例對應的操作碼均記錄到實時活動 表中,通過實時活動表能夠實時管理掌握當前正在執行的數據操作指令,以及該數據操作 指令的執行過程中需要關注的敏感數據,當用戶執行該數據操作指令結束時,將該次數據 操作指令從實時活動表中刪除。
[0105] 實時活動表如表2所示。
[0106] 表2實時活動表示例
[0108] 較佳的,在根據第一操作對象生成第二操作對象之后,確定第二操作對象中的敏 感數據所在位置對應的位置編碼之后,在敏感數據表中查詢第一位置信息所對應的操作 碼;在敏感數據表中添加第二操作對象的標識信息、第二位置信息,以及查詢到的第一位置 信息所對應的操作碼,并建立三者的對應關系。
[0109] 具體來說,由于第二操作對象為新增的數據,因此較佳的,將其添加到敏感數據表 中,在敏感數據表中添加第二操作對象的標識信息,以及第二操作對象對應的第二位置信 息,即第二操作對象對應的敏感數據所在位置對應的位置編碼。進一步由于第二操作對象 中的敏感數據為第一操作對象上的敏感數據轉移而來,因此第一操作對象中與第二操作對 象的第二位置信息所匹配的第一位置信息所對應的操作碼同樣也對應第二操作對象中的 第二位置信息,因此,對應的在敏感數據表中將第一位置信息所對應的操作碼對應配置為 第二位置信息所對應的操作碼。
[0110] 下面舉一個具體的實施例用以闡述上述過程:
[0111] 假設數據操作指令為將第一操作對象復制為第二操作對象,第一操作對象為第1 域的第2庫的數據表1,第二操作對象為第1域的第2庫的數據表2。數據操作指令中的操 作碼為"復制"。假設第一操作對象中的第一列"姓名"為敏感數據,即第一操作對象在敏 感數據中的位置為"第1域的第2庫的數據表1第一列",編碼假設為00001 00002 00001 OOOOlo
[0112] 具體識別過程為,接收數據操作指令,確定該數據操作指令的對象"第一操作對 象",將該第一操作對象中的數據的位置對應轉換為位置編碼,確定敏感數據表中第一操作 對象標識為第1域的第2庫的數據表1的位置編碼,即為00001 00002 00001 00000,根據 該第一操作對象標識確定該第一操作對象標識所對應的敏感數據的位置編碼。根據上述假 設,確定出敏感數據表中,第一操作對象對應的敏感數據的位置編碼為00001 00002 00001 OOOOlo
[0113] 將第一操作對象中數據的位置按預設規則轉換后位置編碼與敏感數據表中第一 操作對象對應的敏感數據的位置編碼進行匹配,將匹配成功的第一操作對象中位置編碼 00001 00002 00001 00001 確定出來;
[0114] 進一步確定敏感數據表中改第一操作對象對應的敏感數據的位置編碼所對應的 操作碼為"復制",而本數據操作指令中的操作碼也為"復制"。
[0115] 因此,將匹配成功的第一操作對象中位置編碼00001 00002 00001 00001確定為 第一位置信息;
[0116] 執行所述數據操作指令得到第二操作對象,即將第一操作對象復制為第二操作對 象,在此過程中可追蹤到第一操作對象中各個位置的數據在第二操作對象中對應的位置, 例如,第一操作對象中的第一列對應復制到第二操作對象的第一列。
[0117] 此時根據第一位置信息00001 00002 00001 00001現迀移至第二操作對象的第 二位置信息,第二位置信息即為第二操作對象的第一列,因此,第二位置信息對應的位置編 碼為"第1域的第2庫的數據表2第一列"的位置編碼00001 00002 00002 00001,進一步 將第二位置信息00001 00002 00002 00001所對應的數據確定為敏感數據。
[0118] 之后將新生的第二操作對象添加至敏感數據庫中,將第二操作對象標識"第1域 的第2庫的數據表2"添加至敏感數據表,并對應為該第二操作對象標識配置第二操作對象 中的敏感數據對應的第二位置信息的位置編碼00001 00002 00002 00001,并未第二位置 信息對應配置第一位置信息所對應的操作碼"復制"。
[0119] 綜上所述,本發明實施例中由于數據操作指令用于指示根據第一操作對象生成第 二操作對象,因此第二操作對象由第一操作對象生成,從而可追蹤到第一操作對象中的數 據在第二操作對象中的相應位置信息;進一步由于獲取了第一操作對象中的敏感數據的 第一位置信息,因此結合追蹤到的第一操作對象中的數據在第二操作對象中的相應位置信 息,可確定出第一操作對象中的敏感數據在第二操作對象中相對應的位置,該位置即為第 二操作對象中的敏感數據的第二位置信息,可見,通過位置特征匹配的方式可快速識別出 新生成的第二操作對象中的敏感數據,進一步提高了識別敏感數據的效率。
[0120] 基于相同構思,如圖2所示,本發明實施例提供一種敏感數據識別裝置,包括接收 單元201、處理單元202 :
[0121] 接收單元201,用于接收數據操作指令,數據操作指令用于指示根據第一操作對象 生成第二操作對象;
[0122] 處理單元202,用于獲取第一操作對象中的敏感數據的第一位置信息;執行數據 操作指令得到第二操作對象,并根據第二操作對象的數據結構以及第一位置信息,確定第 二操作對象中的敏感數據的第二位置信息;根據第二位置信息,將第二操作對象中相應位 置的數據確定為敏感數據。
[0123] 較佳的,第一位置信息為第一操作對象中的敏感數據所在位置的位置編碼;
[0124] 處理單元202,具體用于:
[0125] 將第一操作對象中所有數據的位置按預設規則轉換為對應的位置編碼;
[0126] 查詢預先設置的敏感數據表;其中,敏感數據表中包含第一操作對象的標識信息 以及第一操作對象中的N個敏感數據所在位置的N個位置編碼,N個位置編碼按照預設規 則由N個敏感數據所在的位置轉換得到,N為大于等于1的整數;
[0127] 判斷轉換后的位置編碼中是否存在與敏感數據表中第一操作對象對應的位置編 碼匹配的位置編碼,若是,則將與敏感數據表匹配的位置編碼確定為第一操作對象中的敏 感數據所在位置的位置編碼。
[0128] 較佳的,與敏感數據表匹配的位置編碼,是指:
[0129] 第一位置信息對應的位置編碼與敏感數據表的位置編碼完全匹配,或者,第一位 置信息對應的位置編碼與敏感數據表的位置編碼部分匹配。
[0130] 較佳的,針對敏感數據表中包含的第一操作對象中的N個敏感數據所在位置的N 個位置編碼,敏感數據表中還包括每個位置編碼所對應的多個操作碼;
[0131] 處理單元202,具體用于:
[0132] 根據數據操作指令中第一操作對象的標識信息和操作指令的操作碼,查詢敏感數 據表;
[0133] 根據查詢結果判斷敏感數據表中與第一位置信息匹配的位置編碼對應的操作碼 中是否存在數據操作指令中包含的操作碼;
[0134] 若是,則根據第二操作對象的數據結構以及第一位置信息,確定第二操作對象中 的敏感數據的第二位置信息。
[0135] 較佳的,處理單元202,還用于:
[0136] 在敏感數據表中查詢第一位置信息所對應的操作碼;
[0137] 在敏感數據表中添加第二操作對象的標識信息、第二位置信息,以及查詢到的第 一位置信息所對應的操作碼,并建立三者的對應關系。
[0138] 較佳的,第一操作對象為第一數據表,第二操作對象為第二數據表;
[0139] 數據操作指令為以下幾項中的一種:
[0140] 將第一數據表復制為第二數據表;
[0141] 將第一數據表剪切為第二數據表;
[0142] 將第一數據表另存為第二數據表。
[0143] 從上述內容可以看出:本發明實施例中由于數據操作指令用于指示根據第一操作 對象生成第二操作對象,因此第二操作對象由第一操作對象生成,從而可追蹤到第一操作 對象中的數據在第二操作對象中的相應位置信息;進一步由于獲取了第一操作對象中的敏 感數據的第一位置信息,因此結合追蹤到的第一操作對象中的數據在第二操作對象中的相 應位置信息,可確定出第一操作對象中的敏感數據在第二操作對象中相對應的位置,該位 置即為第二操作對象中的敏感數據的第二位置信息,可見,通過位置特征匹配的方式可快 速識別出新生成的第二操作對象中的敏感數據,進一步提高了識別敏感數據的效率。
[0144] 本領域內的技術人員應明白,本發明的實施例可提供為方法、或計算機程序產品。 因此,本發明可采用完全硬件實施例、完全軟件實施例、或結合軟件和硬件方面的實施例的 形式。而且,本發明可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存 儲介質(包括但不限于磁盤存儲器、CD-ROM、光學存儲器等)上實施的計算機程序產品的形 式。
[0145] 本發明是參照根據本發明實施例的方法、設備(系統)、和計算機程序產品的流程 圖和/或方框圖來描述的。應理解可由計算機程序指令實現流程圖和/或方框圖中的每一 流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合。可提供這些計算 機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數據處理設備的處理 器以產生一個機器,使得通過計算機或其他可編程數據處理設備的處理器執行的指令產生 用于實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能 的裝置。
[0146] 這些計算機程序指令也可存儲在能引導計算機或其他可編程數據處理設備以特 定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產生包括指 令裝置的制造品,該指令裝置實現在流程圖一個流程或多個流程和/或方框圖一個方框或 多個方框中指定的功能。
[0147] 這些計算機程序指令也可裝載到計算機或其他可編程數據處理設備上,使得在計 算機或其他可編程設備上執行一系列操作步驟以產生計算機實現的處理,從而在計算機或 其他可編程設備上執行的指令提供用于實現在流程圖一個流程或多個流程和/或方框圖 一個方框或多個方框中指定的功能的步驟。
[0148] 盡管已描述了本發明的優選實施例,但本領域內的技術人員一旦得知了基本創造 性概念,則可對這些實施例作出另外的變更和修改。所以,所附權利要求意欲解釋為包括優 選實施例以及落入本發明范圍的所有變更和修改。
[0149] 顯然,本領域的技術人員可以對本發明進行各種改動和變型而不脫離本發明的精 神和范圍。這樣,倘若本發明的這些修改和變型屬于本發明權利要求及其等同技術的范圍 之內,則本發明也意圖包含這些改動和變型在內。
【主權項】
1. 一種敏感數據識別方法,其特征在于,包括以下步驟: 接收數據操作指令,所述數據操作指令用于指示根據第一操作對象生成第二操作對 象; 獲取所述第一操作對象中的敏感數據的第一位置信息; 執行所述數據操作指令得到第二操作對象,并根據所述第二操作對象的數據結構以及 所述第一位置信息,確定所述第二操作對象中的所述敏感數據的第二位置信息; 根據所述第二位置信息,將所述第二操作對象中相應位置的數據確定為敏感數據。2. 如權利要求1所述的方法,其特征在于,所述第一位置信息為第一操作對象中的敏 感數據所在位置的位置編碼; 所述獲取所述第一操作對象中的敏感數據的第一位置信息,具體包括: 將第一操作對象中所有數據的位置按所述預設規則轉換為對應的位置編碼; 查詢預先設置的敏感數據表;其中,所述敏感數據表中包含所述第一操作對象的標識 信息以及所述第一操作對象中的N個敏感數據所在位置的N個位置編碼,所述N個位置編 碼按照預設規則由N個敏感數據所在的位置轉換得到,N為大于等于1的整數; 判斷轉換后的位置編碼中是否存在與所述敏感數據表中所述第一操作對象對應的位 置編碼匹配的位置編碼,若是,則將與所述敏感數據表匹配的位置編碼確定為所述第一操 作對象中的敏感數據所在位置的位置編碼。3. 如權利要求2所述的方法,其特征在于,所述與所述敏感數據表匹配的位置編碼,是 指: 所述第一位置信息對應的位置編碼與所述敏感數據表的位置編碼完全匹配,或者,所 述第一位置信息對應的位置編碼與所述敏感數據表的位置編碼部分匹配。4. 如權利要求2所述的方法,其特征在于,針對所述敏感數據表中包含的所述第一操 作對象中的N個敏感數據所在位置的N個位置編碼,所述敏感數據表中還包括每個位置編 碼所對應的多個操作碼; 所述根據所述第二操作對象的數據結構以及所述第一位置信息,確定所述第二操作對 象中的所述敏感數據的第二位置信息,具體包括: 根據所述數據操作指令中所述第一操作對象的標識信息和操作指令的操作碼,查詢所 述敏感數據表; 根據查詢結果判斷所述敏感數據表中與所述第一位置信息匹配的位置編碼對應的操 作碼中是否存在所述數據操作指令中包含的操作碼; 若是,則根據所述第二操作對象的數據結構以及所述第一位置信息,確定所述第二操 作對象中的所述敏感數據的第二位置信息。5. 如權利要求4所述的方法,其特征在于,所述根據所述第二位置信息,將所述第二操 作對象中相應位置的數據確定為敏感數據之后,還包括: 在敏感數據表中查詢第一位置信息所對應的操作碼; 在所述敏感數據表中添加所述第二操作對象的標識信息、所述第二位置信息,以及查 詢到的第一位置信息所對應的操作碼,并建立三者的對應關系。6. 如權利要求1至5中任一項所述的方法,其特征在于,所述第一操作對象為第一數據 表,所述第二操作對象為第二數據表; 所述數據操作指令為以下幾項中的一種: 將第一數據表復制為第二數據表; 將第一數據表剪切為第二數據表; 將第一數據表另存為第二數據表。7. -種敏感數據識別裝置,其特征在于,包括: 接收單元,用于接收數據操作指令,所述數據操作指令用于指示根據第一操作對象生 成第二操作對象; 處理單元,用于獲取所述第一操作對象中的敏感數據的第一位置信息;執行所述數據 操作指令得到第二操作對象,并根據所述第二操作對象的數據結構以及所述第一位置信 息,確定所述第二操作對象中的所述敏感數據的第二位置信息;根據所述第二位置信息,將 所述第二操作對象中相應位置的數據確定為敏感數據。8. 如權利要求7所述的裝置,其特征在于,所述第一位置信息為第一操作對象中的敏 感數據所在位置的位置編碼; 所述處理單元,具體用于: 將第一操作對象中所有數據的位置按所述預設規則轉換為對應的位置編碼; 查詢預先設置的敏感數據表;其中,所述敏感數據表中包含所述第一操作對象的標識 信息以及所述第一操作對象中的N個敏感數據所在位置的N個位置編碼,所述N個位置編 碼按照預設規則由N個敏感數據所在的位置轉換得到,N為大于等于1的整數; 判斷轉換后的位置編碼中是否存在與所述敏感數據表中所述第一操作對象對應的位 置編碼匹配的位置編碼,若是,則將與所述敏感數據表匹配的位置編碼確定為所述第一操 作對象中的敏感數據所在位置的位置編碼。9. 如權利要求8所述的裝置,其特征在于,所述與所述敏感數據表匹配的位置編碼,是 指: 所述第一位置信息對應的位置編碼與所述敏感數據表的位置編碼完全匹配,或者,所 述第一位置信息對應的位置編碼與所述敏感數據表的位置編碼部分匹配。10. 如權利要求8所述的裝置,其特征在于,針對所述敏感數據表中包含的所述第一操 作對象中的N個敏感數據所在位置的N個位置編碼,所述敏感數據表中還包括每個位置編 碼所對應的多個操作碼; 所述處理單元,具體用于: 根據所述數據操作指令中所述第一操作對象的標識信息和操作指令的操作碼,查詢所 述敏感數據表; 根據查詢結果判斷所述敏感數據表中與所述第一位置信息匹配的位置編碼對應的操 作碼中是否存在所述數據操作指令中包含的操作碼; 若是,則根據所述第二操作對象的數據結構以及所述第一位置信息,確定所述第二操 作對象中的所述敏感數據的第二位置信息。11. 如權利要求10所述的裝置,其特征在于,所述處理單元,還用于: 在敏感數據表中查詢第一位置信息所對應的操作碼; 在所述敏感數據表中添加所述第二操作對象的標識信息、所述第二位置信息,以及查 詢到的第一位置信息所對應的操作碼,并建立三者的對應關系。12.如權利要求7至11中任一項所述的裝置,其特征在于,所述第一操作對象為第一數 據表,所述第二操作對象為第二數據表; 所述數據操作指令為以下幾項中的一種: 將第一數據表復制為第二數據表; 將第一數據表剪切為第二數據表; 將第一數據表另存為第二數據表。
【文檔編號】G06F21/62GK105844166SQ201510015353
【公開日】2016年8月10日
【申請日】2015年1月12日
【發明人】陸琰, 陳劼, 王鑫, 陳后鑫
【申請人】中國移動通信集團江蘇有限公司