一種檢測偽基站中心號碼的方法及服務器的制造方法
【技術領域】
[0001] 本發明設及通信技術領域,尤其設及一種檢測偽基站中屯、號碼的方法及服務器。
【背景技術】
[0002] 隨著科學技術的不斷發展,通信技術也得到了飛速的發展,人們也享受到了科技 發展帶來的各種便利。現在人們可W通過各種類型的移動終端,與親人、朋友保持聯系,并 且,聯系的方式也變得多種多樣,可W打電話、發短信、發email等等。
[0003] 短信由于其具有短小精要、成本低廉等優點被人們廣泛的使用,也正因為它使用 的廣泛和成本低廉而被不法分子所利用。不法分子通過偽基站偽裝成運營商的基站,冒用 他人手機號碼強行向用戶手機發送詐騙、廣告推銷等短信。偽基站設備運行時,用戶手機信 號被強制連接到該設備上,導致手機無法正常使用運營商提供的服務,手機用戶一般會暫 時脫網8~12秒后恢復正常,部分手機則必須開關機才能重新入網。此外,偽基站的運行還 會導致手機用戶頻繁地更新位置,使得該區域的無線網絡資源緊張并出現網絡擁塞現象, 影響用戶的正常通信。
[0004] 現有技術中對垃圾短信的識別于攔截已經較為成熟,但是需要在聯網的情況下才 能較好的實現,偽基站在發送垃圾短信時已將用戶手機強制脫網,又因無法判別短信的發 送方是否為偽基站,導致對于偽基站發送的短信,現有用戶手機無法及時進行攔截。
【發明內容】
[000引鑒于上述問題,提出了本發明W便提供一種克服上述問題或者至少部分地解決上 述問題的一種檢測偽基站中屯、號碼的方法及服務器。
[0006] 本發明的一個方面,提供了一種檢測偽基站中屯、號碼的方法,包括:
[0007] 獲得至少兩條目標短信中每條所述目標短信對應的目標信息中屯、號碼,所述目標 短信屬于垃圾短信中的至少一類短信;
[0008] 獲得所有所述目標信息中屯、號碼中出現概率大于第一闊值的信息中屯、號碼作為 疑似偽基站中屯、號碼;
[0009] 獲得在預設時間周期內通過所述疑似偽基站中屯、號碼發送的所有下發短信;
[0010] 判斷所述所有下發短信中垃圾短信的比例是否大于第二闊值;
[0011] 若所述所有下發短信中垃圾短信的比例大于第二闊值,確定所述疑似偽基站中屯、 號碼為偽基站中屯、號碼。
[0012] 可選的,在所述確定所述疑似偽基站中屯、號碼為偽基站中屯、號碼之后,所述方法 還包括:獲得至少兩個所述偽基站中屯、號碼;判斷所述至少兩個所述偽基站中屯、號碼中是 否存在少一個固定數字位上對應至少一個固定數字的至少兩個中屯、號碼;若存在,將在所 述至少一個固定數字位上對應所述至少一個固定數字建立為一條偽基站中屯、號碼規則并 保存。
[0013] 可選的,在所述確定所述疑似偽基站中屯、號碼為偽基站中屯、號碼之后,所述方法 還包括:將所述偽基站中屯、號碼發送至移動終端,W使所述移動終端執行將所述偽基站中 屯、號碼發送的短信作為攔截對象進行攔截的操作。
[0014] 可選的,所述垃圾短信包括:詐騙短信、騷擾短信及廣告短信。
[0015] 可選的,在所述獲得至少兩條目標短信中每條所述目標短信對應的目標信息中屯、 號碼之前,所述方法還包括:獲得與至少一條參考短信相似的所述至少兩條目標短信,所述 參考短信為已確定的偽基站發送的短信。
[0016] 可選的,所述獲得與至少一條參考短信相似的所述至少兩條目標短信,包括:對每 條所述參考短信進行分詞,并根據每條所述參考短信的每個分詞和語料詞矩陣獲得每條所 述參考短信的特征詞向量;根據所述至少一條參考短信的至少一個特征詞向量,獲得所述 至少一條參考短信的參考特征詞向量;獲得每條待選短信的待選特征詞向量;計算獲得所 述參考特征詞向量與每條所述待選特征詞向量之間的相似度;將所述相似度大于設定闊值 的每個所述待選特征詞向量對應的待選短信確定為與所述至少一條參考短信相似的所述 目標短信。
[0017] 可選的,所述根據每條所述參考短信的每個分詞和語料詞矩陣獲得每條所述參考 短信的特征詞向量,包括:分別將每條所述參考短信的所述每個分詞輸入詞向量工具獲得 所述每個分詞的詞向量;通過將每條所述參考短信的所有分詞的詞向量的乘積與所述語料 詞矩陣相乘獲得所述特征詞向量。
[0018] 可選的,所述根據所述至少一條參考短信的至少一個特征詞向量,獲得所述至少 一條參考短信的參考特征詞向量,包括:當所述至少一條參考短信的參考短信數量為1時, 將所述參考短信的所述特征詞向量作為所述至少一條參考短信的所述參考特征詞向量;或 者,當所述至少一條參考短信的所述參考短信數量大于等于2時,獲得所述至少一條參考短 信中的每條參考短信的特征詞向量的均值作為所述參考特征詞向量。
[0019] 可選的,所述計算獲得所述參考特征詞向量與每條所述待選特征詞向量之間的相 似度,包括:計算獲得所述參考特征詞向量與每條所述待選特征詞向量之間的余弦值,將所 述余弦值作為所述相似度;或者,計算獲得所述目標詞向量與所述待選特征詞向量之間的 相關系數,將所述相關系數作為所述相似度。
[0020] 本發明的另一個方面,提供了一種檢測偽基站中屯、號碼的服務器,包括:
[0021] 第一號碼獲取模塊,用于獲得至少兩條目標短信中每條所述目標短信對應的目標 信息中屯、號碼,所述目標短信屬于垃圾短信中的至少一類短信;
[0022] 第二號碼獲取模塊,用于獲得所有所述目標信息中屯、號碼中出現概率大于第一闊 值的信息中屯、號碼作為疑似偽基站中屯、號碼;
[0023] 短信查詢模塊,用于獲得在預設時間周期內通過所述疑似偽基站中屯、號碼發送的 所有下發短信;
[0024] 判斷模塊,用于判斷所述所有下發短信中垃圾短信的比例是否大于第二闊值;
[0025] 確定模塊,用于若所述所有下發短信中垃圾短信的比例大于第二闊值,確定所述 疑似偽基站中屯、號碼為偽基站中屯、號碼。
[0026] 可選的,所述服務器還包括:第=號碼獲取模塊,用于在所述確定所述疑似偽基站 中屯、號碼為偽基站中屯、號碼之后,獲得至少兩個所述偽基站中屯、號碼;規則建立模塊,用于 判斷所述至少兩個所述偽基站中屯、號碼中是否存在少一個固定數字位上對應至少一個固 定數字的至少兩個中屯、號碼;若存在,將在所述至少一個固定數字位上對應所述至少一個 固定數字建立為一條偽基站中屯、號碼規則并保存。
[0027] 可選的,所述服務器還包括:發送模塊,用于在所述確定所述疑似偽基站中屯、號碼 為偽基站中屯、號碼之后,將所述偽基站中屯、號碼發送至移動終端,W使所述移動終端執行 將所述偽基站中屯、號碼發送的短信作為攔截對象進行攔截的操作。
[0028] 可選的,所述垃圾短信包括:詐騙短信、騷擾短信及廣告短信。
[0029] 可選的,所述服務器還包括:相似短信獲取模塊,用于在所述獲得至少兩條目標短 信中每條所述目標短信對應的目標信息中屯、號碼之前,獲得與至少一條參考短信相似的所 述至少兩條目標短信,所述參考短信為已確定的偽基站發送的短信。
[0030] 可選的,所述相似短信獲取模塊包括:第一向量獲取子模塊,用于對每條所述參考 短信進行分詞,并根據每條所述參考短信的每個分詞和語料詞矩陣獲得每條所述參考短信 的特征詞向量;第二向量獲取子模塊,用于根據所述至少一條參考短信的至少一個特征詞 向量,獲得所述至少一條參考短信的參考特征詞向量;第=向量獲取子模塊,用于獲得每條 待選短信的待選特征詞向量;計算子模塊,用于計算獲得所述參考特征詞向量與每條所述 待選特征詞向量之間的相似度;確定子模塊,用于將所述相似度大于設定闊值的每個所述 待選特征詞向量對應的待選短信確定為與所述至少一條參考短信相似的所述目標短信。
[0031] 可選的,所述第一向量獲取子模塊用于:分別將每條所述參考短信的所述每個分 詞輸入詞向量工具獲得所述每個分詞的詞向量;通過將每條所述參考短信的所有分詞的詞 向量的乘積與所述語料詞矩陣相乘獲得所述特征詞向量。
[0032] 可選的,所述第二向量獲取子模塊用于:當所述至少一條參考短信的參考短信數 量為1時,將所述參考短信的所述特征詞向量作為所述至少一條參考短信的所述參考特征 詞向量;或者,當所述至少一條參考短信的所述參考短信數量大于等于2時,獲得所述至少 一條參考短信中的每條參考短信的特征詞向量的均值作為所述參考特征詞向量。
[0033] 可選的,所述計算子模塊用于:計算獲得所述參考特征詞向量與每條所述待選特 征詞向量之間的余弦值,將所述余弦值作為所述相似度;或者,計算獲得所述目標詞向量與 所述待選特征詞向量之間的相關系數,將所述相關系數作為所述相似度。
[0034] 本申請實施例中提供的技術方案,至少具有如下技術效果或優點:
[0035] 通過獲得多條目標短信的目標信息中屯、號碼,并從中獲得出現概率較高的疑似偽 基站中屯、號碼,再反查出現概率較高的疑似偽基站中屯、號碼發送的所有短信是否絕大部分 都是垃圾短信,若是,便可確定運個疑似偽基站中屯、號碼是偽基站的中屯、號碼,從而檢測出 偽基站中屯、號碼,進而可W根據該中屯、號碼判別出短信的發送方是否為偽基站,解決了現 有技術中無法判別短信的發送方是否是偽基站的技術問題,到達了有效識別偽基站短信的 有益技術效果。
[0036] 上述說明僅是本發明技術方案的概述,為了能夠更清楚了解本發明的技術手段, 而可依照說明書的內容予W實施,并且為了讓本發明的上述和其它目的、特征和優點能夠 更明顯易懂,W下特舉本發明的【具體實施方式】。
【附圖說明】
[0037] 通過閱讀下文優選實施方式的詳細描述,各種其他的優點和益處對于本領域普通 技術人員將變得清楚明了。附圖僅用于示出優選實施方式的目的,而并不認為是對本發明 的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:
[0038] 圖1示出了根據本發明一個實施例的一種檢測偽基站中屯、號碼的方法流程圖;
[0039] 圖2示出了根據本發明一個實施例的一種獲得相似短信的方法流程圖;
[0040] 圖3示出了根據本發明一個實施例的一種檢測偽基站中屯、號碼的裝置示意圖。
【具體實施方式】
[0041] 下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開 的示例性實施例