中文字幕无码日韩视频无码三区

一種垃圾郵件過濾方法及裝置制造方法

文檔序號:7816810閱讀:204來源:國知局
一種垃圾郵件過濾方法及裝置制造方法
【專利摘要】本發明公開了一種垃圾郵件過濾方法及裝置,用以提高垃圾郵件過濾效果。該方法將接收到的各待發送郵件對應的發送方標識作為當前標識,將預先記錄的已發送郵件對應的發送方標識作為歷史標識,當未包含在由歷史標識構成的標識集合中的當前標識的數量大于第一設定閾值時,拒絕發送各待發送郵件中的部分郵件。上述方法通過對比各待發送郵件的發送方標識與已發送郵件的發送方標識,來確定當前是否存在通過多個賬號發送垃圾郵件的用戶,一旦未包含在由歷史標識構成的標識集合中的當前標識的數量較多,就可確定當前存在通過多個賬號發送垃圾郵件的用戶,從而對各待發送郵件進行過濾,可有效過濾垃圾郵件。
【專利說明】一種垃圾郵件過濾方法及裝置

【技術領域】
[0001]本發明涉及反垃圾郵件技術,尤其涉及一種垃圾郵件過濾方法及裝置。

【背景技術】
[0002]隨著電子商務與網絡技術的發展,電子郵箱已經成為廣大用戶常用的信息交流工具之一,而越來越多的垃圾郵件也出現在用戶的郵箱中。垃圾郵件是指未經用戶許可而強行發送到用戶郵箱中的任何電子郵件。
[0003]垃圾郵件在外發過程中不僅會占用大量的傳輸、存儲和運算等的網絡資源,造成網絡資源的浪費,還可能會給收到垃圾郵件的用戶帶來諸多不便。此外,如果接收服務器接收到發送服務器發送的大量垃圾郵件后,很可能會將該發送服務器添加到黑名單中,從而拒絕接收該發送服務器發送的任何郵件,從而影響正常郵件的發送。
[0004]為了避免上述因垃圾郵件導致的各種問題,需要在發送服務器中配置垃圾郵件過濾策略,來阻止垃圾郵件的發送。
[0005]在現有技術中,垃圾郵件過濾策略一般為:發送服務器在接收到一個用戶發送郵件的請求時,確定該用戶在單位時間(如,一分鐘)內發送的郵件的數量,如果確定的數量大于預設閾值,則拒絕為該用戶發送郵件。
[0006]但是,如果發送垃圾郵件的用戶通過多個賬號來發送郵件,每個賬號在單位時間內發送的郵件的數量小于上述預設閾值,則上述現有技術中的垃圾郵件過濾方法就將失效,也即,現有技術中的垃圾郵件過濾方法不能有效的過濾垃圾郵件。


【發明內容】

[0007]本發明實施例提供一種垃圾郵件過濾方法及裝置,用以提高對垃圾郵件的過濾效果O
[0008]本發明實施例提供的一種垃圾郵件過濾方法,包括:
[0009]接收各待發送郵件;
[0010]確定各待發送郵件對應的發送方標識,作為當前標識;
[0011]確定預先記錄的已發送郵件對應的發送方標識,作為歷史標識;
[0012]根據由各歷史標識所構成的標識集合,確定未包含在所述標識集合中的當前標識的數量;
[0013]當所述數量大于第一設定閾值時,拒絕發送各待發送郵件中的部分郵件。
[0014]本發明實施例提供的一種垃圾郵件過濾裝置,包括:
[0015]待發送郵件接收模塊,用于接收各待發送郵件;
[0016]當前標識確定模塊,用于確定各待發送郵件對應的發送方標識,作為當前標識;
[0017]歷史標識確定模塊,用于確定預先記錄的已發送郵件對應的發送方標識,作為歷史標識;
[0018]數量確定模塊,用于根據由各歷史標識所構成的標識集合,確定未包含在所述標識集合中的當前標識的數量;
[0019]郵件處理模塊,用于當所述數量大于第一設定閾值時,拒絕發送各待發送郵件中的部分郵件。
[0020]本發明實施例提供的一種垃圾郵件過濾方法,該方法將接收到的各待發送郵件對應的發送方標識作為當前標識,將預先記錄的已發送郵件對應的發送方標識作為歷史標識,當未包含在由歷史標識構成的標識集合中的當前標識的數量大于第一設定閾值時,拒絕發送各待發送郵件中的部分郵件。上述方法通過對比各待發送郵件的發送方標識與已發送郵件的發送方標識,來確定當前是否存在通過多個賬號發送垃圾郵件的用戶,一旦未包含在由歷史標識構成的標識集合中的當前標識的數量較多,就可確定當前存在通過多個賬號發送垃圾郵件的用戶,從而對各待發送郵件進行過濾,可有效過濾垃圾郵件。

【專利附圖】

【附圖說明】
[0021]此處所說明的附圖用來提供對本發明的進一步理解,構成本發明的一部分,本發明的示意性實施例及其說明用于解釋本發明,并不構成對本發明的不當限定。在附圖中:
[0022]圖1為本發明實施例提供的垃圾郵件過濾的過程;
[0023]圖2為本發明實施例提供的垃圾郵件過濾的詳細過程;
[0024]圖3為本發明實施例提供的垃圾郵件過濾裝置結構示意圖。

【具體實施方式】
[0025]在現有技術中,如果發送垃圾郵件的用戶通過多個賬號(俗稱“小號”)來發送郵件,每個賬號在單位時間內發送的郵件的數量小于設定閾值,則現有技術中垃圾郵件過濾方法就會失效。為了有效的過濾垃圾郵件,本發明實施例通過對比當前各待發送郵件對應的發送方標識與已發送郵件對應的發送方標識,來確定當前是否存在通過多個小號發送郵件的用戶,如果存在,則進行相應的郵件過濾。
[0026]為使本發明的目的、技術方案和優點更加清楚,以下將結合本發明具體實施例及相應的附圖對本發明技術方案進行清楚、完整地描述。顯然,所描述的實施例僅是本發明一部分實施例,而不是全部的實施例。基于本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明保護的范圍。
[0027]以下將具體說明本發明實施例提供的垃圾郵件過濾方法。
[0028]參見圖1,為本發明實施例提供的垃圾郵件過濾過程,包括:
[0029]SlOl:接收各待發送郵件。
[0030]在本發明實施例中,用戶編輯好郵件后,將郵件發送出去時,該郵件首先會發送到發送服務器中,此時,發送服務器接收到的該用戶編輯好的郵件就是待發送郵件。一般的,發送服務器接收到待發送郵件后,會先采用預設策略判斷該待發送郵件是否合法,如果合法,再根據該待發送郵件中攜帶的接收方標識,將該待發送郵件發送出去。
[0031]S102:確定各待發送郵件對應的發送方標識,作為當前標識。
[0032]在本發明實施例中,待發送郵件對應的發送方標識可以是該待發送郵件中攜帶的發件人郵箱地址,也就是發件人賬號。具體的,發送服務器接收到各待發送郵件后,可從每個待發送郵件中提取出發送方標識,并對提取出的發送方標識進行去重處理,將去重處理后得到的發送方標識作為當前標識。
[0033]例如,發送服務器接收到5個待發送郵件,其中,第1、2個待發送郵件是賬號A發送的,第3、4個待發送郵件是賬號B發送的,第5個待發送郵件是賬號C發送的。發送服務器從這5待發送郵件中提取出來的發送方標識包括:2個賬號A、2個賬號B、I個賬號C。對各賬號進行去重處理,得到賬號A、賬號B、賬號C這三個賬號,將這三個賬號作為當前標識。
[0034]S103:確定預先記錄的已發送郵件對應的發送方標識,作為歷史標識。
[0035]在本發明實施例中,發送服務器每發送一個郵件之后,可將發送該郵件的日志保存在歷史記錄中,該日志中至少包括:發送郵件的時間,發送方標識和接收方標識。因此,發送服務器就可以根據歷史記錄,獲取各已發送郵件的發送方標識,對獲取的各發送方標識進行去重處理,將去重處理后的發送方標識作為歷史標識。
[0036]繼續沿用上例,假設發送服務器之前已經發送了 4個郵件,其中,這4個已發送郵件中,第I個已發送郵件是賬號A發送的,第2、3個已發送郵件是賬號D發送的,第4個已發送郵件是賬號E發送的。則發送服務器可根據歷史記錄中保存的這4個已發送郵件的發送日志,分別提取這4個已發送郵件的發件人賬號,并進行去重處理,得到賬號A、賬號D、賬號E,將這三個賬號作為歷史標識。
[0037]S104:根據由各歷史標識所構成的標識集合,確定未包含在所述標識集合中的當前標識的數量。
[0038]繼續沿用上例,發送服務器確定出的由歷史標識所構成的標識集合即為{賬號A,賬號D,賬號E},當前標識包括賬號A、賬號B、賬號C,因此,可確定未包含在上述標識集合中的當前標識為賬號B和賬號C,從而確定未包含在該標識集合中的當前標識的數量為2。
[0039]S105:當該數量大于第一設定閾值時,拒絕發送各待發送郵件中的部分郵件。
[0040]也就是說,發送服務器可判斷步驟S104確定出的未包含在標識集合中的當前標識的數量是否大于第一設定閾值,若是,則說明當前存在通過多個小號發送郵件的用戶,因此對各待發送郵件進行過濾,拒絕發送各待發送郵件中的部分郵件,其余部分的郵件可以發送,否則,說明當前不存在通過多個小號發送郵件的用戶,可直接發送所有的待發送郵件。
[0041]繼續沿用上例,假設第一設定閾值為1,則由于發送服務器通過步驟S104確定出未包含在標識集合中的當前標識的數量為2,大于第一設定閾值,因此,拒絕發送5個待發送郵件中的部分郵件。其中,可隨機從各待發送郵件中選擇出部分郵件并拒絕發送。
[0042]具體的,對于每個待發送郵件來說,可預設拒絕發送每個待發送郵件的概率P,拒絕發送每個待發送郵件的概率P均相同,因此,發送服務器針對每個待發送郵件,可以概率P拒絕發送該待發送郵件,以概率(1-P)允許發送該待發送郵件。而由于預先針對每個待發送郵件設置的拒絕發送的概率P均相同,因此,發送服務器也可直接確定各待發送郵件的數量與預設百分比的乘積,對該乘積進行取整,得到取整值,從各待發送郵件中,隨機選擇數量為該取整值的待發送郵件,并拒絕發送選擇出的待發送郵件,發送其余未被選擇的郵件。也即,上述的預設百分比就等于針對每個待發送郵件設置的拒絕發送的概率P。
[0043]其中,上述的取整方法可以為上取整、下取整或四舍五入取整等方法,本發明對此不做限定。
[0044]繼續沿用上例,假設針對每個待發送郵件設置的拒絕發送的概率P為0.7,則該預設百分比即為70%,發送服務器可確定各待發送郵件的數量5與預設百分比70%的乘積為5X70%= 3.5,對確定的值3.5進行四舍五入取整,得到取整值4,從5個待發送郵件中,隨機選擇4個待發送郵件,拒絕發送選擇出的這4個郵件,發送其余的I個郵件。
[0045]上述圖1所示的方法,通過對比各待發送郵件的發送方標識與已發送郵件的發送方標識,來確定當前是否存在通過多個小號發送郵件的用戶,即使發送垃圾郵件的用戶通過多個小號來發送垃圾郵件,且每個小號在單位時間內發送郵件的數量較少,上述方法也可確定出當前存在通過多個小號發送垃圾郵件的用戶,從而對各待發送郵件進行過濾,因此可以有效過濾垃圾郵件。
[0046]考慮到在實際應用場景中,垃圾郵件發送期一般都是在某一特定的時間段內,t匕如在凌晨的1:00?3:00這一時間段內,為了使得本發明實施例上述圖1所示的垃圾郵件過濾方法在時間上更加有針對性,以避免資源的浪費,可以設定一個預設時間段,僅在該預設時間段內采用圖1所示的方法過濾垃圾郵件。
[0047]具體的,發送服務器在通過步驟S105拒絕發送各待發送郵件中的部分郵件之前,需要確定當前時刻在預設時間段內。進一步的,發送服務器可先判斷當前時刻是否在預設時間段內,若是,則執行如圖1所示的方法過濾垃圾郵件,否則,可采用其他方法過濾垃圾郵件。
[0048]進一步的,在本發明實施例中,可將多個時間段設定為預設時間段,例如,由于垃圾郵件的發送時間一般集中在每天凌晨的1:00?3:00和中午12:00?13:00這兩個時間段,因此可以設置每天的1:00?3:00和12:00?13:00這兩個時間段為預設時間段。則發送服務器在接收到各待發送郵件之后,先判斷當前時刻是否在1:00?3:00以及12:00?13:00之內,如果是,則執行圖1所示的垃圾郵件過濾方法,否則,可采用其他方法過濾垃圾郵件。
[0049]相應的,在上述步驟S103中,確定歷史標識的方法具體可以為,通過在歷史記錄中,確定發送時刻不在預設時間段內的已發送郵件對應的發送方標識,作為歷史標識。
[0050]例如,假設預設時間段為每天1:00?3:00,而歷史記錄中共保存的4個已發送郵件的發送日志,這4個已發送郵件分別由賬號A、賬號D、賬號E發送,其中,賬號A發送郵件的發送時刻為9:00,不在預設時間段(I:00?3:00)內,而賬號D和賬號E發送的郵件均在預設時間段內,因此,發送服務器在確定歷史標識時,確定發送時刻不在預設時間段內的已發送郵件為賬號D和賬號E發送的郵件,從而確定賬號D和賬號E為歷史標識。
[0051]考慮到在實際應用場景中,用戶通常不會每時每刻都在發送郵件,在不同的時間段內,發送郵件的用戶不完全相同甚至完全不同是非常正常的現象,也就是說,在不同的時間段內,發送服務器接收到的各待發送郵件對應的發送方標識存在很大差異是非常正常的。因此,當未包含在上述標識集合(由各歷史標識構成)中的當前標識的數量較多(大于第一設定閾值)時,仍不能完全說明當前存在通過多個小號發送垃圾郵件的用戶,這些未包含在標識集合中的當前標識也有可能是正常用戶的標識,如果只要未包含在標識集合中的當前標識的數量大于第一設定閾值,就拒絕發送一部分待發送郵件,勢必會導致大量的正常郵件不能被發送。
[0052]因此,為了盡量保證正常郵件的發送,在本發明實施例中,發送服務器在拒絕發送各待發送郵件中的部分郵件之前,還可確定各待發送郵件的數量與各待發送郵件對應的發送方標識的數量的比值,并判斷該比值是否大于第二設定閾值,若是,則說明當前存在通過多個小號發送郵件的用戶,因此對各待發送郵件進行過濾,拒絕發送各待發送郵件中的部分郵件,其余部分的郵件可以發送,否則,說明當前不存在通過多個小號發送郵件的用戶,可直接發送所有的待發送郵件。
[0053]例如,假設各待發送郵件的數量為500,各待發送郵件對應的發送方標識的數量為3,第二設定閾值為200,則發送服務器在確定出未包含在標識集合中的當前標識的數量大于第一設定閾值之后,可確定各待發送郵件的數量與各待發送郵件對應的發送方標識的數量的比值,為500/3。由于該比值小于第二設定閾值200,因此,可說明當前不存在通過多個小號發送郵件的用戶,可直接發送所有的待發送郵件。這樣,就可以保證正常郵件的發送。當然,如果該比值大于第二設定閾值,則可確定存在通過多個小號發送郵件的用戶,拒絕發送各待發送郵件中的部分郵件。
[0054]其中,在設定上述第二設定閾值時,可統計發送正常郵件的用戶在單位時間內發送郵件的最大數量,將該最大數量作為該第二設定閾值即可。
[0055]較佳的,圖1所示的垃圾郵件過濾方法還可以結合其他一種或多種垃圾郵件過濾策略,以進一步提高對垃圾郵件的過濾效果,盡量降低發送垃圾郵件的可能。
[0056]例如,可采用流量控制策略、黑名單策略、文本分析策略中的一種或幾種與圖1所示的方法結合。其中:
[0057]采用流量控制策略過濾郵件的方法一般是:發送服務器在接收到各待發送郵件后,針對每個發送方標識,當確定該發送方標識對應的待發送郵件的數量大于第三設定閾值時,拒絕發送該發送方標識對應的各待發送郵件。
[0058]需要說明的是,如果先采用流量控制策略對各待發送郵件過濾,再采用如圖1所示的方法對各待發送郵件過濾,則上述的第二設定閾值需小于第三設定閾值,才能保證圖1所示的方法有效。
[0059]采用黑名單策略過濾郵件的方法一般是:發送服務器在接收到各待發送郵件后,針對每個發送方標識,當確定該發送方標識包含在預設的黑名單中時,拒絕發送該發送方標識對應的各待發送郵件。
[0060]采用文本分析策略過濾郵件的方法一般是:發送服務器在接收到各待發送郵件后,針對每個待發送郵件,對該待發送郵件中的內容進行文本分析,以判斷該待發送郵件中的內容中是否包含預設關鍵詞,若包含,則拒絕發送該待發送郵件,否則可發送該待發送郵件。
[0061]假設將流量控制策略、黑名單策略、文本分析策略三種方法與圖1所示的方法結合,則本發明實施例提供的垃圾郵件過濾的詳細過程如圖2所示。
[0062]參見圖2,為本發明實施例提供的垃圾郵件過濾方法,包括以下步驟:
[0063]S201、接收各待發送郵件。
[0064]S202、采用流量控制策略對各待發送郵件進行過濾。
[0065]S203、采用黑名單策略對過濾后的待發送郵件進行過濾。
[0066]其中,步驟S203中所述的過濾后的待發送郵件是指經過流量控制策略過濾后剩余的各待發送郵件。
[0067]S204、采用文本分析策略對過濾后的待發送郵件進行過濾。
[0068]其中,步驟S204中所述的過濾后的待發送郵件是指經過黑名單策略過濾后剩余的各待發送郵件。
[0069]需要說明的是,上述步驟S202、S203和S204的執行順序可以互換。
[0070]S205、判斷當前時刻是否在預設時間段內,若是,執行步驟S206,否則,執行步驟S214。
[0071]S206、確定過濾后的待發送郵件對應的發送方標識,作為當前標識。
[0072]其中,步驟S206中所述的過濾后的待發送郵件是指經過流量控制策略、黑名單策略、文本分析策略過濾后剩余的各待發送郵件。
[0073]S207、在歷史記錄中,確定當前時刻不在預設時間段內的已發送郵件對應的發送方標識,作為歷史標識。
[0074]S208、確定未包含在由各歷史標識所構成的標識集合中的當前標識的數量。
[0075]S209、判斷該數量是否大于第一設定閾值,如果是,執行步驟S210,否則,執行步驟S214。
[0076]S210、確定各待發送郵件的數量與各待發送郵件對應的發送方標識的數量的比值。
[0077]S211、判斷該比值是否大于第二設定閾值,若是,執行步驟S212,否則,執行步驟S214。
[0078]S212、確定各待發送郵件的數量與預設百分比的乘積,對該乘積進行取整,得到取整值。
[0079]S213、從各待發送郵件中,隨機選擇數量為該取整值的待發送郵件,并拒絕發送,發送未選擇的待發送郵件。
[0080]S214、發送過濾后的待發送郵件。
[0081]其中,步驟S214中所述的過濾后的待發送郵件是指經過流量控制策略、黑名單策略、文本分析策略過濾后剩余的各待發送郵件。
[0082]以上為本發明實施例提供的垃圾郵件過濾方法,基于同樣的思路,本發明實施例還提供了一種垃圾郵件過濾裝置,如圖3所示,包括:
[0083]待發送郵件接收模塊31,用于接收各待發送郵件;
[0084]當前標識確定模塊32,用于確定發送各待發送郵件的當前用戶標識;
[0085]歷史標識確定模塊33,用于確定預先記錄的已發送郵件對應的發送方標識,作為歷史標識;
[0086]數量確定模塊34,用于根據由各歷史標識所構成的標識集合,確定未包含在所述標識集合中的當前標識的數量;
[0087]郵件處理模塊35,用于當所述數量大于第一設定閾值時,拒絕發送各待發送郵件中的部分郵件。
[0088]可選的,所述裝置還包括:
[0089]時間確定模塊36,用于在拒絕發送各待發送郵件中的部分郵件之前,確定當前時刻在預設時間段內。
[0090]可選的,歷史標識確定模塊33,具體用于:在歷史記錄中,確定發送時刻不在預設時間段內的已發送郵件對應的發送方標識,作為歷史標識。
[0091]可選的,所述裝置還包括:
[0092]比較模塊37,用于在拒絕發送各待發送郵件中的部分郵件之前,確定各待發送郵件的數量與各待發送郵件對應的發送方標識的數量的比值大于第二設定閾值。
[0093]郵件處理模塊35,具體用于:
[0094]確定各待發送郵件的數量與預設百分比的乘積;
[0095]對所述乘積進行取整,得到取整值;
[0096]從各待發送郵件中,隨機選擇數量為所述取整值的待發送郵件;
[0097]拒絕發送選擇出的待發送郵件。
[0098]本發明實施例提供的一種垃圾郵件過濾方法,該方法將接收到的各待發送郵件對應的發送方標識作為當前標識,將預先記錄的已發送郵件對應的發送方標識作為歷史標識,當未包含在由歷史標識構成的標識集合中的當前標識的數量大于第一設定閾值時,拒絕發送各待發送郵件中的部分郵件。上述方法通過對比各待發送郵件的發送方標識與已發送郵件的發送方標識,來確定當前是否存在通過多個賬號發送垃圾郵件的用戶,一旦未包含在由歷史標識構成的標識集合中的當前標識的數量較多,就可確定當前存在通過多個賬號發送垃圾郵件的用戶,從而對各待發送郵件進行過濾,可有效過濾垃圾郵件。
[0099]本領域內的技術人員應明白,本發明的實施例可提供為方法、系統、或計算機程序產品。因此,本發明可采用完全硬件實施例、完全軟件實施例、或結合軟件和硬件方面的實施例的形式。而且,本發明可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(包括但不限于磁盤存儲器、CD-ROM、光學存儲器等)上實施的計算機程序產品的形式。
[0100]本發明是參照根據本發明實施例的方法、設備(系統)、和計算機程序產品的流程圖和/或方框圖來描述的。應理解可由計算機程序指令實現流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合。可提供這些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數據處理設備的處理器以產生一個機器,使得通過計算機或其他可編程數據處理設備的處理器執行的指令產生用于實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
[0101]這些計算機程序指令也可存儲在能引導計算機或其他可編程數據處理設備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產生包括指令裝置的制造品,該指令裝置實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
[0102]這些計算機程序指令也可裝載到計算機或其他可編程數據處理設備上,使得在計算機或其他可編程設備上執行一系列操作步驟以產生計算機實現的處理,從而在計算機或其他可編程設備上執行的指令提供用于實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
[0103]在一個典型的配置中,計算設備包括一個或多個處理器(CPU)、輸入/輸出接口、網絡接口和內存。
[0104]內存可能包括計算機可讀介質中的非永久性存儲器,隨機存取存儲器(RAM)和/或非易失性內存等形式,如只讀存儲器(ROM)或閃存(flash RAM)。內存是計算機可讀介質的示例。
[0105]計算機可讀介質包括永久性和非永久性、可移動和非可移動媒體可以由任何方法或技術來實現信息存儲。信息可以是計算機可讀指令、數據結構、程序的模塊或其他數據。計算機的存儲介質的例子包括,但不限于相變內存(PRAM)、靜態隨機存取存儲器(SRAM)、動態隨機存取存儲器(DRAM)、其他類型的隨機存取存儲器(RAM)、只讀存儲器(ROM)、電可擦除可編程只讀存儲器(EEPROM)、快閃記憶體或其他內存技術、只讀光盤只讀存儲器(CD-ROM)、數字多功能光盤(DVD)或其他光學存儲、磁盒式磁帶,磁帶磁磁盤存儲或其他磁性存儲設備或任何其他非傳輸介質,可用于存儲可以被計算設備訪問的信息。按照本文中的界定,計算機可讀介質不包括暫存電腦可讀媒體(transitory media),如調制的數據信號和載波。
[0106]還需要說明的是,術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、商品或者設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、商品或者設備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括要素的過程、方法、商品或者設備中還存在另外的相同要素。
[0107]本領域技術人員應明白,本申請的實施例可提供為方法、系統或計算機程序產品。因此,本申請可采用完全硬件實施例、完全軟件實施例或結合軟件和硬件方面的實施例的形式。而且,本申請可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(包括但不限于磁盤存儲器、CD-ROM、光學存儲器等)上實施的計算機程序產品的形式。
[0108]以上僅為本申請的實施例而已,并不用于限制本申請。對于本領域技術人員來說,本申請可以有各種更改和變化。凡在本申請的精神和原理之內所作的任何修改、等同替換、改進等,均應包含在本申請的權利要求范圍之內。
【權利要求】
1.一種垃圾郵件過濾方法,其特征在于,包括: 接收各待發送郵件; 確定各待發送郵件對應的發送方標識,作為當前標識; 確定預先記錄的已發送郵件對應的發送方標識,作為歷史標識; 根據由各歷史標識所構成的標識集合,確定未包含在所述標識集合中的當前標識的數量; 當所述數量大于第一設定閾值時,拒絕發送各待發送郵件中的部分郵件。
2.如權利要求1所述的方法,其特征在于,拒絕發送各待發送郵件中的部分郵件之前,所述方法還包括: 確定當前時刻在預設時間段內。
3.如權利要求1或2所述的方法,其特征在于,確定預先記錄的已發送郵件對應的發送方標識,具體包括: 在歷史記錄中,確定發送時刻不在預設時間段內的已發送郵件對應的發送方標識。
4.如權利要求1所述的方法,其特征在于,拒絕發送各待發送郵件中的部分郵件之前,所述方法還包括: 確定各待發送郵件的數量與各待發送郵件對應的發送方標識的數量的比值大于第二設定閾值。
5.如權利要求1所述的方法,其特征在于,拒絕發送各待發送郵件中的部分郵件,具體包括: 確定各待發送郵件的數量與預設百分比的乘積; 對所述乘積進行取整,得到取整值; 從各待發送郵件中,隨機選擇數量為所述取整值的待發送郵件; 拒絕發送選擇出的待發送郵件。
6.一種垃圾郵件過濾裝置,其特征在于,包括: 待發送郵件接收模塊,用于接收各待發送郵件; 當前標識確定模塊,用于確定各待發送郵件對應的發送方標識,作為當前標識; 歷史標識確定模塊,用于確定預先記錄的已發送郵件對應的發送方標識,作為歷史標識; 數量確定模塊,用于根據由各歷史標識所構成的標識集合,確定未包含在所述標識集合中的當前標識的數量; 郵件處理模塊,用于當所述數量大于第一設定閾值時,拒絕發送各待發送郵件中的部分郵件。
7.如權利要求6所述的裝置,其特征在于,所述裝置還包括: 時間確定模塊,用于在拒絕發送各待發送郵件中的部分郵件之前,確定當前時刻在預設時間段內。
8.如權利要求6或7所述的裝置,其特征在于, 歷史標識確定模塊,具體用于:在歷史記錄中,確定發送時刻不在預設時間段內的已發送郵件對應的發送方標識,作為歷史標識。
9.如權利要求6所述的裝置,其特征在于,所述裝置還包括: 比較模塊,用于在拒絕發送各待發送郵件中的部分郵件之前,確定各待發送郵件的數量與各待發送郵件對應的發送方標識的數量的比值大于第二設定閾值。
10.如權利要求6所述的裝置,其特征在于,郵件處理模塊,具體用于: 確定各待發送郵件的數量與預設百分比的乘積; 對所述乘積進行取整,得到取整值; 從各待發送郵件中,隨機選擇數量為所述取整值的待發送郵件; 拒絕發送選擇出的待發送郵件。
【文檔編號】H04L12/58GK104348712SQ201410545491
【公開日】2015年2月11日 申請日期:2014年10月15日 優先權日:2014年10月15日
【發明者】宋健 申請人:新浪網技術(中國)有限公司
網(wang)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1