信息收集方法及裝置的制造方法
【技術領域】
[0001]本發明涉及計算機技術領域,特別是涉及一種信息收集方法及裝置。
【背景技術】
[0002]隨著互聯網技術的迅猛發展,瀏覽網頁逐漸成為人們獲取信息的主要手段。如何從大量的網絡信息中檢索感興趣的內容,并及時保存相應的檢索結果以方便用戶隨時的訪問是網絡瀏覽的一個重要的應用。
[0003]目前常規的檢索方法是使用以關鍵字檢索為主的搜索引擎,配合瀏覽器提供的收藏夾功能,實現檢索結果的保存。然而這樣的實現方式缺乏主動性,在數據的自動更新和篩選上過于依賴用戶的參與。
【發明內容】
[0004]鑒于上述檢索結果的保存過于依賴用戶的參與缺乏主動性的問題,提出了本發明以便提供一種信息收集方法及裝置。
[0005]本發明提供一種信息收集方法,包括:獲取網絡瀏覽信息;對網絡瀏覽信息進行評價,根據評價結果對網絡瀏覽信息進行排序,并根據排序結果生成或更新網絡檢索列表。
[0006]優選地,通過搜索引擎搜索與網絡檢索列表相匹配的網絡站點,并將搜索到的網絡站點按照網絡檢索列表的排序進行推送。
[0007]優選地,網絡瀏覽信息包括以下至少之一:用戶通過客戶端向網絡服務器發送的站點地址信息、訪問的文本內容、用戶單次訪問時長、同一網站用戶訪問次數。
[0008]優選地,上述方法進一步包括:將生成或更新的網絡檢索列表保存在用戶數據服務器對應的賬戶中。
[0009]優選地,對網絡瀏覽信息進行評價,根據評價結果對網絡瀏覽信息進行排序,并根據排序結果生成或更新網絡檢索列表具體包括:從獲取的網絡瀏覽信息中提取出用于分值評定的評價數據;根據預定算法對提取出的評價數據進行分值計算;判斷是否存在網絡檢索列表,在不存在網絡檢索列表的情況下,生成一個新的網絡檢索列表,并將網絡瀏覽信息和計算的分值添加到網絡檢索列表中,并將網絡瀏覽信息的排序設置為最高級;在網絡檢索列表存在的情況下,根據計算的分值與已存儲在網絡檢索列表中的分值進行比較排序,并根據排序結果更新網絡檢索列表;將網絡瀏覽信息中的文本內容存儲在網絡檢索列表對應的條目中。
[0010]優選地,通過搜索引擎搜索與網絡檢索列表相匹配的網絡站點具體包括:根據網絡檢索列表的條目中存儲的文本內容,通過搜索引擎搜索與網絡檢索列表中該條目相匹配的網絡站點。
[0011]優選地,根據預定算法對提取出的評價數據進行分值計算具體包括:假設網絡檢索列表有N條記錄,將提取的評價數據與網絡檢索列表中已有評價數據分別進行比較,在相似度大于或等于第一預定閾值的情況下,權值取1,在相似度小于等于第二預定閾值的情況下,權值取O,在相似度小于第一預定閾值且大于第二預定閾值的情況下,權值取1/N的整數倍,將各權值相加得到M,其中,N>0,0〈1/N〈1,M< N ;假設用戶訪問了 X次該條記錄,每次訪問的時長依次為Tl、T2、…Tx,則平均每次訪問時間T= (Τ1+Τ2+…+Τχ) /X ;計算分值Q= (Μ/Ν)*Τ。
[0012]優選地,根據計算的分值與已存儲在網絡檢索列表中的分值進行比較排序,并根據排序結果更新網絡檢索列表具體包括:依次將分值Q與網絡檢索列表中的N個條目的分值進行比較,若Q小于第i個條目的分值Qi,且大于第i+Ι個條目的分值Qi+Ι,則將本次訪問的文本內容和分值Q記錄到網絡檢索列表,序號記錄為i+Ι,并將i+Ι以后的條目的序號依次加I ;若分值Q與網絡檢索列表中的第i個條目的分值相同,則將本次訪問的文本內容和分值Q記錄到網絡檢索列表的第i條記錄,網絡檢索列表的其他記錄保持不變;若分值Q小于網絡檢索列表中所有條目的分值,則將本次訪問的文本內容和分值Q記錄在網絡檢索列表中,其序號設置為N+1。
[0013]本發明還提供了一種信息收集裝置,包括:獲取模塊,用于獲取網絡瀏覽信息;處理模塊,用于對網絡瀏覽信息進行評價,根據評價結果對網絡瀏覽信息進行排序,并根據排序結果生成或更新網絡檢索列表。
[0014]優選地,上述裝置還包括:推送模塊,用于通過搜索引擎搜索與網絡檢索列表相匹配的網絡站點,并將搜索到的網絡站點按照網絡檢索列表的排序進行推。
[0015]優選地,網絡瀏覽信息包括以下至少之一:用戶通過客戶端向網絡服務器發送的站點地址信息、訪問的文本內容、用戶單次訪問時長、同一網站用戶訪問次數。
[0016]優選地,處理模塊模塊進一步用于:將生成或更新的網絡檢索列表保存在用戶數據服務器對應的賬戶中。
[0017]優選地,處理模塊具體用于:從獲取的網絡瀏覽信息中提取出用于分值評定的評價數據;根據預定算法對提取出的評價數據進行分值計算;判斷是否存在網絡檢索列表,在不存在網絡檢索列表的情況下,生成一個新的網絡檢索列表,并將網絡瀏覽信息和計算的分值添加到網絡檢索列表中,并將網絡瀏覽信息的排序設置為最高級;在網絡檢索列表存在的情況下,根據計算的分值與已存儲在網絡檢索列表中的分值進行比較排序,并根據排序結果更新網絡檢索列表;將網絡瀏覽信息中的文本內容存儲在網絡檢索列表對應的條目中。
[0018]優選地,推送模塊具體用于:根據網絡檢索列表的條目中存儲的文本內容,通過搜索引擎搜索與網絡檢索列表中該條目相匹配的網絡站點。
[0019]優選地,處理模塊模塊具體用于:假設網絡檢索列表有N條記錄,將提取的評價數據與網絡檢索列表中已有評價數據分別進行比較,在相似度大于或等于第一預定閾值的情況下,權值取1,在相似度小于等于第二預定閾值的情況下,權值取0,在相似度小于第一預定閾值且大于第二預定閾值的情況下,權值取1/N的整數倍,將各權值相加得到M,其中,N>0,0〈1/N〈1,M彡N;假設用戶訪問了 X次該條記錄,每次訪問的時長依次為T1、T2、-Tx,則平均每次訪問時間T= (Τ1+Τ2+…+Τχ) /X ;計算分值Q= (Μ/Ν) *Τ。
[0020]優選地,處理模塊具體用于:依次將分值Q與網絡檢索列表中的N個條目的分值進行比較,若Q小于第i個條目的分值Qi,且大于第i+Ι個條目的分值Qi+Ι,則將本次訪問的文本內容和分值Q記錄到網絡檢索列表,序號記錄為i+Ι,并將i+Ι以后的條目的序號依次加I ;若分值Q與網絡檢索列表中的第i個條目的分值相同,則將本次訪問的文本內容和分值Q記錄到網絡檢索列表的第i條記錄,網絡檢索列表的其他記錄保持不變;若分值Q小于網絡檢索列表中所有條目的分值,則將本次訪問的文本內容和分值Q記錄在網絡檢索列表中,其序號設置為N+1。
[0021]優選地,上述裝置進一步包括:開關模塊,用于根據用戶的操作關閉或開啟搜索服務推送裝置。
[0022]優選地,信息收集裝置設置于用戶數據服務器中。
[0023]本發明有益效果如下:
[0024]通過采集用戶的網絡瀏覽信息,通過一定的評分判斷準則,歸納用戶的網絡瀏覽習慣,生成并及時更新相應的檢索列表,解決了現有技術中檢索結果的保存過于依賴用戶的參與缺乏主動性的問題,能夠根據用戶的瀏覽習慣快速反饋其感興趣的相關網站檢索結果,提升用戶的網絡體驗。
[0025]上述說明僅是本發明技術方案的概述,為了能夠更清楚了解本發明的技術手段,而可依照說明書的內容予以實施,并且為了讓本發明的上述和其它目的、特征和優點能夠更明顯易懂,以下特舉本發明的【具體實施方式】。
【附圖說明】
[0026]通過閱讀下文優選實施方式的詳細描述,各種其他的優點和益處對于本領域普通技術人員將變得清楚明了。附圖僅用于示出優選實施方式的目的,而并不認為是對本發明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:
[0027]圖1是本發明實施例的信息收集方法的流程圖;
[0028]圖2是本發明實施例的信息收集系統配置的系統框圖;
[0029]圖3是本發明實施例的生成和更新網絡檢索列表的過程流程圖;
[0030]圖4是本發明實施例的文本內容提取的示意圖;
[0031]圖5是本發明實施例的文本內容提取的流程圖;
[0032]圖6是本發明實施例的用戶進行網絡瀏覽過程的流程圖;
[0033]圖7是本發明實施例的生成的檢索列表反饋給用戶的示意圖;
[0034]圖8是本發明實施例的信息收集裝置的結構示意圖。
【具體實施方式】
[0035]下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應當理解,可以以各種形式實現本公開而不應被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠將本公開的范圍完整的傳達給本領域的技術人員。