中文字幕无码日韩视频无码三区

提供知識服務的分布式監視網絡的制作方法

文檔序號:6469971閱讀:584來源:國知局
專利名稱:提供知識服務的分布式監視網絡的制作方法
技術領域
本發明涉及自因特網或者其它搜索空間的信息檢索,更具體地說涉及在中央數據庫中累積并組織從許多遠程位置收集的信息,并且在開放式推薦系統中實現收集的信息的系統。
背景技術
目前,結合當前技術和因特網探索方法,因特網和其它巨大的搜索空間的特性和結構向用戶提出了許多問題,目前的技術水平還不能提供這些問題的解決方案。例如,雖然在因特網上可獲得大量的信息,但是可用的信息內容僅僅局限于可通過超文本標記語言(HTML)獲取的材料。此外,目前的組織和呈現用戶可用信息的方法還不適宜。
雖然環球網上的某些站點可向用戶提供對基于該特定站點上其它用戶的行為的傾向或建議的限制訪問,但是目前還不存在向用戶提供對其它用戶提供的反饋和其它信息的全局訪問的擴展系統。此外,由于該技術領域的當前狀態既沒有認識到個人嗜好或偏愛,又不能適應這種個人嗜好或偏愛,因此搜索空間的探索的交互程度不夠,從而效率和產率都低于其應能達到的水平。
在環球網的環境中,目前可供用戶之用的信息局限于構成可搜索的超空間的HTML文件。雖然多數用戶認為與其它用戶的交互作用以及其它用戶的推薦構成識別有用的相關信息的最有效技巧,但是目前采用的信息組織和檢索系統并不適合于提供集中式服務器,通過所述集中式服務器,用戶能夠方便并且無限制地訪問來自其它用戶的輸入。
另外,雖然許多用戶求助于因特網尋找關于其它媒體類型的信息,例如電視和廣播,但是這些及不是基于HTML的其它媒體完全被目前應用的因特網導航和信息檢索系統忽略;即,不能通過目前的HTML導航方法和系統訪問這些各種各樣的其它媒體。不能從目前的搜索和導航系統訪問不是基于HTML文件的其它媒體來源或者從目前的搜索和導航系統排除所述其它媒體來源體現了現有技術狀態的極大局限性。
此外,在目前的技術提供有限的交互功能的地方,交互作用一般局限于用戶和站點主機之間的信息交換,即一個封閉的系統,而不是被擴展到包括開放式推薦系統中該站點的不同用戶之間的信息交換。從而,目前的系統提供沒有考慮到這種封閉系統的用戶的嗜好的搜索結果。
于是,對于用于從因特網或者其它巨大搜索空間識別并獲取最相關信息的開放式或者分布式推薦系統和方法的需要日益增長。這種開放式推薦系統和方法應被定制,以便考慮到瀏覽搜索空間的個人的嗜好和偏愛。此外,真正完整的系統應支持通過HTML訪問各種其它媒體,所述其它媒體傳統上不是以HTML為基礎的,例如電視和廣播。另外,由于一般來說人類輸入是最優選的信息來源,因此開放式推薦系統和方法應適合于把人類輸入作為數據加入中央數據庫中,便于該信息的檢索,并且鼓勵人的互動。

發明內容
通過采用開放式推薦技術,本發明的系統和方法克服了已知方法的前述及其它缺點,所述開放式推薦技術利用分布式監視系統累積以數據形式包含人類輸入的知識和信息的大型開放式數據庫。在本發明的術語中,該開放式數據庫在某些地方被稱為開放式知識庫。
本發明利用分散的,或者分布式監視系統收集顯式數據和隱式數據,所述分布式監視系統提供跨越大量遠程信息來源的數據收集。軟件可安裝在遠程終端上以便進行監視;從而,可在客戶機一方本地監視數據,并且隨后把數據傳送給中央數據庫。另外,本發明的系統和方法提供在服務器聚集在客戶機一側從許多遠程信息來源收集的數據。在累積過程中,在中央數據庫中對分布式監視系統收集的數據進行分類和組織以便檢索。
可在客戶機一側以顯式數據(它可以直接由用戶以推薦、評論或投票的形式輸入)或者以隱式數據(它可以根據用戶的瀏覽活動,由系統收集)的形式收集數據;此外,系統可以同時或者組合地收集顯式數據和隱式數據。所收集數據的實現包括應請求傳送顯式數據,以及在簡化信息檢索過程的定制和個性化的開放式推薦系統中利用顯式數據、隱式數據或者顯式數據和隱式數據的組合。根據本發明的一個方面,可向用戶提供關閉或者“取消選定”系統的隱式數據收集功能的選擇權。
本發明的系統和方法通過在客戶機或者瀏覽器一側,而不是在服務器一側監視用戶的活動,采集并集中人類知識。隨后通過在服務器的統計分析,可提取、轉換和處理在客戶機一側收集的和用戶行為和嗜好有關的數據。這樣收集的數據可包括下述一些或全部與所訪問的站點相關的統一資源定位符(URL);在每個站點消耗的時間;用戶和各個站點相聯系的關鍵字;用戶輸入的和各個站點有關的明確評論;通過投票表達的用戶對各個站點的評價;涉及URL或人的推薦的接受或拒絕;獲取和/或收集了其姓名卡的其它用戶;用戶聯系的人們;和用戶ID。
可從站點和URL本身獲得其它信息,并且可獲得諸如涉及電視和無線電廣播、人們、MP3和電話號碼之類的其它多媒體數據。當用戶訪問各個站點時,相關信息被收集。收集的信息可被分類為顯式信息或者隱式信息;可同時收集這兩種數據。隱式信息包括用URL來表示的Web站點的名稱,而顯式信息包括關于各個Web站點的投票響應、評論和喜好。
和目前應用的各種技術相反,包含在本發明中的系統和方法可被表征為分布式的,或者“開放式的”,因為信息的本質和信息的位置都不是數據收集、累積以及隨后的實現的障礙。例如,這里描述的系統和方法的應用不依賴于入口類型技術,所述入口類型技術偏愛由許可的內容提供者供給的信息。因此,本發明的系統和方法適合于相對于整個搜索空間收集和累積數據;即,由于在客戶機一側監視數據,并且數據被保存在中央服務器,因此可供收集和利用的信息并不受入口站點的操作者或者其它信息內容提供者的選擇性限制,而是可以擴展到可從客戶機一側到達的任意各個站點。
另外,監視并不局限于瀏覽器或者其它因特網工具技術,而是可擴展到諸如收音機、電視機、電話和個人通信系統(PCS)、個人數字助手(PDA)、錄像機、機頂盒之類的其它類型終端。通過本領域已知的有線或無線技術,這些各種其它終端可恰當地和諸如配有瀏覽器的個人計算機之類能夠接入因特網的終端相連。通過恰當的硬件連接和軟件通信,系統適合于監視在這些其它終端類型上進行的活動。
在這方面,本發明的系統和方法適合于把HTML平臺和其它媒體,例如電視、廣播、報紙和人們聯系起來。目前,HTML是用于Web設計技術的精選語言;從而,用戶對信息內容的訪問受Web瀏覽器約定的限制,即局限于HTML文件或頁面。雖然目前的瀏覽器軟件允許顯示通過HTML可訪問的各種媒體中的信息,但是不能向用戶提供對其它媒體的訪問。
相反,本發明不僅提供對HTML不能顯示的其它媒體,例如實時電視或無線電廣播的訪問,而且保存在客戶機一側監視的、和這些備選的媒體類型相關的信息的數據庫記錄;這樣,可按照和普通HTML信息相同的方式搜索多媒體數據。目前的技術允許用戶搜索集中于特定主題的Web站點或者URL;作為響應,搜索引擎提供和關心的主題有關的URL名單。除了返回相關URL或者Web站點的名單之外,本發明還適合于提供同樣和關心的主題有關的人、電視節點或頻道、無線電廣播信息等的名單。
HTML頁面上顯示的超鏈接可使用戶直接鏈接到可在不同的終端或設備上向用戶提供的特定電視或無線電廣播節目或者其它實況廣播上。選擇在HTML頁面上顯示的這種鏈接會啟動用來和超出HTML范圍的其它媒體互動的軟件編程。如上所述,連同恰當的硬件連接一起,本發明的軟件代碼可控制通過其它類型的終端,例如電視機、錄像機和收音機顯示或獲取的內容。
本發明利用瀏覽器嵌入軟件實現在客戶機一側對用戶活動的監視。嵌入的軟件適合于提供諸如搜索引擎、廣告、調查、吃角子老虎機和彩票之類的特征。常規的瀏覽器軟件具有允許加入系統軟件的集成特征。如上所述,嵌入的軟件程序代碼可提供下述功能客戶機一側用戶活動的監視;搜索引擎功能;可相對于用戶嗜好定制的橫幅廣告;調查或投票功能;和彩票。
由于前述特征被包含在安裝于客戶一方的用戶終端上的軟件代碼中,這些特征是可起作用的,而不考慮當前哪個URL正被載入用戶的瀏覽器中。即,為了利用嵌入瀏覽器軟件中的搜索引擎特征,用戶不必訪問特定的Web站點,例如搜索引擎Web站點。由于搜索引擎功能包含在訪問保存在服務器上的數據庫的瀏覽器嵌入軟件中,因此在起動搜索之前,用戶不必到達傳統的搜索引擎站點。
另外還提供增強的橫幅廣告功能。傳統的橫幅廣告方法依賴于在服務器一方監視的數據;從而,只有當用戶正在訪問進行服務器一方的監視的特定站點時,這些系統才能定制呈現給該用戶的廣告。通過把橫幅廣告特征集成到瀏覽器嵌入軟件中,并且通過利用在客戶機一方監視的并保存在中央服務器上的數據,本發明的系統能夠向用戶呈現定制的橫幅廣告,而不考慮用戶在搜索空間中的位置。
另外,如上簡要所述,瀏覽器嵌入軟件能夠與不同的多媒體終端通信。通過網絡硬件裝置的軟件控制,嵌入瀏覽器中的系統軟件能夠實現數據監視并從基于非HTML的消息來源收集數據,以及各種多媒體終端的控制。
本發明還提供利用被監視數據和用戶投票歷史的先進搜索引擎分級和過濾方法。常規的搜索引擎根據一個或多個預定算法對搜索結果排序,所述一個或多個預定算法以元標記或者其它元數據、查詢關鍵字的出現次數、文件內關鍵字的位置或者這些因素的某些組合為基礎。從而,對于基于指定關鍵字的各個搜索,典型的搜索引擎提供按照相同順序排列的相同結果;這些結果既不基于不同站點相對于指定關鍵字的真實相關性的量度,又不基于在這些站點提供的用戶的評價信息。
雖然存在通過改進現有的搜索引擎,提供更好的搜索結果的許多嘗試,但是很少成功。本發明的系統和方法通過利用在中央數據庫中記錄的隱式和顯式數據,根據關于作為任意指定搜索的結果而返回的各個站點的已知信息改進搜索,能夠實現更有意義的搜索結果。從系統的所有用戶收集的訪問歷史和投票記錄被用于評估潛在的搜索結果,并對潛在的搜索結果排序。從而返回的結果更有意義。隨著數據庫的增大,關于相同查詢的搜索結果會隨著時間而改進。
例如,目前的搜索引擎技術返回的URL列表通常包括不再起作用的或者很長時間沒有更新的停用鏈接。本發明的利用顯式和隱式監視數據來評估各個URL的策略消除了停用鏈接作為搜索結果被返回的可能性,因為用戶不可能對這種站點投贊成票,從而,很少有用戶會訪問這樣的站點或者在這樣的站點消耗大量的時間。
然而目前的搜索引擎可能向實際上和特定查詢關系不大的鏈接分配較高的相對優先級,通過檢查關于各個站點的顯式數據,克服這種局限性;作為相關性確定中的一個因素,可分析人類輸入,借此使相關性的評估更可靠,從而搜索結果更準確。
另外,個人或者定制的搜索引擎可以關于系統的各個用戶的秘密監視的數據為基礎。這種搜索功能和上面描述的相似;但是,根據本發明的這一方面,個體數據被應用于進行搜索的每個用戶。于是,通過利用關于各個個體收集的用戶簡檔信息,系統能夠提供定制的搜索結果。因此,各個用戶的搜索結果可能不同,即使兩個用戶進行使用相同關鍵字的搜索,因為每個用戶的簡檔是唯一的。例如在第一個用戶對Toyota汽車感興趣,第二個用戶喜愛Honda汽車的情況下,他們都執行利用關鍵字“汽車”的搜索,對于第一用戶來說,本發明的系統把和Toyota相關的站點排列在較前面,對于第二用戶來說,把和Honda相關的站點排列在較前面。
這樣的搜索策略反映了各個個人的簡檔數據,并且適合于提供按照和各個搜索用戶的獨特簡檔數據的相關性遞減的順序排列的搜索結果。同樣,可用的用戶信息越多,則對于指定查詢來說,搜索結果將隨著時間而越來越好。當用戶的簡檔變得更全面時,系統具有可用于定制搜索的更多、更好的數據。
這樣,用戶嗜好可被看成搜索過程中的驅動因素,和上面的汽車例子中一樣。雖然許多常規設計的基于Web的搜索引擎試圖根據相對于查詢項的相關性,對URL名單排序或者排隊,但是目前的技術沒有考慮到單個用戶的嗜好和習慣。另一方面,本發明的系統和方法通過采用關于各個特定用戶的嗜好累積的數據,產生各個用戶的獨特經歷,以便按照和各個用戶的個性和愛好更相符的順序對搜索結果排序。
根據本發明的另一方面,多媒體搜索引擎借助用戶或人類輸入利用和獲取各種類型的信息。因此,除了普通的URL結果之外,搜索結果可包括關于人、電視、視頻、MP3和其它的詳細名單或信息。由于人類知識包含在該系統中,并且在中央數據庫中被分類,因此可包括HTML領域之外的信息,例如電視、廣播、MP3等等。可在HTML中表述這些其它媒體的參考,并且可提供訪問這些其它媒體的參考的鏈接。
例如,通過選擇代表電視節目的鏈接,可在如上所述與系統相連的電視機上顯示對應的電視節目。此外,如果用戶打算進行把電視節目的名稱用作查詢關鍵字的搜索,則搜索結果會產生共有和電視節目的主題一致的嗜好和習慣的人的姓名。通過沿著出自作為搜索結果返回的人名之一的鏈接(所述鏈接可顯示在HTML頁上),可在與系統相連的電視機上觀看該電視節目。
根據本發明的這一方面,指定的搜索結果可返回超出HTML的多媒體內容的許多鏈接。從一個或多個這種鏈接,可發出多級鏈接。即,不是僅僅返回相對于電視節目的鏈接,或者僅僅返回相對于特定用戶的相關個人信息的鏈接,相反,搜索結果可返回相對于其它用戶、其它類型的節目(不僅是電視,而且還有MP3、或者廣播等等)的其它鏈接級,以及超出此范圍之外的其它鏈接級。結果將是樹形鏈接。從而,關于特定電視節目的鏈接會產生關于其它類型的多媒體內容的鏈接,包括個人的介紹、他們的嗜好等等。這些鏈接又可鏈接到超出HTML之外的其它類型的多媒體信息。
本發明的另一重要方面涉及開放式站點推薦服務。顯式用戶輸入和源于用戶行為的隱式用戶數據可被監視,從而能夠了解單個用戶的嗜好和偏愛,并將其保存在中央數據庫中。開放式推薦系統和方法隨后可采用這些嗜好和偏愛使信息檢索的過程個性化,并且幫助用戶判定指定用戶最想要的信息。
由于大量的數據保存在涉及HTML頁面的中央數據庫中,因此系統可采用適合的程序代碼來推薦和單個用戶的簡檔中的數據相一致的某些站點。在系統根據關于數據庫中記錄的不同站點了解的信息,以及根據涉及用戶嗜好的顯式和隱式數據進行推薦或建議的情況下,對于用戶來說,信息定位和檢索將更高效。
重要的是,本發明的推薦功能得到本發明的客戶機一方進行監視的特征的加強;系統可推薦已記錄在中央數據庫中的每個Web站點、URL、人、多媒體或者其它類似的信息來源。而典型的入口站點只推薦入口操作者擁有或者許可的信息,本發明并不局限于此,并且能夠推薦來自搜索空間中的任意地方的站點或者其它消息來源,而不考慮該信息的位置或者所有權。從而,根據本發明的第一方面提供了發明人稱之為“知識服務提供者”或者KSP的功能。從客戶機一側累積的信息當然構成知識;按照各種方式使用戶能夠獲得這些知識,包括(但不局限于)識別指定用戶的嗜好,并且向指定用戶提供涉及這些用戶嗜好的相關信息。
根據本發明的另一方面,系統和方法適合于推薦或建議與特定的人聯系。通過關于各個用戶收集的隱式和顯式數據的有效利用,本發明允許一個用戶找出其它相容的人進行聯系。這簡化了用戶之間的通信,并且鼓勵大規模的信息交換。
就用戶的嗜好或者“簡檔”來說,常規的聊天室、新聞組或者公告板服務(BBS)(它們都簡化了用戶之間的往來對話)存在不足。重要的是,在這種場所產生的任意用戶簡檔完全是本地的,只可使用戶與本地系統的其它用戶通信,即這些系統固有地被封閉或者被集中。采用常規技術的用戶必須首先找出在其中進行交流的適當站點或論壇;只有這樣用戶才可嘗試找出與之對應的其它人。
相反,本發明可采用用戶簡檔中的顯式數據和隱式數據聯系具有共同興趣、相似個性或者共同朋友的用戶,而不存在目前的封閉系統中固有的局限性。用戶不必搜索論壇或者其它聊天站點,因為系統本身提供通信的機制;系統易于提供其它用戶和他們的顯式數據,以及適當的用戶簡檔數據,以便簡化具有相似興趣的人的選擇。由于關于喜愛的URL或者最頻繁搜索的關鍵字的隱式數據包含在用戶的簡檔中,可向其它用戶保證系統的關于相容之人的建議或者推薦是準確的。這是本發明的“知識服務提供者”(KSP)的另一方面。
本發明的另一特征是本發明的收集好的信息內容的方面的改進。根據本發明的該改進方面,提供選擇好的信息內容并向用戶推薦所述信息內容的服務。本發明的這一方面消除了對收集必要信息內容的需要,以及對使內容保持最新的需要。這些努力成本又高又費時,并且一直不是十分有效。上面剛剛提及的需要被本發明的其它方面,以及被Web站點所有者和因特網用戶,尤其是利用本發明的這些其它方面的那些所有者和用戶所滿足。
重要的是,本發明的系統和方法適合于提供指示用戶和當前被載入用戶的瀏覽器中的頁面或URL之間的相似程度,或者用戶和系統的其它會員或用戶之間的相似程度的匹配程度計量器或者相容性標準尺。可向用戶提供關于“匹配”或者相似程度的圖形顯示或者數字指示。由于各種因素的緣故,這種程度會發生變化例如特定站點的內容會隨著時間而變化,或者在系統的正常及不斷增多的應用中,用戶簡檔中的信息會發生變化。如同上面指出的一樣,匹配信息可包括一個用戶和利用該系統的其它人之間的匹配程度。在已知不同用戶的簡檔中相對匹配信息的指示的情況下,一個用戶可選擇鏈接到簡檔最相符的用戶上,而不是選擇其嗜好看起來相當不一致的一個不同用戶。
參考附圖,根據本發明的優選實施例,本發明的上述及其它附帶優點將變得更加明顯。


圖1是根據本發明構成的系統的一個實施例的簡化圖。
圖2是本發明采用的分布式監視過程的一個實施例的簡化圖。
圖3是本發明采用的數據聚集過程的一個實施例的簡化圖。
圖4是本發明的開放式推薦系統和方法的一個實施例的簡化圖。
圖5是本發明的系統和方法的功能的示意圖。
圖6是由根據本發明修改的標準Web瀏覽器軟件采用的圖形用戶界面的表示圖。
圖7是根據本發明一個方面排序的搜索結果的表示圖。
圖8是根據本發明另一方面排序的搜索結果的表示圖。
圖9是本發明的分布式監視系統的一個實施例的簡化圖。
具體實施例方式
現在參見附圖,圖1是根據本發明構成的系統100的一個實施例的簡化圖。中央服務器120具備可從能夠接入因特網的任意機器訪問的程序代碼,例如JAVA代碼,或者其它適當的程序設計。位于遠程位置的用戶可通過工作站、桌上型計算機、或者便攜式筆記本計算機或膝上型計算機,或者通過諸如便攜式個人通信系統(PCS)或個人數字助手(PDA)設備之類的無線或手持式終端接入因特網,于是接入中央服務器120。如同本領域中已知那樣,也可通過傳統的陸線電話連接,通過諸如ISDN、DSL、T-1、T-3、同軸或光纖電纜之類的高帶寬連接,或者通過蜂窩或無線數字技術接入因特網。
中央服務器120上的程序代碼包括記錄信息并對其分類的中央數據庫,并且還適合于與位于遠程位置,例如用戶的計算機終端上的輔助程序代碼140通信。程序代碼140可從中央服務器120傳輸或者下載到用戶終端上,或者從磁性媒體、光學媒體或者其它媒體安裝到用戶終端上。在圖1中舉例說明的例證實施例中,程序代碼140可與因特網導航軟件界面,例如可包含在信息終端180中;另一方面,程序代碼140可提供因特網導航功能。
本領域的技術人員將認識到包含在信息終端180中的典型瀏覽器軟件通常適合于被其它軟件,例如程序代碼140修改,所述其它軟件既可改變瀏覽器軟件呈現給用戶的圖形用戶界面(GUI),又可提供額外的功能。程序代碼140可包括下述功能“瀏覽器一方”或者“客戶機一方”監視用戶的瀏覽行為;搜索引擎功能;可根據被監視用戶的嗜好定制或個性化的橫幅廣告;調查或投票功能;和彩票,吃角子老虎機,或者其它類型的運氣游戲。
作為輔助功能的一部分的廣告或游戲的提供正好在本領域普通技術人員的能力范圍之內。廣告的提供本身已為人們所知;但是,利用已知的各種統計或加權函數,根據用戶或群體簡檔和嗜好定制廣告在本發明的預期中。重要的是,由于在客戶機一側,廣告功能被集成到程序代碼140中,并且其應用并不依賴于特定網站的服務器一方的監視,因此針對性的或者定制的廣告不受目前被加載到瀏覽器軟件180中的特定URL的限制。
可通過插入工具條或者可包括下拉菜單、操作按鈕等的其它交互式界面,實現GUI的改變,通過所述工具條或者其它交互式界面,用戶可以使用系統的能力,或者保持對系統能力的控制。在這方面,程序代碼140不僅簡化用戶終端和中央服務器120之間的通信,而且還用作用戶和本發明的系統之間的前端界面。
在操作上,位于用戶終端的程序代碼140適合于接受直接從用戶輸入的數據,還可監視瀏覽器軟件的活動,以便收集關于用戶的瀏覽行為、習慣、嗜好、偏愛等等的信息。例如,當用戶的瀏覽器軟件與特定網站相連或者瀏覽特定網站,例如可保存在Web服務器198上的一個特定網站時,程序代碼140可把關于該事務的信息從用戶的計算機終端傳送給中央服務器120。本實施例中可監視的例證數據可包括信息終端180通過瀏覽器軟件訪問的網站的統一資源定位符(URL);可從該網站的超文本標記語言(HTML)代碼解析出的URL信息。另還還可記錄瀏覽該網站之前,用戶提交的關鍵字或者檢索詞,以及訪問的持續時間。
如圖1中所示,在用戶的終端,或者在瀏覽器一側或者在客戶機一側監視或收集數據。可通過來自用戶的直接輸入,或者通過信息終端180中程序代碼140和瀏覽軟件之間的界面進行這種數據收集。隨后,程序代碼140可把收集的數據傳送給中央服務器120,以便記錄、分類和與從其它用戶收集的數據聚合。在希望或者要求保密或者專用傳輸的情況下,可通過防火墻130或者其它安全機構進行遠程終端上的程序代碼140和中央服務器120之間的傳輸。
由遠程終端上的程序代碼140收集的信息一般可被分類為隱式數據或顯式數據。在如上所述,程序代碼140只監視用戶的瀏覽行為,例如通過跟蹤所訪問的URL和每次在指定站點停留的持續時間的情況下,收集的數據被分類為隱式數據,因為輸入既不是主動向用戶請求的,也不是作為特定的用戶操作直接接收的。用戶可能希望使隱式數據監視功能無效。另一方面,通過與程序代碼140的直接互動,可以用戶輸入的信息的形式收集顯式數據。例如,用戶可選擇由程序代碼140啟用的增強界面所提供的操作按鈕,這種選擇會調用程序腳本,所述程序腳本允許用戶進行關鍵字搜索,或者輸入和在用戶當前正在訪問的網站提供的信息的質量有關的書面評論或者意見。另一方面或者另外,程序代碼140使用戶能夠參加正在進行的與同時訪問該網站的其它用戶的對話,或者為其它瞬時用戶張貼消息。
可以同時收集隱式和顯式數據。在一個實施例中,收集的數據可包括下述一些或者全部訪問的URL;在各個站點花費的持續時間;用戶和各個URL或站點相聯系的關鍵字;用戶輸入的和各個站點相關的顯式評論;通過投票的各個站點的用戶評價;和URL或人相關的推薦的接受或拒絕;和其姓名卡片(name card)已被獲取和/或收集的其它用戶相關的數據;用戶聯系的人們;和用戶ID。從站點和URL本身可獲得其它信息,并且可獲得涉及其它多媒體的數據,例如和電視和無線電廣播,人們、MP3、地址、電話號碼等等的信息。從而,除了Web服務器198之外,信息終端180可以多種已知方式與電視臺196,廣播站197和MP3站199交互作用。例如,電視信號(在這種信號內包括垂直消隱間隔)具有包含諸如節目字幕、節目概要、演員表之類信息的足夠容量。類似的信息(例如歌曲名稱、作曲者、演唱者、作詞者等)可包含在無線電信號或者MP3信息的各個部分中。這種技術也在本領域的普通技術人員的能力范圍之內,因此這里不進行詳細說明。如同這里將更詳細說明的一樣,也可作為用戶嗜好的識別的一部分獲取這種信息,并且與其它用戶和他們的嗜好進行匹配。
當用戶在瀏覽話路中訪問不同的站點時,在客戶機一方收集相關信息,并將其傳送給中央服務器120,在中央服務器120,收集的信息可保存在與該用戶、該URL或者站點本身相關,或者與該用戶和該URL或站點都相關的適當數據庫記錄中,如下所述。
在這種信息收集策略的一個實施例中,通過利用瀏覽器軟件或其它因特網工具,借助信息終端180完成監視。信息終端180與各種信息源,例如圖1中的電視臺196、廣播站197和MP3站199相連。信息終端180又和多媒體終端185通信,或者在某些情況下控制多媒體終端185。這種多媒體終端可包括無線電、電視、電話、PCS、PDA、錄像機、衛星或有線電視接收機或者機頂盒,或者能夠接收和發射數據的基于微處理器的其它設備。在該實施例中,前述及其它各種多媒體終端可通過例如導線、電纜、電力線或者本領域中已知的無線組網技術恰當地與能夠接入因特網的終端,例如配有利用系統的客戶機一方的程序代碼140修改的瀏覽器軟件的信息終端180相連。通過恰當的硬件連接和軟件通信,系統適合于監視在這些其它終端類型上進行的活動。Jini(tm)代碼非常適合于使鏈路啟動恰當的設備。利用Jini(tm)編寫恰當的執行程序同樣在本領域普通技術人員的能力范圍之內。還存在其它技術,例如NipponTelephone and Telegraph(NTT)的I-模式,根據該模式,用戶可借助來自用戶的蜂窩電話機的信號打開或關閉電視機或收音機。
例如,程序代碼140可包括與和多媒體終端185交互的網絡界面裝置182,例如紅外或射頻收發器、電力線網絡適配卡或者本領域中已知的其它常規網絡硬件通信的適當例程。程序代碼140可接收和發送數據,以便監視在一個或多個信息源196-199的活動。呈隱式數據形式的信息,例如電視機或收音機(作為多媒體終端185的例子)可調到的電視頻道或廣播臺,例如由有線或衛星節目提供者提供的用于屏幕顯示的節目名稱和主題,撥打的電話號碼,活動持續時間等等可通過網絡界面裝置182從多媒體終端185傳送給位于信息終端180的程序代碼140。正如HTML數據的情況一樣,程序代碼140隨后可把這樣收集的多媒體數據傳送給中央服務器120以供分類、記錄和聚合。用戶可能希望使這種隱式多媒體數據監視功能無效。
通過程序代碼140實現的網絡界面裝置182的軟件控制不僅能夠實現一個或多個多媒體終端185上用戶活動的客戶機一側隱式數據監視,而且還簡化了從信息終端180對這種多媒體終端185的控制。如果用戶選擇代表電視節目的HTML鏈接,則信息終端180中的瀏覽器軟件可把該選擇傳遞給程序代碼140,程序代碼140隨后可通過網絡界面裝置182發送數據命令,啟動與系統相連的電視機或者其它多媒體終端185,并且把接收器調到恰當的頻道,從而在電視機上顯示電視節目。
要注意的是雖然為了便于說明,網絡界面裝置182和多媒體終端185被表示成和信息終端180分離,不過把一種或多種多媒體終端180包含在信息終端180中,以及把適當的網絡界面裝置182包含在信息終端180中在本發明的預期范圍之內。
圖2是本發明采用的分布式監視過程的一個實施例的簡化圖。圖2中的中央服務器220代表上面參考圖1說明的相同中央服務器120;另外,圖中還表示了保存在中央服務器220的數據庫225。如上所述,與服務器一側相反,在客戶機一側監視用戶活動;這種客戶機一側監視方案被分布或者開放到這樣的程度,即監視系統的整個功能不依賴于單個站點或服務器的能力,收集的信息的應用也不局限于特定的站點。
更仔細地觀察圖2,若干Web站點被表示為附圖標記293-299;若干用戶的具有因特網能力的計算機終端被表示為附圖標記210-214,每個所述終端位于不同的遠程位置。如圖2中的實箭頭所示,位于遠程終端210的用戶可訪問Web站點293、395、297和299。圖2中舉例說明的分布式監視系統的一個優點在于借助上面說明的程序代碼,可把關于各個受訪Web站點293、295、297和299的信息從遠程終端210傳送給中央服務器220,而不考慮在Web站點293-299本身是否支持本地監視;相對于中央服務器220的這種數據傳輸在圖2中由虛箭頭代表。如上所述,既支持代表被監視的用戶活動的隱式數據的傳輸,又支持代表用戶意見、評論、推薦、投票行為等的顯式數據的傳輸。
在遠程終端210監視的客戶機一側的數據可在中央服務器220由程序代碼分類和揀選,并且據此保存在數據庫225中。要認識到隨著主動參與分布式監視系統的遠程終端210-214的數目的增大,數量日益增大的信息可累積在數據庫225中,從而可供檢索之用。
而在特定站點或公司的服務器一方累積的知識庫的應用局限于在該處監視和收集數據的服務器、站點或者公司,當用戶從一個站點瀏覽到另一站點時,在客戶機一側監視用戶活動的策略使得圖2中舉例說明的系統能夠從許多來源收集數據,并且能夠在除了最初收集數據的位置之外的其它位置中實現累積的數據。其結果是一種開放式的知識庫,它起源于本發明的在客戶機一側,而不是在服務器一側進行監視的分布式監視系統。
圖3是本發明采用的數據聚集過程的一個實施例的簡化圖,它可把如圖2中舉例說明的分布式監視方案用于自多個遠程信息來源的數據采集。和圖2中舉例說明的情況相反,所有遠程終端310-314主動參與某一類別的網絡活動,安裝在各個相應終端310-314中的程序代碼正在監視客戶機一側的活動,而不考慮正在相應Web站點393-399進行的任何本地服務器一側的監視。如圖3中虛線所示,借助安裝在各個相應終端中的程序代碼,每個遠程終端310-314既可傳送和特定用戶訪問的各個Web站點393-399相關的隱式數據,又可傳送和每個相應用戶的反饋、評論、推薦、投票行為等相關的顯式數據。
和圖2相反,圖3中舉例說明的情況涉及收集數據以便記錄在數據庫325中的所有遠程終端310-314。因此,最后分類并保存在數據庫325中的數據相應更多。中央服務器320可被設計成以致數據庫325具有用于采用該系統的眾多用戶的足夠容量,并且可以升級,以便當用戶數目擴大時容納更多的通信。
現在轉向數據庫325本身的結構。重要的是注意系統的每個用戶在中央服務器320具有相關的數據庫記錄。在任意指定的用戶記錄中,可保存和用戶的嗜好和習慣,即用戶簡檔相關的各種信息。通過搜索結果的定制分級或者通過針對性的站點推薦,系統可訪問并利用記錄的數據使每個用戶的互動經驗個性化。另外,可使用戶簡檔數據,尤其是用戶輸入的顯式數據適用于其它用戶,從而用戶,以及每個用戶必須提供的知識和推薦被系統識別為可搜索的信息。從而前面提及的開放式知識庫構成系統可以使用的可搜索信息。
此外,統計數據可保存在數據庫325中。就統計數據不必涉及單個用戶的簡檔來說,該統計數據可被認為是通用的或者“全局的”。相反,統計數據可和系統上的所有用戶最頻繁訪問的URL,與之相關的關鍵字、感興趣的最新主題等等有關。從圖3的檢驗可知,本發明的系統和方法適合于聚集和各個單個Web站點393-399多得多的信息。另外,各個用戶輸入的顯式數據并不僅僅局限于HTML技術,雖然通過HTML鏈接可訪問這種數據。例如,用戶可提供不是HTML格式的和電視、廣播或者視頻廣播相關的信息;從而,可獨立于在環球網上通常可搜索的HTML文件保存統計數據。
圖4是本發明的開放式推薦系統和方法的一個實施例的簡化圖。如上所述,除了在保存于中央服務器420的數據庫425中累積記錄之外,本發明的系統和方法還適合于以這樣的方式實現記錄的數據,以便定制目前支持的因特網活動的其它非個人的方面和特征。
和圖2和3中分別描述的數據收集和數據聚集情況相反,圖4圖解說明在數據實現或者開放式推薦過程中,數據流的方向被反轉。保存在中央服務器420的程序代碼421適合于和各種遠程終端,例如附圖標記410-414表示的那些遠程終端通信。對來自安裝在遠程終端,例如終端412的程序代碼的請求起反應,程序代碼421可以請求從數據庫425抽取數據,根據遠程終端412請求的操作的特性處理該數據,并且隨后把任意數據處理的結果傳送給終端412。
作為數據處理的結果,終端412隨后可和其它終端,例如終端410或413通信。終端412還可訪問Web站點,例如Web站點495或499。如前參考圖1說明的那樣,響應從位于中央服務器420的程序代碼421接收的信息,安裝在終端412中的程序代碼也可與網絡界面裝置通信,所述網絡界面裝置可控制諸如電視、視頻或音頻接收器或者記錄設備之類的多媒體終端。這種進一步的通信目的在于幫助終端412的用戶檢索和用戶的簡檔中的信息一致的數據、廣播或其它信息。
操作上,程序代碼421用于使與中央服務器420相連的各個遠程終端410-414和系統的功能性接口,所述系統功能性又由數據庫425中數據記錄的累積啟用。如上所述,程序代碼421最后可對來自安裝在和中央服務器420相連的任意遠程終端上的程序代碼的請求起反應;因此,程序代碼421執行的功能如下所述發生變化。
圖5是本發明的系統和方法的功能的示意圖。在圖5中的中心,中央服務器被指定為附圖標記520,并且可包括分別由附圖標記522和523代表的關于HTML數據和多媒體數據的數據庫記錄。舉例來說,在圖5左側圖解說明的項目代表可如上參考圖1-3說明那樣收集和聚集的隱式數據和顯式數據的特性。如圖5中所示,可在中央服務器520聚集、分析和組織在客戶機一側監視的數據,隨后按照用戶簡檔、統計記錄、HTML數據、多媒體數據等將其保存在恰當的記錄中。
匹配引擎550接受來自于HTML數據庫522和多媒體數據庫523,以及中央服務器520的輸入,并且如下對用戶簡檔和愛好分類。可產生許多類別(例如100個)。對于每個類別,可存在與之相關的一組字詞(例如100個)。例如,對于“款式”來說,可存在諸如尺寸、顏色、樣式、商標、性別之類與之相關的字詞。對于“體育”來說,諸如棒球、足球、高爾夫球、曲棍球之類字詞可與之相關。
可以各種方式進行關于指定類別的恰當關鍵字的識別。一種方式可以是預先獲得與指定類別相關的若干頁面,并且進行詞法分析,以便識別在這些頁面內以某一預定頻率出現的非類屬字詞。這些非類屬字詞隨后會是整個關鍵字列表的一部分。
通過識別類別以及和每個類別相關的字詞,可存在例如10000個關鍵字的詞匯索引,當用戶移動到不同的網頁時,客戶機一側的軟件將監視所述關鍵字的出現。還存在與不同關鍵字相關的加權,從而某些字詞,例如“棒球”可在體育類別內得到和某些更專業的字詞,例如“投手”或“接球手”不同的加權。這種加權可以是靜態的,即預定的,或者可根據不同的考慮因素而變化。
可根據預先提供的用戶嗜好列表確定加權。例如,如果用戶把體育標記為關心的領域,則和用戶不把體育標記為關心的領域的情況相比,用戶訪問的網頁中字詞“棒球”的實例可被賦予更高的加權。例如,對影星感興趣的某人可訪問討論Marilyn Monroe(嫁給棒球運動員JoeDiMaggio的女演員)的網頁。和查閱DiMaggio相比,對于該用戶來說,Marilyn Monroe查閱的加權系數更大。另一方面,用戶可能對體育感興趣,并且可訪問與Marilyn Monroe結婚的Joe DiMaggio的網頁。對于該用戶來說,和查閱Marilyn Monroe相比,DiMaggio查閱的加權系數更大。
當客戶機一側的軟件識別這些關鍵字并計數這些關鍵字中各個關鍵字的出現時,相對于該特定用戶更新服務器一側的數據庫,這樣,該用戶的嗜好和要求的分類越來越細。
利用通過受訪網頁中關鍵字的出現而識別的用戶嗜好,能夠識別用戶嗜好的向量。隨后把可被恰當加權的這些向量和其它用戶的向量進行匹配,以便識別具有相似興趣的用戶。
中央服務器的程序代碼,例如上面參考圖4說明的程序代碼421代碼支持在圖5的右側描述的推薦功能。雖然本領域中已知許多分級或分類引擎,目前的技術沒有把用戶簡檔數據包括在分級程序中。本領域的技術人員要認識到編程腳本可把用戶簡檔數據和直接從HTML代碼解析出的統計數據或信息進行比較,以便向相對于特定用戶的特定站點分配兼容性的相對量度。類似地,編程腳本可比較保存在兩個用戶的相應簡檔中的相應數據,并且隨后計算用戶自己的相容性的相對量度。
操作上,用戶簡檔信息,例如經常訪問的URL,最頻繁提交的關鍵字等等可被圖5中圖解說明的推薦和分級引擎中的程序代碼采用。來自各種推薦和分級引擎的輸出可被傳送給安裝在遠程終端上的程序代碼,所述遠程終端上的程序代碼再向用戶提供顯示。如上參考圖1說明的那樣,所述顯示可與由標準瀏覽器軟件代碼提供的GUI界面。
關于系統的例證能力(一般由在圖5的右側描述的附圖標記524-529表示),位于中央服務器和用戶的遠程終端的程序代碼都可在單一的綜合系統中提供許多先進特征。例如,本發明可提供對例如在529舉例說明的BBS類型服務的使用,使用戶能夠交換關于各種感興趣主題的基于文本的評論。該系統和方法還可提供對不能由基于HTML的瀏覽器顯示的多媒體格式,例如電視或無線電廣播的使用。顯示在HTML頁面上的超鏈接可用于直接連接用戶和特定的電視節目或其它實況廣播。選擇在HTML頁面上顯示的這種鏈接可啟動被設計成與超出HTML范圍的其它媒體交互作用的一個或多個軟件編程腳本。
便利的是,本發明的系統和方法適合于提供先進的搜索引擎分級和過濾功能,所述搜索引擎分級和過濾功能利用了對于系統的所有用戶,在中央服務器記錄的監視數據和用戶投票歷史。這種分級引擎被表示為附圖標記524。常規的搜索引擎由基于關鍵字頻率或元標記的預定算法驅動,從而提供搜索結果或者“命中”,所述搜索結果或者“命中”既不以各個站點和指定關鍵字的實相關性的量度為基礎,又不以在這些站點提供的信息的用戶評價為基礎。另一方面,本發明的系統和方法通過利用在中央數據庫中聚集的隱式和顯式數據改進搜索,能夠獲得更有意義的搜索結果。
根據一個實施例,分級和過濾引擎524可采用和已提供肯定反饋和每個用戶最頻繁地與特定站點相聯系的關鍵字的用戶的數目有關的統計數據;通過這種過濾可識別官方、民眾和相關站點,并據此分級。重要的是,收集的關于站點的信息并不局限于其關心的信息由批準的內容提供者供給的入口型技術。由于在客戶機一側收集數據,并在中央服務器聚集,因此適合于被記錄并且隨后被實現的信息并不受入口站點的操作者或者其它信息內容提供者的有選擇限制,而是被擴展到從客戶機一側可到達的任意各個站點。
利用顯式和隱式監視數據來評估作為潛在搜索結果的每個URL消除了作為命中返回的停用鏈接的可能性,因為用戶不可能投票贊成這種站點,從而較少用戶會訪問這種站點。通過在中央服務器520的數據庫中編輯來自注冊用戶的數據,關于任意指定查詢的搜索結果將隨著時間而改進;當更多的數據被添加到該數據庫中時,可消除停用鏈接和無關站點,能夠更容易地識別出最相關的站點。不斷改進的結果和已知的搜索引擎形成對照,當增加網頁時,已知的搜索引擎可提供更多的結果,但是不是更好的結果或者是不同的結果。
類似地,個人或者定制的搜索引擎525可以私下監視的和系統的各個用戶相關的用戶簡檔數據為基礎。可分析從特定用戶簡檔抽取的個人數據,并將其和進行搜索的各個用戶的前述統計數據進行比較。于是,通過利用關于各個個人收集的用戶簡檔信息,并且通過把用戶簡檔數據和關于指定的潛在搜索結果的統計數據進行比較,系統可提供定制的搜索結果。至少部分地作為與用戶簡檔數據的比較結果的函數,可以對各個預期的搜索結果進行加權或分級。
在兩個用戶進行查詢項或關鍵字為“汽車”的搜索的情況下,兩個用戶想的可能不是相同類型的汽車。第一個用戶可能喜愛跑車,從而在第一個用戶的簡檔中可能存在關于汽車競賽、駕駛學校和賽車駕駛員俱樂部的數據;另一方面,第二個用戶可能喜愛運動型多用途汽車,由第二用戶的簡檔中涉及4輪驅動汽車和越野駕駛運動型多用途汽車的最佳地點的地圖的記錄所證實。在相同的關鍵字“汽車”的情況下,第一個用戶的搜索結果可具有利用較高的相對優先級或權重分級的涉及跑車的命中記錄,而第二個用戶的搜索結果可具有利用較高的相對優先級分級的涉及運動型多用途汽車的命中記錄。這種搜索策略反映了各人的個人簡檔數據,并可提供搜索結果以便降低相對于各個搜索用戶的獨特簡檔數據的相關性。
如前提到的那樣,隨著用戶的簡檔變得更全面,以及隨著更多的數據被添加到數據庫中,搜索結果將改進。例如,如果跑車愛好者對Ferraris的嗜好成為該簡檔的一部分,則搜索結果將會集中于這些特定的跑車,或者非常昂貴的汽車,或者意大利跑車。
如前所述,多媒體搜索引擎526利用并訪問通過用戶或人類輸入而提供的各種信息。因此,除了普通的URL結果之外,搜索結果還可包括關于人、電視、視頻、MP3及其它的逐條記載的列表或信息。在數據記錄存在數據庫中的情況下,通過使電視節目的主題和特定的關鍵字相關,該關鍵字的搜索將返回可能相關的任意URL以及該電視節目記錄。由于人類知識被包含在該系統中,并且在中央數據庫520中按目錄分類,因此HTML領域之外的信息,例如電視、廣播、MP3等等可記錄在數據庫520中,在數據庫520中,已如同參考圖1說明的那樣進行了多媒體終端的隱式監視,或者一個或多個用戶已提供關于多媒體主題的顯式數據。數據庫520構成上面說明的開放式知識庫。
可在HTML中表述這些其它媒體的參考,并且可提供鏈接以便訪問這些參考。例如,通過選擇代表電視節目的鏈接,可在與系統相連的電視機上顯示相應的電視節目。通用遠程控制及其它各種基于無線或有線的組網裝置或者適配卡目前能夠使單個設備通過紅外或射頻傳輸或者其它通信技術控制其它不同終端。在這種設備在操作上和用戶的計算機終端和由嵌入用戶的因特網瀏覽器軟件中的程序代碼控制的軟件耦接的情況下,HTML超鏈接可用于調諧數字無線電接收器,對盒式磁帶錄像機編程以便在特定時間記錄特定的電視頻道等等。
此外,由于系統能夠使用用戶輸入的顯式數據,因此根據記錄的顯式數據的特性,可產生各種關聯。如果用戶要進行把電視節目的名稱作為查詢關鍵字的搜索,則搜索結果可得到共有和電視節目的主題一致的嗜好和習慣的人名。通過沿著出自作為搜索結果返回的人名之一的鏈接(所述鏈接可顯示在HTML頁上),可在與系統相連的電視機上觀看該電視節目。同樣,當數據庫中記錄的大量信息變得更全面,系統將更有能力把不同用戶的簡檔和關于多媒體主題的數據聯系起來。
體現在本發明中的程序代碼還可利用顯式用戶輸入和源于用戶行為的隱式用戶數據對單個用戶的嗜好和偏愛分類,并把監視的信息保存在中央數據庫中。重要的是,開放式推薦系統和方法隨后可采用這些嗜好和偏愛使信息檢索的過程個性化,并幫助決定指定用戶最想要的信息。根據已知的用戶趨向和與不同站點相關的統計數據,目標站點提名系統或推薦引擎可建議特定的URL。
由于關于HTML頁的大量數據被保存在中央數據庫,系統可采用前述程序代碼推薦和單個用戶的簡檔一致的某些站點。這樣的站點推薦引擎被表示為附圖標記527。在系統根據和數據庫中記錄的不同站點相關的已知信息,以及根據和用戶的偏愛有關的顯式和隱式數據進行推薦或建議的情況下,對于用戶來說,信息定位和檢索更高效。
同樣,由于本發明利用在客戶機一側收集數據的分布式監視系統,因此在范圍方面,站點推薦引擎527并不局限于特定入口操作者喜愛的或者可通過常規搜索引擎訪問的少數幾個站點。本發明的站點推薦引擎527可識別并建議適宜的內容或者相容的站點,而不考慮位置或域;只要可從客戶機一側訪問該站點,則關于該站點的信息就可保存在數據庫中,從而,系統可向潛在感興趣的用戶推薦該站點。
除了特定用戶可能感興趣的Web站點或其它信息源之外,本發明的系統和方法的程序代碼還適合于提供指定用戶愿意與之通信的推薦或建議人員(由附圖標記528表示)。通過有效利用關于各個用戶收集的隱式數據和顯式數據,本發明允許一個用戶找出其它人員,從而聯系在他們相應的用戶簡檔中反映出具有相同興趣的人。程序代碼可分析用戶簡檔,并且根據隱式和顯式監視數據識別哪些用戶具有對應或者相似的興趣,從而簡化用戶之間的通信,鼓勵大規模的信息交換。
類似于上面討論的站點推薦引擎527,人員推薦引擎528并不局限于特定新聞組、聊天室或者BBS的封閉的一組注冊會員,相反可擴展到在系統中具有簡檔或記錄的所有人員。由于以在客戶機一側監視的數據為基礎的詳細記錄被保存在關于每個用戶的簡檔的中央服務器520上,因此本發明的系統和方法可向用戶提供被推薦或者相容人員的名單,盡管他們和該用戶不是相同新聞組的注冊會員。
另外,本發明的系統和方法特別適合于指示包含在特定用戶簡檔記錄中的數據和與各個站點或者與其它用戶相關的數據之間的相似處或差異。例如,可提供匹配程度計或者相容性標準尺,以便顯示用戶和特定URL之間的相似程度,或者用戶和系統的其它會員或用戶之間的相似程度。可向用戶提供“匹配”或相似程度的圖形顯示或者數字指示。
要認識到由于各種因素的結果,用戶和指定站點之間的相似程度可發生變化例如,特定站點的內容可隨著時間而變化,或者在系統的正常并且日益增多的使用中,用戶簡檔中的信息可能發生變化。額外的匹配信息最好包括一個用戶和使用該系統的其它人的相對相容性的量度。已知不同用戶的簡檔中信息的相對匹配的指示,一個用戶就可選擇具有最相符簡檔的用戶的鏈接,而不是選擇其嗜好看起來相對不一致的不同用戶的鏈接。
圖6是由已根據發明修改的標準Web瀏覽器軟件,例如上面參考圖1說明的瀏覽器軟件180采用的GUI的表示圖。如前簡單所述,安裝在遠程終端的程序代碼可與中央服務器通信,并且可提供一個界面,通過所述界面,用戶可以使用該系統的功能。圖6中描述的例證GUI為上面參考圖5說明的前述交互功能提供方便的界面。當安裝在遠程服務器上時,程序代碼可按照標準瀏覽器模式利用該界面機件,或者“異常分支(hook)”,并且可在GUI中安裝額外的圖文框,例如圖6中的工具條641。本領域中已知,工具條641或者其它界面圖文框可包括操作按鈕、下拉式菜單、啟動搜索特征的文本輸入框,和接受用戶輸入的其它GUI器件,以及廣告橫幅等等。
在一個例證實施例中,工具條641可包括操作按鈕或者下拉式菜單,它們提供對顯式數據輸入腳本的利用。通過從菜單中選擇某一項,可向用戶提供可輸入評論、推薦和其它信息的文本框或者窗口;另外或者另一方面,可按照和目前的新聞組或BBS相似的方式張貼給其它用戶的消息,或者實時發送所述消息。所提供的任意這種顯式數據可記錄并累積在中央服務器,以便如上所述由系統使用。
此外,工具條641可包括允許投票,使用戶能夠表達特定網站、人員、當前事件或者關心的其它主題的肯定或者否定評論的操作按鈕。在圖6中,投票按鈕由工具條641中的心形物表示。工具條641還可為系統的搜索引擎功能提供接受用戶關鍵字輸入的文本框648。
考慮到用戶對隱私權的關心,本發明的系統和方法適合于有選擇地被停用。為了支持這種特征,可提供工具條641中的操作按鈕或者其它機件,以使用戶能夠關閉或者禁用系統的隱式數據收集功能。圖6中,停用功能由工具條641中顯示字詞“Off”的按鈕表示。
在一個實施例中,可在工具條641中設置“相容性標準尺”647,用于提供用戶簡檔數據相對于和正被載入瀏覽器軟件中的站點相關的統計數據的相容性的量度。滑動比例尺、圖形或者其它類型的計量器向用戶提供和當前站點相關的統計數據與保存在關于用戶嗜好的中央數據庫中的數據的匹配程度的視覺或者數字指示。圖6中,相容性標準尺647中所示的較高水平用于指示用戶的簡檔數據和在中央數據庫保存的關于“Hamburger Web站點”的統計數據較一致。當用戶從一個站點瀏覽到另一站點時,隨著各個連續的頁面或者站點被載入瀏覽器,相容性標準尺647指示的水平發生變化,從而在正常瀏覽或者搜索活動中,可在工具條641中向用戶提供相容性的顯示。
另外,如上參考圖1所述,包含在系統中的程序代碼能夠在工具條641中實現下述功能搜索引擎特征;可按照被監視用戶嗜好進行優化或定制的橫幅廣告;調查或投票功能,它簡化了關于Web站點、人等等的顯式數據輸入;和彩票、吃角子老虎機,或者其它類型的運氣游戲。本領域的技術人員會認識到可借助恰當的程序腳本把這些特征包括在工具條641中。
圖7和8是根據本發明的不同方面排序的搜索結果的相應表示。圖7和8中的主瀏覽窗口表示分別通過本發明的分級引擎524和個人分級引擎525獲得的搜索結果的例子。可在由正被載入瀏覽器的站點的HTML提供的文本輸入框749或849輸入關鍵字查詢;另一方面,如上參考圖6所述,通過在工具條641中設置的文本輸入框648輸入的關鍵字查詢,可使用搜索引擎程序腳本。對這樣的關鍵字查詢或其它搜索請求起反應,位于中央服務器的程序代碼可配合或者監督關于該查詢項的數據庫搜索。
初始搜索可由位于中央服務器的程序代碼進行,或者對于大型的Web入口站點或者基于Web的搜索引擎,初始搜索可以是“out-sourced”。就沒有關于進行搜索的特定用戶對檢索的信息進行過濾或者個性化來說,這樣的初始搜索的結果是普通的或者標準的。隨后如上所述,通過分級和過濾引擎524(單獨地或者和個人分級引擎525一道)過濾這些初始結果。
可按照最初的一般搜索對返回的結果分級;另一方面,在借助分級引擎524過濾之后,可按照對于各個命中記錄,以投票輸入的形式提供顯式數據的用戶的數目對結果排序。由圖7左側的括弧指示的頭三個結果或者命中記錄用附圖標記742表示。根據本發明的一個方面,按照各個站點從瀏覽用戶收到的票數安排該分級。從而,按照投票用戶的順序排列圖7中所示的例證例子中的結果,同時鄰近各個命中記錄及其相應的相容性標準尺顯示投票用戶的數目。
在圖7中圖解說明的例子中,用戶已輸入找出關于“hamburger”的信息的查詢,人數最多的用戶贊同In‘n Out Burger,于是在圖7中首先排列該結果。人數第二多的用戶選擇了Wendy’s,從而該結果被排列在第二位。于是,用戶會發現或者得出和“Wendy’s”相比,“In‘nOut”包含更相關的信息。圖7中,如上所述,命中記錄的順序由向各個相應搜索結果提供顯式投票數據的用戶的數目確定;這些結果還沒有經受本發明的個人分級引擎525的處理。
由于依賴于群體投票選舉偏好,因此在把結果呈現給用戶之前,系統沒有考慮用戶嗜好和與列表中不同搜索結果有關的數據之間的相關程度。從雖然“Carl′s Jr.”得到的票數最少,從而將其置于命中記錄列表的底部,但是相應的相容性標準尺指示出用戶嗜好和“Carl′s Jr.”中獲得的信息之間的最高相對相關程度這點上可看出情況是這樣。于是,用戶可根據相容性標準尺選擇首先瀏覽“Carl′s Jr.”,盡管在分級中其位置較低。從圖7的檢查中可認識到,分級引擎524既可向用戶提供以投票者數目和命中記錄的順序反映的關于各個命中記錄的一般相關性的信息,又可提供與用戶的簡檔數據和在各個站點可獲得的信息的相容性有關的信息。
另外,在采用個人分級引擎525的情況下,可根據關于各個命中記錄的數據和包含在用戶簡檔中的數據的比較,按照個性化的順序提供搜索結果。在圖8中所示的例證例子中,用戶已輸入找出關于“hamburger”的信息的相同查詢,同樣人數最多的用戶贊同In‘n Out Burger。和圖7中一樣,人數次多的用戶選擇了Wendy’s。但是和圖7相反,圖8中的結果已被個人分級引擎525處理,從而用戶與站點的相容性影響返回命中記錄的順序。雖然“Carl′s Jr.”得票最少,但是由于它具有和用戶簡檔數據的最高相對相容程度,因此在列表中該站點被顯示成第一命中記錄。
即,當完成初始搜索時,本發明的系統可采用既適合于過濾搜索結果,從而提供有意義的搜索結果,又適合于按照保存在各個用戶的簡檔中的數據對搜索結果排隊或者排序的程序設計。根據本發明的一個實施例,可從數據庫抽取和各個URL相關的統計數據,并且可被用于按照最受歡迎的或者最頻繁訪問的URL組織搜索結果。這種統計結果使得能夠按照參與分布式監視系統的所有用戶累積的所有數據檢查URL。本實施例代表海量信息的改進的大規模搜索過濾引擎,例如圖5中的分級和過濾引擎524,其例證結果顯示在圖7中。根據本發明的另一實施例,位于中央服務器的編程代碼可抽取進行搜索的用戶的數據庫記錄,即用戶簡檔數據,以及作為搜索結果返回的URL的數據庫記錄,即HTML數據。該實施例代表獨特的、小規模的個性化搜索過濾引擎,例如圖5中的個人分級引擎525,用于據此使搜索結果適合用戶嗜好的要求,如圖8中所示。
抽取的數據庫記錄的比較可提供特定的HTML文件包含用戶認為特別有趣的信息,或者所述特定HTML與所述信息相關的指示。抽取的記錄之間的高度相關可被系統理解為用戶興趣和站點內容之間的相容性;相反,用戶嗜好和站點內容之間的低相關性或者差異可被系統理解為不相容。位于中央服務器的編程代碼適合于對被載入用戶的瀏覽器的或者作為搜索中的命中記錄返回的每個URL進行這種相容性分析。
如前所述,可以各種方式向用戶顯示搜索結果的這種個性化排列或排序結果。在圖7和8中,鄰近相應的相容性標準尺,例如測量計743或843和關于該命中記錄投票的用戶數目的數字指示顯示各個相應的命中記錄。由相應測量計指示的水平用作通過上述相容性分析,由個人分級引擎計算的用戶簡檔中的數據和關于相應搜索結果的數據的相關性的圖形顯示。
另一方面,服務器的程序代碼適合于對搜索結果重新排序,從而可在該列表中更高的位置顯示和用戶的簡檔數據最一致的那些URL。在這樣的實施例中,其中排列或順序反映與用戶嗜好的相容性,可以不要求或者需要諸如測量計843之類的相容性標準尺,因為和用戶簡檔數據的相對相容程度將作為因素體現在向用戶呈現URL的順序的確定中,如圖8中所示。雖然在這種實施例中以命中記錄的排序反映相對匹配程度,不過也可提供相容性標準尺,以便向用戶顯示指示用戶簡檔數據和HTML數據之間的絕對相關程度。
例如,由圖7和圖8右側的括弧所示,并且分別由附圖標記744和844表示的用戶列表已按照進行搜索的用戶的相容性的降序進行排列。可利用和上面關于HTML數據說明的相容性分析相似的編程過程確定該排序;但是這種情況下,可從數據庫抽取用戶簡檔并且關于相似處和差異檢查所述用戶簡檔。用戶簡檔數據之間的相關程度可被編程代碼理解為直接和其數據簡檔被比較的兩個用戶的相容性有關。
本實施例中,雖然用戶列表744或844的順序表示出關于進行搜索的用戶的相對相容性,不過也可提供諸如測量計745或845之類的相容性標準尺,以便向進行搜索的用戶提供相對于先前評論特定站點的各個其它用戶的絕對相容性的指示。這樣,進行搜索的用戶可判斷是否要對特定選票、評論、批評或推薦給予重視。從而相容性標準尺可向用戶建議鏈接到某些個人(這里“NAMI”)并且通過他們的姓名卡片等獲取信息可能是最多產的。
如圖7和8中的樹形結構所示,用戶列表744或844可以是已提供和URL列表742或842中的第三命中記錄相關的反饋、評論或者其它顯式數據的人的詳細名冊。對于搜索結果中返回的每個命中記錄存在類似的用戶名單。可有選擇地查看這種提供和特定URL相關的顯式數據的用戶列表。系統適合于獲取由涉及所考慮站點的各個相應列表用戶提供的顯式數據;于是,進行搜索的用戶在瀏覽到特定站點之前,可以顯式用戶意見、投票、評論和建議的形式獲得重要信息。重要的是,該信息由先前已訪問該站點、并且具有關于該站點的足以明確輸入想法和評論的強烈意見的人們提供。
除了用作各個列表用戶和搜索者的簡檔的相容性的視覺指示的測量計745或845之外,諸如由附圖標記746和846表示的操作按鈕圖標可和各個列表用戶聯系起來。選擇恰當的操作按鈕圖標746或846可使搜索者獲取和相應列表用戶相關的信息。位于用戶終端的程序代碼可調用另一窗口,其中關于列表用戶的電子郵件地址、簡檔數據、喜愛的站點、評論、投票歷史、推薦和其它顯式數據可供查看。為了便于到達電子郵件服務器或者引導到推薦的或者非常喜愛的URL或者多媒體功能,可提供超鏈接。
現在返回工具條641及其內容,本領域的技術人員將認識到可采用各種GUI編程方法使用戶能夠利用各種各樣的系統能力,例如在圖5的右側描述的那些系統能力。可在工具條641中以下拉式菜單或者操作按鈕的形式提供對一個或多個BBS或者新聞組系統的訪問。通過選擇這樣的服務,用戶可以進入基于文本的消息窗口、對話框、實時交流的聊天室等等。用戶可張貼或者傳送和關心的任意主題有關的顯式數據,以及查看其它用戶的輸入。這種功能既由位于中央服務器的程序代碼所支持,又由位于用戶的相應遠程終端的程序代碼所支持。
另外,工具條641可提供用于調用編程腳本的交互式部件,所述編程腳本允許用戶提供關于當前正被載入用戶的瀏覽器中的特定URL或者站點的明確評論和反饋,或者對其投贊成票或反對票。按照上面參考先前已訪問某一站點的用戶的列表744或844說明的方式,其它用戶最好也可獲得這樣的輸入。本實施例中,選擇操作按鈕可調用用于輸入文本評論的文本窗口。這樣的顯式數據可被傳送給中央服務器以便記錄在和該特定站點相關的數據記錄中;另外,用戶簡檔數據可和該數據記錄聯系起來,從而能夠實現圖7和8中所示的樹形結構。
也可通過圖6中所示的工具條641使用個人推薦功能。如上關于相容性分析說明的那樣,可抽取位于中央數據庫中的數據記錄進行分析和與其它記錄進行比較。按照在普通的用戶活動中計算相容性等級的相同方式,用戶可獨立調用適合于提供關于Web站點、人們、地方等等的單獨的相容性引擎,例如圖5中的推薦引擎527和528。
位于用戶終端的程序代碼可接納關于共同關心特定主題的其它用戶的名單的請求。位于中央服務器的編程腳本分析用戶簡檔記錄,并且提供相容用戶的名單,或者建議具有相同興趣的其它用戶經常訪問的特別受歡迎的Web站點或者新聞組。類似地,中央服務器可采用代碼推薦和特定主題相關并且和用戶的簡檔數據相一致的受歡迎的或者權威的Web站點;連同建議的站點一起,系統另外還可提供喜愛該站點的其它用戶的名單,以及他們各自的明確評論。
重要的是,本發明的系統和方法被設計成可監視用戶對推薦系統的響應和反應,并且可鼓勵反饋;這種監視導致更多并且更好的隱式和顯式數據的循環收集和累積。從而,系統可根據在客戶機一方監視的隱式數據形成各個用戶的越來越準確并且更完整的簡檔;另外,在顯式數據的記錄中累積的大量知識和信息可擴展到提供和不斷擴展的一批主題和人們相關日益詳細并且更有用的評論和推薦。
圖9是本發明的分布式監視系統的一個實施例的簡化圖。如上參考圖1所述,典型的Web瀏覽器軟件980通常適合于被另外的軟件,例如程序代碼940修改,所述另外的軟件既可改變瀏覽器軟件980向用戶呈現的GUI,又可提供前述輔助功能。特別地,如圖9中所示,程序代碼940和遠程終端的瀏覽器軟件980及操作系統990連接,以便能夠如上所述在客戶機一方實現用戶瀏覽活動的監視。
操作上,位于用戶終端的程序代碼940適合于接受用戶直接輸入的數據,借助瀏覽器軟件980中的恰當代碼,例如COM界面981,還可監視瀏覽器軟件的活動。COM界面981是一個“異常分支”,允許第三方程序員插入和瀏覽器軟件980一道工作的代碼。
可從瀏覽器軟件980收集的數據包括當前被加載的URL;遠程終端的屏面中瀏覽器窗口的位置;和諸如GUI器件選擇、下載完成和URL請求之類的各種瀏覽事件。通過與遠程終端的操作系統990的連接,程序代碼940可獲悉對特定URL的訪問的持續時間。如上所述,在客戶機一方收集適當的數據之后,程序代碼940可把收集的數據傳送給中央服務器,以便記錄、分類以及和從其它用戶收集的數據聚集在一起。
根據上述說明,可看出本發明的系統和方法提供致力于搜索空間的特性,并且適合于有效的用戶交互作用的通用個性化信息檢索功能。公開的優選實施例只是對本發明的舉例說明,決不是對本發明的限制。根據前述詳細的公開內容,對本領域的技術人員來說,本發明的其它修改和變化是顯而易見的。從而,雖然這里只具體描述了本發明的一些實施例,但是在不脫離本發明的精神和范圍的情況顯然可對其做出各種修改。
權利要求
1.一種從搜索空間中的一個或多個信息來源檢索信息的方法,所述方法包括在中央計算機提供中央程序代碼;所述中央程序代碼適合于保存數據記錄的中央數據庫,從所述信息來源獲取信息,以及比較所述數據記錄和來自所述信息來源的所述信息;識別所述中央程序代碼和位于若干遠程終端中的各個終端上的遠程程序代碼之間的通信;所述遠程程序代碼適合于監視所述若干遠程終端中每個終端上的網絡活動,收集與所述網絡活動相關以及與所述若干遠程終端中的任意終端訪問的每個所述信息來源相關的被監視數據,把所述被監視數據傳送給所述中央程序代碼;在所述中央計算機累積從位于所有所述若干遠程終端的所述遠程程序代碼傳來的所述被監視數據,并且根據所述被監視數據補充所述數據記錄;響應來自所述若干遠程終端之一的信息請求,通過采用所述中央計算機上的所述中央程序代碼,識別來自于所述信息來源的候選響應信息;通過采用所述中央計算機上的所述中央程序代碼,把所述數據記錄和所述請求以及和所述候選響應信息進行比較;和作為所述識別和所述比較的結果,把和包含與所述請求相關的信息的一個或多個所述信息來源有關的數據傳送給所述若干遠程終端之一上的所述遠程程序代碼。
2.一種累積和搜索空間中的一個或多個信息來源相關的數據的中央數據聚集系統,所述系統包括若干遠程終端上的遠程程序代碼;所述遠程程序代碼適合于監視所述若干遠程終端中每個終端上的網絡活動,收集與所述網絡活動相關以及與所述若干遠程終端中的任意終端訪問的每個所述信息來源相關的被監視數據,以及傳送所述被監視數據;和中央計算機具有中央程序代碼,能夠與所述遠程程序代碼通信,接收從所有所述若干遠程終端上的所述遠程程序代碼傳來的所述被監視數據;所述中央程序代碼適合于保存數據記錄的中央數據庫,從所述信息來源獲取信息;其中所述中央數據庫包括和至少一個所述若干遠程終端訪問的各個所述信息來源相關的至少一個數據記錄,其中所述中央計算機具有輔助程序代碼,適合于累積從所有所述若干遠程終端上的所述程序代碼傳來的所述被監視數據,并且根據所述被監視數據補充所述數據記錄。
3.收集并累積和搜索空間中的一個或多個信息來源相關的數據的分布式監視系統,所述系統包括中央計算機具有中央程序代碼,適合于保存和所述信息來源相關的數據記錄的中央數據庫;和遠程程序代碼,能夠和所述中央程序代碼通信,并且適合于監視所述若干遠程終端中每個終端上的網絡活動,收集與所述網絡活動相關以及與所述若干遠程終端中的任意終端訪問的每個所述信息來源相關的被監視數據,并把所述被監視數據傳送給所述中央程序代碼;其中所述中央計算機具有適合于根據所述被監視數據補充所述數據記錄的輔助程序代碼。
4.一種從搜索空間中的一個或多個信息來源檢索信息的方法,所述方法包括累積和若干遠程終端中的任意終端訪問的各個所述信息來源相關的被監視數據;把所述被監視數據從所述若干遠程終端中的每個終端傳送給中央計算機;在所述中央計算機聚集由所有所述若干遠程終端傳送的所述被監視數據;響應信息請求,從所述信息來源獲取信息,并且把所述被監視數據和所述請求以及和來自所述信息來源的所述信息進行比較;和作為所述獲取和所述比較的結果,識別包含和請求相關的信息的一個或多個所述信息來源。
5.一種從搜索空間中的一個或多個信息來源檢索信息的方法,所述方法包括累積和若干遠程終端中的任意終端訪問的各個所述信息來源相關的被監視數據;在中央計算機聚集所述被監視數據;響應信息請求,把所述被監視數據和所述請求以及和來自所述信息來源的信息進行比較;和根據所述比較識別一個或多個所述信息來源。
6.一種從搜索空間中的一個或多個信息來源檢索信息的開放式推薦系統,所述系統包括適合于收集和所述信息來源相關的被監視數據的分布式監視系統;和適合于從所述分布式監視系統接收所述被監視數據、并且適合于把所述被監視數據保存在中央計算機上的中央數據聚集系統;其中響應信息請求,所述開放式推薦系統比較和所述信息來源相關的所述被監視數據和所述請求,隨后推薦所述被監視數據和所述請求相似的信息來源。
全文摘要
分散的,或者分布式監視系統通過收集顯式數據(以推薦、評論或者投票的形式由用戶直接輸入)和/或隱式數據(根據用戶的瀏覽活動,由系統收集),提供跨越大量遠程信息來源的數據收集。可在客戶機一方本地監視數據,并且隨后把數據傳送給中央數據庫。可在服務器聚集在客戶機一方從許多遠程信息來源收集的數據。在累積過程中,在中央數據庫中對分布式監視系統收集的數據進行分類和組織以便檢索。所收集數據的實現包括應請求傳送顯式數據,以及在簡化信息檢索過程的定制和個性化的開放式推薦系統中利用顯式數據、隱式數據或者顯式數據和隱式數據的組合。可向用戶提供關閉或者“取消選定”系統的隱式數據收集功能的選擇權。
文檔編號G06F17/30GK1527976SQ01811812
公開日2004年9月8日 申請日期2001年5月30日 優先權日2000年5月30日
發明者內山幸樹 申請人:內山幸樹
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1