中文字幕无码日韩视频无码三区

事件屬性語句確定及基于事件屬性語句預警方法和裝置的制造方法

文檔序號:9818312閱讀:444來源:國知局
事件屬性語句確定及基于事件屬性語句預警方法和裝置的制造方法
【技術領域】
[0001]本發明實施例涉及數據處理技術,尤其涉及一種事件屬性語句確定及基于事件屬性語句預警方法和裝置。
【背景技術】
[0002]在現實生活中有很多事件,尤其是金融事件,是可以通過對一些現有數據的運算處理來進行預測的。其中,量化投資就是一項非常典型的針對金融投資事件的預測方法。
[0003]所謂量化投資,就是指借助現代統計學、數學的方法,從海量歷史數據中尋找能夠帶來超額收益的多種“大概率”策略,并紀律嚴明地按照這些策略所構建的數量化模型來指導投資,力求取得穩定的、可持續的、高于平均的超額回報。與傳統的定性投資方法不同的是,量化投資不依靠人的感覺來管理資產,而是根據人的投資思想和投資經驗來構建數學模型,并利用計算機來處理大量歷史數據,在較短的時間內驗證模型的有效性,只有當模型在歷史數據上的表現滿足要求時,才會被進一步應用到實盤交易中。
[0004]現有技術中的量化投資方法都是基于已有的股票量價數據實現的。而由于量價數據中的噪音較多且數據完全公開,僅僅以此為數據源構建有效的投資策略難度極大,往往收效甚微。原因是股票投資本質上是一種博弈行為,只依據完全公開的信息進行決策沒有任何優勢。

【發明內容】

[0005]有鑒于此,本發明實施例提供一種事件屬性語句確定及基于事件屬性語句預警方法和裝置,以優化現有的事件預測技術,提高事件預測的精準度。
[0006]在第一方面,本發明實施例提供了一種事件屬性語句的確定方法,包括:
[0007]獲取與目標事件相關聯的多個待測語句,其中,所述語句包括:詞、詞組以及包含變量的句子;
[0008]根據各所述待測語句在網絡數據庫中出現次數隨時間的變化規律,獲取與各所述待測語句的異常出現次數對應的異常時間,其中,所述網絡數據庫中的內容包括時間標簽;
[0009]根據各所述待測語句的所述異常時間與所述目標事件歷史發生時間的關系,確定與所述目標事件對應的事件屬性語句。
[0010]在第二方面,本發明實施例提供了一種基于事件屬性語句的預警方法,包括:
[0011]采用本發明實施例提供的事件屬性語句的確定方法確定與目標事件對應的事件屬性語句;
[0012]實時監測互聯網數據,如果識別到所述事件屬性語句在設定時間區間內的出現次數發生異常,則對所述目標事件進行預警。
[0013]在第三方面,本發明實施例提供了一種事件屬性語句的確定裝置,包括:
[0014]待測語句獲取模塊,用于獲取與目標事件相關聯的多個待測語句,其中,所述語句包括:詞、詞組以及包含變量的句子;
[0015]異常時間獲取模塊,用于根據各所述待測語句在網絡數據庫中出現次數隨時間的變化規律,獲取與各所述待測語句的異常出現次數對應的異常時間,其中,所述網絡數據庫中的內容包括時間標簽;
[0016]屬性語句確定模塊,用于根據各所述待測語句的所述異常時間與所述目標事件歷史發生時間的關系,確定與所述目標事件對應的事件屬性語句。
[0017]在第四方面,本發明實施例提供了一種基于事件屬性語句的預警裝置,包括:
[0018]事件屬性語句確定模塊,用于本發明實施例提供的事件屬性語句的確定裝置確定與目標事件對應的事件屬性語句;
[0019]目標事件預警模塊,用于實時監測互聯網數據,如果識別到所述事件屬性語句在設定時間區間內的出現次數發生異常,則對所述目標事件進行預警。
[0020]本發明實施例通過根據與目標事件關聯的待測語句在網絡數據庫中出現次數隨時間的變化規律,獲取與各待測語句的異常出現次數對應的異常時間,并根據各待測語句的異常時間與目標事件歷史發生時間的關系,確定與所述目標事件對應的事件屬性語句的技術手段,實現了基于互聯網中的大數據,將某段時間內網絡中出現次數異常的語句與目標事件的發生建立關系,找到對目標事件具有預測作用的事件屬性語句,進而可以實現根據事件屬性語句在網絡數據中的出現情況對該目標事件進行預測的技術效果,優化了現有的事件預測技術,提高了事件預測的精準度。
【附圖說明】
[0021]圖1是本發明第一實施例的一種事件屬性語句的確定方法的流程圖;
[0022]圖2是本發明第二實施例的一種待測語句在網絡數據庫中出現次數隨時間變化的示意圖;
[0023]圖3是本發明第二實施例的一種事件屬性語句的確定方法的流程圖;
[0024]圖4是本發明第三實施例的一種事件屬性語句的確定方法的流程圖;
[0025]圖5是本發明第四實施例的一種基于事件屬性語句的預警方法的流程圖;
[0026]圖6是本發明第五實施例的一種事件屬性語句的確定裝置的結構圖;
[0027]圖7是本發明第六實施例的一種基于事件屬性語句的預警裝置的結構圖。
【具體實施方式】
[0028]為了使本發明的目的、技術方案和優點更加清楚,下面結合附圖對本發明具體實施例作進一步的詳細描述。可以理解的是,此處所描述的具體實施例僅僅用于解釋本發明,而非對本發明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與本發明相關的部分而非全部內容。在更加詳細地討論示例性實施例之前應當提到的是,一些示例性實施例被描述成作為流程圖描繪的處理或方法。雖然流程圖將各項操作(或步驟)描述成順序的處理,但是其中的許多操作可以被并行地、并發地或者同時實施。此外,各項操作的順序可以被重新安排。當其操作完成時所述處理可以被終止,但是還可以具有未包括在附圖中的附加步驟。所述處理可以對應于方法、函數、規程、子例程、子程序等等。
[0029]第一實施例
[0030]圖1為本發明第一實施例提供的一種事件屬性語句的確定方法的流程圖,本實施例的方法可以由事件屬性語句的確定裝置來執行,該裝置可通過硬件和/或軟件的方式實現,并一般可集成于用于存儲海量互聯網數據內容的服務器中,其中,所述服務器可以為單個服務器,也可以為多個服務器構成的集群服務器。
[0031 ]本實施例的方法具體包括:
[0032]110、獲取與目標事件相關聯的多個待測語句,其中,所述語句包括:詞、詞組以及包含變量的句子。
[0033]在本實施例中,所述目標事件具體可以包括可重復發生的,且會被特定因素(或者說偶發事件)直接或者間接影響的事件,典型的,金融類事件。例如:股市上漲或者下跌事件、房市上漲或者下跌事件以及設定商品價格的上漲或者下跌事件等。
[0034]其中,與目標事件相關聯的待測語句具體是指會對該目標事件的發生產生影響的偶發事件所對應的詞、詞組或者包含有變量的句子。本發明實施例的技術方案就是通過對待測語句進行一定的數據處理,以獲取待測語句中對目標事件有預測作用的事件屬性語句。
[0035]舉例而言,“跳樓”、“破產”等詞;“宣布重組”、“資產評估”等詞組;以及“XX被立案調查”、“XX非公開發行”、“XX10送10”等以“XX”為變量的句子;這些語句所對應的偶發事件都會對股市下跌事件產生直接或者間接的影響。因此可以將上述語句作為與股市下跌事件相關聯的待測語句。
[0036]在本實施例中,獲取與目標事件相關聯的多個待測語句具體可以包括:
[0037]獲取與所述目標事件所屬領域相關聯的備選語句集;將所述備選語句集中各備選語句與所述網絡數據庫中的內容進行匹配,并根據匹配結果對各備選語句進行權重排序;根據排序結果,獲取設定數目的備選語句作為所述待測語句。
[0038]也可以包括:獲取由所述目標事件各個歷史發生時間所確定的時間區間;在與所述目標事件所屬領域對應的網絡數據庫中,將位于所述時間區間內的內容中包括的各個語句進行權重排序;根據排序結果,獲取設定數目的語句作為所述待測語句。
[0039]當然,還可以采取其他的方式獲取與目標事件相關聯的多個待測語句,例如:人工選定等,本實施例對此并不進行限制。
[0040]120、根據各所述待測語句在網絡數據庫中出現次數隨時間的變化規律,獲取與各所述待測語句的異常出現次數對應的異常時間,其中,所述網絡數據庫中的內容包括時間標簽。
[0041]在本實施例中,所述網絡數據庫具體可以包括:搜索引擎數據庫、官方信息發布平臺的后臺數據庫以及個人信息發布平臺的后臺數據庫中的一項或者多項,對此并不進行限制。優選的,可以根據目標事件的類型,選取相對應的網絡數據庫,例如,如果目標事件的類型為金融類事件,則選取金融類的網絡數據庫。
[0042]在本實施例中,網絡數據庫中的內容均包括時間標簽,因此,當確定出待測語句在網絡數據庫中的哪些內容中出現后,可以同時得到該待測語句的出現時間,相應的,可以選取一個設定的時間單位,例如,天、星期或者月等。之后觀察不同時間下,各
當前第1頁1 2 3 4 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1