英語詞句的存取裝置方法和裝置的制造方法
【技術領域】
[0001] 本發明涉及學習裝置的技術領域,尤其是涉及一種英語詞句的存取方法和裝置。
【背景技術】
[0002] 現在,在英語學習時,常常需要在英語詞典的語料數據庫中,檢索英語單詞以及與 英語單詞相關的英語短語、英語句子或語法規則等各種信息。
[0003] 在知識庫方面,比較成熟且具有代表性的知識庫有WordNet、FrameNet、VerbNet、 中文概念詞典(CCD)等;在語料數據庫方面,有比較成熟的大型語料數據庫,如英國國家語 料數據庫(BNC)、柯林斯英語語料數據庫(BoE)等。
[0004] 現有技術中,語料數據庫通常都是通過手工直接構建而成,將英語詞句直接錄入 到語料數據庫中,這就需要耗費大量的人力和物力,構建語料數據庫的效率低;而且,現有 語料知識庫沒有很好的將英語單詞、英語短語和英語句子等與語法規則結合起來,所以,在 現有的英語語料數據庫中檢索英語單詞、短語或句子時,常常無法檢索到與英語詞句相關 的比較全面的信息。
【發明內容】
[0005] 本發明提供一種英語詞句的存取方法和裝置,用于解決現有技術中構建語料數據 庫效率低,在語料數據庫常常無法檢索到與英語詞句相關的比較全面的信息的問題。
[0006] 為解決現有技術中的上述問題,本發明提供了一種英語詞句的存取方法,其中,包 括:
[0007] 向語料數據庫中導入預設格式的英語詞句;
[0008] 解析所述英語詞句的概念和所述概念的屬性,獲取所述英語詞句的語法規則;
[0009] 存儲所述英語詞句及與所述英語詞句相關聯的語法規則。
[0010] 本發明還提供了一種英語詞句的存取裝置,其中,包括:
[0011] 導入模塊,用于導入預設格式的英語詞句;
[0012] 解析模塊,用于解析所述英語詞句的概念和所述概念的屬性,獲取所述英語詞句 的語法規則;
[0013] 存儲模塊,用于存儲所述英語詞句及與所述英語詞句相關聯的語法規則存儲模 塊。
[0014] 本發明提供的實施例的有益效果:
[0015] 在本發明提供的實施例中,向語料數據庫中導入預設格式的英語詞句,以減少構 建語料數據庫所耗費的人力和物力,提高構建語料數據庫的效率,解析英語詞句的概念和 概念的屬性,獲取英語詞句的語法規則,存儲英語詞句及所述英語詞句的語法規則,以將英 語詞句與語法規則結合起來,從而能快速高效地檢索到與英語詞句相關的全面語言信息。
【附圖說明】
[0016] 本發明上述的和/或附加的方面和優點從下面結合附圖對實施例的描述中將變 得明顯和容易理解,其中:
[0017] 圖1為本發明英語詞句的存取方法第一實施例的流程圖;
[0018] 圖2為本發明英語詞句的存取方法第二實施例的流程圖;
[0019] 圖3為本實施例單數可數名詞為主語時主謂一致的語法規則;
[0020] 圖4為本發明英語詞句的存取裝置第一實施例的結構示意圖;
[0021] 圖5為本發明英語詞句的存取裝置第二實施例的結構示意圖。
【具體實施方式】
[0022] 下面詳細描述本發明的實施例,所述實施例的示例在附圖中示出,其中自始至終 相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附 圖描述的實施例是示例性的,僅用于解釋本發明,而不能解釋為對本發明的限制。
[0023] 圖1為本發明英語詞句的存取方法第一實施例的流程圖。如圖1所示,本實施例 英語詞句的存取方法的工作流程具體包括如下步驟:
[0024] 步驟101、向語料數據庫中導入預設格式的英語詞句。
[0025] 在本步驟中,可以將英語詞句按照預設格式輸入到純文本格式TXT文件中,然后 向語料數據庫中導入TXT文件中的英語詞句。在實際應用中,可以將TXT格式的英語詞典 中的英語詞句數據導入到語料數據庫中,以提高構建語料數據庫的效率。在本實施例中,人 工設定的英語詞句的概念包括:英語單詞、英語短語和英語句子等,人工設定的概念的屬性 至少包括:英語單詞的音標、詞義、同義詞、反義詞和派生詞。例如,TXT文件中英語單詞的 預設格式可以為:英語單詞、音標和詞義。
[0026] 英語知識庫中英語單詞的分類如表1所示:
[0027] 表1.語料數據庫中英語單詞的分類
[0028]
[0029] 由表1可知,英語單詞分為開放詞類和封閉詞類;開放詞類包括名詞、動詞、形容 詞和副詞;封閉詞類包括介詞、代詞、連詞、助動詞和限定詞。其中,名詞又可分為普通名詞 和專有名詞;動詞分為及物動詞、不及物動詞和兼類動詞;限定詞分為冠詞和數詞;可數名 詞包含個體名詞和集體名詞,不可數名詞包含物質名詞與抽象名詞。
[0030] 在本實施例中,語料數據庫中英語短語的分類如表2所示:
[0031] 表2.語料數據庫中英語短語的分類
[0032]
[0033] 由表2可知,英語短語包括:習語成語、不定式短語、分詞短語和短語動詞;其中, 分詞短語包含現在分詞短語和過去分詞短語。在語料數據庫中,英語短語的預設格式為〈 屬性,定義域,值域〉,英語短語的概念類屬性包括釋義和用法,英語短語的專業類屬性包括 索引詞、同義詞、反義詞、搭配和例句等。
[0034] 在本實施例中,在語料數據庫中,英語句子的預設結構為〈屬性,定義域,值域〉, 英語句子的概念類屬性包括中文翻譯、句子長度和詞形還原,英語句子的專業類屬性包括 檢索詞、單詞因子和短語因子等;可以將現有資源導入語料數據庫中,現有資源包括詞典或 語法書籍中的經典例句等。
[0035] 本實施例中,與英語詞句相關的屬性、定義域和值域如表3所示:
[0036] 表3.英語詞句相關的屬性、定義域和值域
[0037]
[0038] 在本實施例中,在向語料數據庫中導入預設格式的英語詞句之后,進入步驟102。
[0039] 步驟102、解析英語詞句的概念和概念的屬性,獲取英語詞句的語法規則。
[0040] 在本步驟中,可以采用人工解析語料數據庫中的英語詞句,以獲取英語詞句的語 法規則,包括將現有的英語詞句的語法規則輸入到語法規則數據庫中。在本實施例中,也可 以采用計算機解析英語詞句的概念和屬性,以獲取英語詞句的語法規則。其中,獲取英語詞 句的語法規則包括:獲取英語詞句中的各個英語單詞之間的語法關系,以及獲取英語詞句 與語法規則之間的關聯關系。
[0041] 解析英語詞句中的概念及其屬性,獲取英語詞句的語法規則之后,進入步驟103。
[0042] 步驟103、存儲英語詞句及與英語詞句相關聯的語法規則。
[0043] 在本實施例中,將步驟101中的英語詞句和步驟102中的語法規則存儲到語料數 據庫中。在實際應用中,可以在語料數據庫中設置英語單詞數據庫,用于存儲英語單詞;在 語料數據庫中設置英語短語數據庫,用于存儲英語短語;在語料數據庫中設置英語句子數 據庫,用于存儲英語句子。還可以在語料數據庫中設置英語語法數據庫,用于存儲英語詞句 的語法規則。
[0044] 從英語句子庫中讀取英語句子,在英語句子中切分出英語單詞,根據英語單詞庫 中的單詞概念,與英語單詞庫中對應的英語單詞建立關聯。在英語句子切分出英語短語,通 過短語數據庫中的英語短語概念,與短語數據庫中對應的英語短語建立關聯;同時,將英語 句子與語法數據庫中的語法規則進行匹配,將符合某個語法規則的英語句子導入該語法規 則之下,成為語法規則中的一個新個體,從而實現將英語詞句與語法規則進行有效的關聯, 形成一個立體的、相互關聯的英語詞句的知識結構。
[0045] 在本實施例中,向語料數據庫中導入預設格式的英語詞句,以減少構建語料數據 庫所耗費的人力和物力,提高構建語料數據庫的效率,解析英語詞句的概念和概念的屬性, 獲取英語詞句的語法規則,然后存儲英語詞句及所述英語詞句的語法規則,以將英語詞句 與語法規則結合起來,從而能快速高效地檢索到與英語詞句相關的全面語言信息。
[0046] 圖2為本發明英語詞句的存取方法第二實施例的流程圖。如圖2所示,本實施例 英語詞句的存取方法的工作流程具體包括如下步驟:
[0047] 步驟201、向語料數據庫中導入預設格式的英語詞句。
[0048] 在本步驟中,將英語詞句按照預設格式輸入到純文本格式TXT文件中,然后向語 料數據庫中導入TXT文件中的英語詞句。在本實施例中,英語知識庫中英語單詞的分類如 表1所示,語料數據庫中英語短語的分類如表2所示。在語料數據庫中,英語短語的預設格 式為〈屬性,定義域,值域〉,英語短語的概念類屬性包括釋義和用法,英語短語的專業類屬 性包括索引詞、同義詞、反義詞、搭配和例句等。在語料數據庫中,英語句子的預設結構為〈 屬性,定義域,值域〉,英語句子的概念類屬性包括中文翻譯、句子長度和詞形還原,英語句 子的專業類屬性包括檢索詞、單詞因子和短語因子。
[0049] 在本實施例中,概念類屬性是指那些描述性的、不能通過屬性與其他概念建立聯 系的,如音標、復數等。專業類屬性是指通過屬性能與其他概念建立聯系的,如同義詞,短語 因