本發明涉及(ji)一種(zhong)學科(ke)(ke)知(zhi)識(shi)點實體(ti)識(shi)別與教師(shi)語義網絡(luo)構(gou)建方法(fa)及(ji)系統,屬于教育信息(xi),尤(you)其是關于一種(zhong)基于bert-blstm-crf模型的(de)(de)、結合教材知(zhi)識(shi)點和教師(shi)講課內容的(de)(de)學科(ke)(ke)知(zhi)識(shi)點實體(ti)識(shi)別與教師(shi)語義網絡(luo)構(gou)建的(de)(de)方法(fa)。
背景技術:
1、在(zai)教(jiao)(jiao)育信息化(hua)浪潮(chao)中(zhong),數字化(hua)教(jiao)(jiao)學(xue)(xue)資源的(de)(de)(de)廣泛應(ying)用(yong)帶來了教(jiao)(jiao)學(xue)(xue)方(fang)式的(de)(de)(de)革新。然而,從(cong)這些(xie)資源中(zhong)高效(xiao)、準(zhun)確(que)地提(ti)取知(zhi)識(shi)點,構(gou)建反映(ying)教(jiao)(jiao)師授課邏輯的(de)(de)(de)語(yu)義(yi)(yi)網絡,仍是提(ti)升教(jiao)(jiao)學(xue)(xue)質量和個性化(hua)學(xue)(xue)習的(de)(de)(de)關鍵挑戰(zhan)。現有方(fang)法多(duo)依賴人工標注,效(xiao)率低下,難(nan)以應(ying)對(dui)大規模(mo)數據的(de)(de)(de)處理(li)需(xu)求(qiu)。自動(dong)化(hua)知(zhi)識(shi)點識(shi)別(bie)技術雖有所(suo)發展,但面對(dui)教(jiao)(jiao)學(xue)(xue)內容的(de)(de)(de)多(duo)樣(yang)性和非結構(gou)化(hua)特(te)性,仍存在(zai)準(zhun)確(que)性和深度的(de)(de)(de)不足。因此,研究一(yi)種能夠自動(dong)化(hua)、高精(jing)度地處理(li)教(jiao)(jiao)學(xue)(xue)資源的(de)(de)(de)知(zhi)識(shi)點識(shi)別(bie)和語(yu)義(yi)(yi)網絡構(gou)建方(fang)法,對(dui)于(yu)推動(dong)教(jiao)(jiao)育智能化(hua)具有重(zhong)要意(yi)義(yi)(yi)。
技術實現思路
1、本發明要(yao)解(jie)決的技術(shu)問題是提(ti)供一種一種學科(ke)知識(shi)(shi)點實體識(shi)(shi)別與(yu)教(jiao)(jiao)師語(yu)義(yi)網絡(luo)構建(jian)方法及系統,旨在通過深度學習(xi)技術(shu),提(ti)高知識(shi)(shi)點識(shi)(shi)別的準確(que)性(xing),構建(jian)深層(ceng)次的教(jiao)(jiao)師語(yu)義(yi)網絡(luo),以促進教(jiao)(jiao)育領域的智能化發展。
2、本(ben)發明(ming)采用的技術方案是:一種學科知(zhi)識(shi)點實體識(shi)別(bie)與教師語義網(wang)絡構建方法(fa),包括以下步驟:
3、step?1:收集教(jiao)材知識點文本數(shu)(shu)據和教(jiao)師(shi)講課語(yu)(yu)音(yin)數(shu)(shu)據,并將(jiang)教(jiao)師(shi)講課語(yu)(yu)音(yin)數(shu)(shu)據轉化為(wei)文本數(shu)(shu)據;
4、step?2:對step?1收集到(dao)的所有文本(ben)數據進行預處理,包括(kuo)數據清洗和排序(xu);
5、step?3:利(li)用(yong)bert-blstm-crf模型對預處理后的(de)文本(ben)數據進行(xing)知(zhi)識點(dian)實(shi)體識別;
6、step?4:基于識(shi)別出的知識(shi)點實(shi)體,構(gou)建教師(shi)授(shou)課(ke)內容的語義網絡;
7、step?5:利用構建的(de)(de)(de)語義網絡對預處理后(hou)的(de)(de)(de)文本數(shu)據或新收集的(de)(de)(de)轉化為文本數(shu)據的(de)(de)(de)教(jiao)師講(jiang)課語音數(shu)據進行知(zhi)識點覆蓋范圍和(he)講(jiang)解(jie)深度進行定量分析,生成教(jiao)學(xue)評(ping)估(gu)報告。
8、具體地(di),step?1具體包括以下步驟:
9、step?1.1:使用數據(ju)收集模塊(kuai)收集教材中(zhong)的知(zhi)識點描(miao)述(shu),得到文本數據(ju);
10、step?1.2:通過語(yu)音識(shi)別技術將教師講課的語(yu)音數據轉換(huan)為(wei)文本(ben)數據。
11、具體地,step?2具體包括(kuo)以下(xia)步驟:
12、step?2.1:使用數(shu)(shu)據(ju)(ju)清洗算法(fa)移除文本數(shu)(shu)據(ju)(ju)和文本數(shu)(shu)據(ju)(ju)中不完整或無關的信息,分別得到清洗后的文本數(shu)(shu)據(ju)(ju)集和;
13、step?2.2:根據(ju)數據(ju)集和(he)中文(wen)本的時間戳對(dui)數據(ju)進(jin)行排(pai)序,得到有(you)序文(wen)本數據(ju)集。
14、具體(ti)地,step?3具體(ti)包括以(yi)下步(bu)驟:
15、step?3.1:將預(yu)處(chu)理后的(de)(de)文(wen)本數據輸入至預(yu)訓(xun)練的(de)(de)bert模型,得到文(wen)本的(de)(de)深層(ceng)次語義(yi)表示(shi);
16、step?3.2:將(jiang)輸入至blstm網絡,利用其門控(kong)機制處理序列數據(ju),捕捉時序特(te)征(zheng),得到(dao)序列特(te)征(zheng);
17、step3.3:將傳遞(di)至crf層(ceng),通過以下公(gong)式優化(hua)標簽(qian)(qian)序(xu)列,預測知(zhi)識點出現概(gai)率,是(shi)(shi)(shi)給定(ding)特征序(xu)列下標簽(qian)(qian)序(xu)列 y的(de)(de)概(gai)率,其中 y是(shi)(shi)(shi)一(yi)個序(xu)列,表示(shi)每個元素對(dui)應的(de)(de)標簽(qian)(qian),是(shi)(shi)(shi)歸(gui)一(yi)化(hua)常(chang)數(shu)(shu),和是(shi)(shi)(shi)模型參數(shu)(shu),和用于計算僅給定(ding)當前標簽(qian)(qian)時該標簽(qian)(qian)的(de)(de)概(gai)率,和表示(shi)對(dui)所有(you)可能的(de)(de)標簽(qian)(qian)概(gai)率進(jin)行累加。
18、具體地,step?4具體包(bao)括以下步驟:
19、step?4.1:將知識點實體及預處理后的文本數據作為網(wang)絡節點和邊,構建語義網(wang)絡;
20、step?4.2:利用(yong)分(fen)(fen)析(xi)工具(ju)對語義網絡進行(xing)分(fen)(fen)析(xi),pagerank算(suan)法計算(suan)語義網絡的(de)(de)中(zhong)心(xin)性,分(fen)(fen)析(xi)預處理后的(de)(de)文本數據的(de)(de)結構(gou)和關聯性,得到語義網絡的(de)(de)中(zhong)心(xin)性矩(ju)陣。
21、具(ju)體地,step?5具(ju)體包括以下步驟:
22、step?5.1:根據(ju)(ju)(ju)(ju)語義(yi)網絡和中心性(xing)矩(ju)陣,評估(gu)預處理后的文本數據(ju)(ju)(ju)(ju)或新(xin)收集(ji)的轉化為文本數據(ju)(ju)(ju)(ju)的教師講課語音數據(ju)(ju)(ju)(ju)的知(zhi)識點(dian)覆蓋(gai)度(du)(du)和講解深度(du)(du);
23、step?5.2:結(jie)合覆蓋度和(he)講解深度,生成教學評估(gu)報告。
24、一種學科知識點實體識別與教師語義網絡構建系統,包(bao)括:
25、數據收集模塊(kuai),用于收集教材(cai)知識點文本(ben)數據和教師講(jiang)課(ke)語音(yin)數據,
26、數(shu)據(ju)預(yu)處(chu)理(li)模塊,用于對收集到的數(shu)據(ju)進行預(yu)處(chu)理(li);
27、bert-blstm-crf實(shi)(shi)體識別模塊,用于對預處理后的文本數據進行知識點實(shi)(shi)體識別;
28、語義(yi)網絡(luo)構建模塊,用于(yu)基于(yu)識(shi)別(bie)出的(de)知識(shi)點實體,構建教師授課內容的(de)語義(yi)網絡(luo);
29、教學(xue)評估(gu)報告生成(cheng)模(mo)塊(kuai),用于利用構建的(de)(de)語義網(wang)絡對(dui)預處(chu)理后的(de)(de)文本數據或(huo)新(xin)收集的(de)(de)轉(zhuan)化為文本數據的(de)(de)教師講課(ke)語音數據進行知識點覆蓋范圍和講解深度進行定量(liang)分析,生成(cheng)教學(xue)評估(gu)報告。
30、本發(fa)明(ming)(ming)的(de)(de)(de)有(you)益效果是(shi):本發(fa)明(ming)(ming)運用自然語(yu)言處(chu)理技術(shu),尤其是(shi)實(shi)(shi)體識別算法,對(dui)教(jiao)(jiao)師授(shou)課(ke)內容進(jin)行深入分析(xi)。通過訓練知識點(dian)(dian)識別模型(xing),系(xi)統(tong)能(neng)夠準確捕捉并(bing)識別教(jiao)(jiao)師授(shou)課(ke)中提(ti)(ti)及的(de)(de)(de)學科知識點(dian)(dian),無論是(shi)實(shi)(shi)時授(shou)課(ke)還是(shi)錄播(bo)內容。基于(yu)這些識別出(chu)(chu)的(de)(de)(de)知識點(dian)(dian),系(xi)統(tong)構建出(chu)(chu)一(yi)個詳(xiang)盡的(de)(de)(de)語(yu)義網絡,該網絡能(neng)夠清晰地映(ying)射教(jiao)(jiao)師對(dui)不同知識點(dian)(dian)之間的(de)(de)(de)講解(jie)聯(lian)系(xi),進(jin)而評(ping)估(gu)教(jiao)(jiao)師對(dui)每個知識點(dian)(dian)進(jin)行講解(jie)的(de)(de)(de)覆蓋(gai)范圍和講解(jie)深度。本發(fa)明(ming)(ming)不僅為(wei)教(jiao)(jiao)師提(ti)(ti)供了(le)一(yi)個自我(wo)評(ping)估(gu)和教(jiao)(jiao)學改進(jin)工具(ju),還為(wei)教(jiao)(jiao)育(yu)管理者帶來了(le)一(yi)種新的(de)(de)(de)教(jiao)(jiao)學質(zhi)量監控手段。其應(ying)用范圍廣泛,覆蓋(gai)在線教(jiao)(jiao)育(yu)、傳統(tong)課(ke)堂(tang)教(jiao)(jiao)學以及遠程(cheng)教(jiao)(jiao)育(yu)等多種教(jiao)(jiao)育(yu)環境,對(dui)于(yu)提(ti)(ti)升教(jiao)(jiao)育(yu)質(zhi)量、推動教(jiao)(jiao)育(yu)創(chuang)新具(ju)有(you)深遠的(de)(de)(de)影響。本發(fa)明(ming)(ming)不僅提(ti)(ti)高(gao)了(le)知識點(dian)(dian)識別的(de)(de)(de)準確性(xing),而且能(neng)夠捕捉知識點(dian)(dian)間的(de)(de)(de)復(fu)雜關系(xi),為(wei)教(jiao)(jiao)學質(zhi)量評(ping)估(gu)和個性(xing)化學習(xi)路徑規劃提(ti)(ti)供支持。
1.一種學科知識點實體識別與教(jiao)師語義網絡構建方(fang)法,其特征(zheng)在于:包括以下步驟(zou):
2.根(gen)據權利要求1所述的一(yi)種學(xue)科知識點實體(ti)識別與教師(shi)語義網絡(luo)構建方法(fa),其特(te)征在于:step?1具體(ti)包括(kuo)以下步(bu)驟:
3.根據(ju)權利要(yao)求2所述的一(yi)種學科知識點實體識別與教師語義網(wang)絡構建方法,其特征在(zai)于(yu):step?2具體包括以下步(bu)驟:
4.根據權利(li)要求(qiu)1所述的一(yi)種(zhong)學(xue)科知識點實體識別與(yu)教師(shi)語義網(wang)絡(luo)構建方法(fa),其特征在于:step?3具(ju)體包括以下步驟:
5.根據權利要(yao)求1所述的一種(zhong)學科知識點(dian)實體(ti)識別與(yu)教(jiao)師(shi)語義網絡構(gou)建方(fang)法,其特征在于:step?4具體(ti)包(bao)括(kuo)以下步驟:
6.根(gen)據(ju)權利要求5所述的(de)一種學科知(zhi)識(shi)點實體(ti)識(shi)別與(yu)教師(shi)語(yu)義(yi)網絡構(gou)建方法,其特(te)征在于:step?5具體(ti)包(bao)括以下步驟:
7.一種(zhong)學科知識點實體識別與教師語義網(wang)絡構(gou)建系統,其特征在(zai)于: