一種基于遺忘曲線的自適應能力測試系統的制作方法
【技術領域】
[0001] 本發明涉及一種基于遺忘曲線的自適應能力測試系統,定義題目簇對題庫進行分 類來減少出題的冗余度,并根據用戶的題目簇遺忘曲線來量化用戶對題目簇的記憶程度, 有效地改善題目簇的曝光率不均問題,屬于人工智能和教育學測試評估技術領域。
[0002]
【背景技術】
[0003]自適應能力測試是教育評價中一種廣泛采用的方法,在教育測量理論的發展過 程中,常見的自適應測試理論有項目反應理論(ItemResponseTheory,IRT)、決策理論 (DecisionTheory,DT)、序貫概率比檢驗(SequentialProbabilityRatioTest,SPRT)模 型、知識空間理論(Knowledgespacetheory,KST)等。下面從基本假設、測試目的、復雜程 度、測試精度和應用領域等幾個方面對這些理論進行對比分析,結果如表1所示。
[0004] 表1自適應測試理論對比分析
項目反應理論是自適應測試中廣泛應用的理論,它基于強假設、對被試的能力水平估 計精確度高、應用領域也更加廣泛。該理論假設潛在特質的存在,并認為某一潛在特質都是 一維的,最終的目的是確定被試在一維的能力維度上的位置。在教育測量理論的發展過程 中,以項目反應理論為基礎的自適應測試系統逐漸得到廣大教育工作者的認可,并相繼提 出了多個基于項目反應理論的項目反映模型。目前,基于項目反應理論的自適應測試系統 已廣泛應用于心理學、教育、醫療、認證等領域。
[0005] 雖然現有的自適應測試方法能夠進行基本的能力測試操作,但學者Wainer對GRE 的題庫中題目的使用情況進行了研究,結果發現測試中經常使用的50%的項目只占題庫中 題目總數的12%。這說明,實施能力測試過程中存在題目曝光不均以及冗余度高等問題。針 對項目曝光率和題庫使用率等問題,我們可以從題庫設計的角度出發提出了解決辦法,如 定義題目簇降低冗余度、利用遺忘曲線改善題目簇的曝光率不均、概率方法等。 在傳統的題目生成領域,題目的特征分為主要知識點(radicals)和次要知識點 (incidentals)兩種屬性,同時將題目的主要知識點屬性相同的所有題目的集合定義為一 個題目簇。
[0006] 根據認知心理學的研究成果,人類做題時的遺忘規律符合艾賓浩斯規律,即遺忘 速度是先快后慢。由于每個人的記憶能力各不相同,每個題目簇的記憶難度也千差萬別,所 以通過設置遺忘臨界點抑制高記憶量的題目簇,降低該題目簇的曝光率,來實現題目簇曝 光率的均勻分布。
[0007] 概率方法中最有名是由Sympson和Hetter提出的控制曝光率的條件概率法(簡 稱S-Η法),該方法是基于條件概率來限制對題目被管理的最大頻率,但并不是每個被選中 的項目對于被試來說都具有相同的被管理概率,需要使用項目曝光控制參數對項目進行控 制。對于頻繁選擇的項目,可以設置項目曝光參數為一個預先制定的最大曝光率。這種概 率方法可以有效地控制一個項目的最大曝光率,S-Η方法及其改進方法都是通過抑制那些 可能過度曝光的項目來實現的曝光控制的。
[0008] 現階段的解決曝光率和使用率的方法都存在一些限制,如:1)沒有被選擇的項目 不會被管理;2)當題庫改變或者目標被試的能力分布改變時,曝光控制參數不得不通過大 量的模擬進行更新。因此,為了很好地控制題目的曝光率和使用率,需要合并題目簇和遺忘 曲線對現有的方法來進行優化。
【發明內容】
[0009] 本發明所要解決的技術問題是:現有的自適應能力測試系統大都是基于項目反應 理論(ItemResponseTheory,IRT)來檢測用戶的真實能力水平,這種系統不能有效剔除 高度相似的題目以及剛做過的題目,從而導致出題的冗余度太高和測試長度太長。為解決
【背景技術】中存在的問題,本發明提出一種基于遺忘曲線的自適應能力測試系統,通過定義 題目簇將題庫中高度相似的題目劃分為一個題目簇,并利用遺忘曲線量化用戶對題目簇的 記憶程度,設置遺忘臨界點來降低高記憶量的題目簇的曝光率,從而選出信息量最大的前 靈個達到用戶遺忘臨界點的題目簇即最適合用戶能力水平的題目簇。
[0010] 本發明所述的自適應測試系統包括題庫分類模塊、能力測試模塊、統計分析模塊 和反饋執行模塊,其中能力測試模塊由用戶指令組件、記憶指令組件和測試指令組件三部 分組成,如圖1所示。本發明的技術方案具體包括以下步驟,如圖2所示: 1. 題庫設置及分類。假設題庫中所有題目的猜測度和區分度都一樣,并按照題目中知 識點所在單元設置難度系數。利用本系統的題庫分類模塊從題庫中提取每個題目的知識點 和相關的題目特征參量,將題庫中主要知識點完全相同的題目劃分為一個題目,重新對題 庫進行分類,避免在測試過程中高度相似的題目重復出現; 2. 設置用戶能力測試的考評規則。首先由能力測試模塊的用戶指令組件通過用戶信 息獲取用戶的初始能力值,然后由能力測試模塊的測試長度組件規定本輪測試的測試題目 長度,最后結合步驟1的題目簇的題目特征和能力測試模塊的記憶模塊計算出每個題目簇 的信息量和記憶量,從題庫中選出信息量最大的前_個記憶量達到遺忘臨界點的題目簇, 分別從這觀個題目簇中隨機各選一題共麗個題目作為一輪進行測試; 3. 統計及分析用戶整個測試過程中答題對錯記錄。由統計分析模塊獲取用戶實際測 試的答題對錯記錄,計算該用戶測試過程中的信息量是否滿足測試停止條件,若不滿足,則 返回步驟2的能力測試模塊繼續測試,若滿足則進入步驟4 ; 4. 反饋用戶能力的真實能力水平。當用戶測試的信息量滿足測試停止條件時,則停止 測試,并由反饋執行模塊反饋出該用戶的真實能力水平。
[0011] 本發明定義題目簇和遺忘曲線等輔助教學工具,解決了現有的自適應能力測試系 統不能剔除知識點相同的題目以及剛做過的題目的問題,具有較高的智能化和較少的冗余 度,在很大程度上縮短了傳統自適應測試方法的測試長度。本發明涉及的自適應能力測試 系統不僅可以測試出用戶的真實能力水平,還可以通過用戶對題目簇的記憶曲線,為研究 智能學習方法提供一種有效的分析工具。
【附圖說明】
[0012] 圖1是本發明的結構框圖 圖2是本發明的自適應測試流程圖。
【主權項】
1. 一種基于遺忘曲線的自適應測試系統,包括題庫分類模塊、能力測試模塊、統計分析 模塊W及反饋執行模塊。其中題庫分類模塊從題庫中提取每個題目的知識點和相關的題 目特征參量,將相似題目歸為同一個題目簇;再由能力測試模炔基于遺忘曲線從題庫中抽 取最適合用戶能力水平的題目進行測試;由統計分析模塊統計出用戶測試的答題對錯數目 后,由反饋執行模塊更新修正出該用戶的能力水平估計值;之后能力測試模塊根據更新后 的用戶能力水平值基于遺忘曲線重新抽取題目給用戶測試,由此反復進行而形成一個基于 遺忘曲線根據用戶能力水平變化而自適應出題的測試系統。2. 根據權利要求1所述的一種基于遺忘曲線的自適應測試系統,其特征在于:題庫分 類模塊將比題目最難知識點的難度系數小于等于3的所有知識點定義為題目的主要知識 點,按照題目的知識點將題庫中主要知識點完全相同的題目劃分為一個題目簇,用W避免 題庫中相同知識點的題目重復出現。3. 根據權利要求1所述的一種基于遺忘曲線的自適應測試系統,其特征在于:能力測 試模塊包括有用戶指定組件,在該組件中,用W初始化該用戶的能力值。4. 根據權利要求1所述的一種基于遺忘曲線的自適應測試系統,其特征在于:能力測 試模塊包括有測試長度指定組件,在該組件中,用W設定特定長度的題目試卷。5. 根據權利要求1所述的一種基于遺忘曲線的自適應測試系統,其特征在于:能力測 試模塊包括有記憶指定組件,在該組件中,用W設定用戶對該題目簇的最佳復習時間;根據 用戶能力值W及每個題目簇的題目特征,建立如下的記憶衰減模型:其中N為題目簇中主要知識點的個數,0為用戶能力值,h為時間控制因子,b。是主要 知識點n的難度系數,ai是題目簇的區分度。6. 根據權利要求1所述的一種基于遺忘曲線的自適應測試系統,其特征在于:統計分 析模塊根據用戶實際測試的答題對錯記錄計算每次測試的信息量,通過測試終止條件來判 斷該測試是否終止;模塊中所使用的測試終止條件為:其中,L為測試的次數,li(0)為第i次測試的信息量,e-般取0.05或者0.01。7. 根據權利要求1所述的一種基于遺忘曲線的自適應測試系統,其特征在于:反饋執 行模塊通過用戶實際測試的答題對錯記錄,利用IRT能力迭代模型計算出該用戶的真實能 力水平;IRT能力迭代模型采用函數其中HI為第n次測試前的能力值,III為第n次測試后更新的能力值,L為每輪測試的 題目長度,U,是用戶測試過程中答題對錯記錄。
【專利摘要】本發明涉及一種基于遺忘曲線的自適應能力測試系統,屬于人工智能和教育學測試評估技術領域。該系統包括題庫分類模塊、能力測試模塊、統計分析模塊以及反饋執行模塊。該方法包括以下四個步驟:1)題庫的建立和分類;2)設置用戶能力測試的考評規則;3)統計及分析用戶測試過程中答題對錯記錄;4)反饋用戶的真實能力水平。本發明是一種高度智能化的能力測試系統,并定義了題目簇(family)用于對題庫中的題目進行分類,減少出題的冗余度,能準確地測試出用戶的真實能力水平。本發明涉及的自適應能力測試系統不僅可以測試出用戶的真實能力水平,還可以通過用戶對題目簇的記憶曲線,為研究智能學習方法提供一種有效的分析工具。
【IPC分類】G06F19/00
【公開號】CN105373703
【申請號】CN201510872724
【發明人】戴翰波, 吳卉
【申請人】武漢慧人信息科技有限公司
【公開日】2016年3月2日
【申請日】2015年12月2日