一種用于醫生勝任力模型構建的數據處理方法
【專利摘要】本發明公開了一種用于醫生勝任力模型構建的數據處理方法,包括數據篩選、數據分解、無效數據二次篩選、有效數據單元的二次融合和無效數據單元的處理這五個步驟,與現有技術相比,本發明通過對現有技術中進行剔除的無效數據進行重新利用,大大減少了由于數據剔除而對原始數據樣本信息的損失。在對無效數據進行二次利用的同時保持了原始有效數據的可靠性。
【專利說明】一種用于醫生勝任力模型構建的數據處理方法
【技術領域】
[0001]本發明涉及一種數據處理方法,尤其涉及一種用于醫生勝任力模型構建的數據處理方法。
【背景技術】
[0002]關于醫學人才培養模式研究的文獻有很多,大多通過制定專門性培養方案、培養模式、師資建設、建立健全保障體系等措施培養卓越醫師。在對醫生勝任力評價體系中,需要對大量的復雜統計數據進行篩選處理,從而剔除相對無效的數據,減小數據處理的工作量,提高數據處理的效率。現有技術的研究重點是對如何優選數據。但是,無論如何優選,只要剔除數據,就會對樣本本身所要體現的信息產生偏差影響,無法實現樣本信息的充分利用。
【發明內容】
[0003]本發明的目的就在于為了解決上述問題而提供一種用于醫生勝任力模型構建的數據處理方法。
[0004]本發明通過以下技術方案來實現上述目的:
[0005]本發明包括以下步驟:
[0006](I)數據篩選:先后使用KMO數據值、巴菲力特球形檢驗數據對源數據進行篩選,選取KMO數據值大于0.5和巴菲力特球形檢驗數據小于0.05的數據為有效數據,其余數據為無效數據;
[0007](2)數據分解:將所有數據按照數據內容的不同分成若干個維度;
[0008](3)無效數據二次篩選:篩選出有效數據中每個數據維度的最大值和最小值,然后使用無效數據每個維度中的數據單元與相同維度中有效數據的最大值和最小值進行比較,若無效數據中的數據單元位于有效數據的最大值和最小值之間,則將這一無效數據中這一維度的數據單元標記為有效數據單元,否則,繼續標記為無效數據單元;
[0009](4)有效數據單元的二次融合:計算每個有效數據各維度的平均值,然后將無效數據中標記為有效數據單元的數據代替相應維度的平均值,其它維度仍然使用本維度的平均值,形成一個新的有效數據單元,將所有新得到的有效數據單元使用第一加權因子進行加權處理后,融合入原有的有效數據單元中;
[0010](5)無效數據單元的處理:將步驟C中仍然標記為無效的數據單元按照維度的相關性進行重新排序,然后對各個維度進行權重排序,按照維度權重值由低到高的順序依次選取各個維度的無效數據單元作為目標值對其相鄰的無效數據單元進行線性擬合,擬合出的各個維度的數據組成的曲面作為醫生勝任力模型構建的二次檢查標準。
[0011]進一步,步驟(4)中,第一加權因子的計算公式為:
[0012]a= l/elw 核Ftt2Il
O
[0013]步驟(4)中,將融合后形成的新的有效數據再次進行步驟(I)中的篩選過程,如果符合步驟(I)中的標準,則無需追加處理,如果不符合步驟(I)中的標準,則對第一加權因子進行調整,直至新的有效數據符合步驟(I)的標準。對第一加權因子進行調整的步驟為:選取第一加權因子的1%作為迭代步長,任意選取正向或負向迭代,通過迭代前后的結果變化率和迭代結果與目標結果差值的絕對值的計算,確定下一次迭代變化量,其關系為,
[0014]q = D/k。
[0015]本發明的有益效果在于:
[0016]本發明是一種用于醫生勝任力模型構建的數據處理方法,與現有技術相比,本發明通過對現有技術中進行剔除的無效數據進行重新利用,大大減少了由于數據剔除而對原始數據樣本信息的損失。在對無效數據進行二次利用的同時保持了原始有效數據的可靠性。
【具體實施方式】
[0017]下面對本發明作進一步說明:
[0018]本發明包括以下步驟:
[0019](I)數據篩選:先后使用KMO數據值、巴菲力特球形檢驗數據對源數據進行篩選,選取KMO數據值大于0.5和巴菲力特球形檢驗數據小于0.05的數據為有效數據,其余數據為無效數據;
[0020](2)數據分解:將所有數據按照數據內容的不同分成若干個維度;
[0021](3)無效數據二次篩選:篩選出有效數據中每個數據維度的最大值和最小值,然后使用無效數據每個維度中的數據單元與相同維度中有效數據的最大值和最小值進行比較,若無效數據中的數據單元位于有效數據的最大值和最小值之間,則將這一無效數據中這一維度的數據單元標記為有效數據單元,否則,繼續標記為無效數據單元;
[0022](4)有效數據單元的二次融合:計算每個有效數據各維度的平均值,然后將無效數據中標記為有效數據單元的數據代替相應維度的平均值,其它維度仍然使用本維度的平均值,形成一個新的有效數據單元,將所有新得到的有效數據單元使用第一加權因子進行加權處理后,融合入原有的有效數據單元中;
[0023](5)無效數據單元的處理:將步驟C中仍然標記為無效的數據單元按照維度的相關性進行重新排序,然后對各個維度進行權重排序,按照維度權重值由低到高的順序依次選取各個維度的無效數據單元作為目標值對其相鄰的無效數據單元進行線性擬合,擬合出的各個維度的數據組成的曲面作為醫生勝任力模型構建的二次檢查標準。其曲面方程優選為球面方程x2+y2+z2 = R2或橢球面方程x2/a2+y2/b2+Z2/c2 = I。
[0024]具體地,所述步驟(4)中,第一加權因子的計算公式為:
[0025]
O
[0026]式中:Xn為新有效數據的第η維數據單元,yn為與此新有效數據歐式距離最近的源數據中的有效數據的第η維數據單元。
[0027]步驟(4)中,將融合后形成的新的有效數據再次進行步驟(I)中的篩選過程,如果符合步驟(I)中的標準,則無需追加處理,如果不符合步驟(I)中的標準,則對第一加權因子進行調整,直至新的有效數據符合步驟(I)的標準。對第一加權因子進行調整的步驟為:選取第一加權因子的1%作為迭代步長,任意選取正向或負向迭代,通過迭代前后的結果變化率和迭代結果與目標結果差值的絕對值的計算,確定下一次迭代變化量,其關系為,
[0028]q = D/k。
[0029]式中:k為迭代前后的結果變化率,D為迭代結果與目標結果差值的絕對值,q為下一次迭代變化量。
[0030]上述有效/無效數據由多個維度的有效/無效數據單元組成,處理過程是通過對有效/無效數據單元的處理從而實現對有效/無效數據進行處理。
[0031]在使用上述數據處理方法前,需要對數據樣本進行收集和整理。
[0032]通過訪談法與標準文獻總結相結合的途徑來建立勝任力要素辭典。對訪談錄音進行文本化處理和頻次分析,選取訪談過程中出現頻率大于30 %的品質和事件進行整理,并把個性化的具有中醫特點的特征統一提煉出來,用符合中醫語言習慣的方式進行描述。此后,把品質特征作嘗試性的定義,有的定義在GMER、教育部標準等相應要求中可以找到,但大多數需要自己來描述和確認。獲得的29項品質特征。將訪談所得的29項特征結合國際GMER標準(《全球醫學教育最低基本要求》)進行改編,參照結合《中醫學本科(CMD前)教育畢業生基本要求》標準,分析關于中醫醫生勝任素質的文獻,將標準進行操作化定義。在29項特征基礎上進行了量表題目的編制,每一項特征進行了問題的設計,最終形成勝任力特征辭典。
[0033]在此中醫卓越勝任力辭典的基礎上,進一步對71項品質和問題進行排查篩選,采取李克特五點計分形成量表。對每個項目的得分進行專家組和對照組的獨立樣本T檢驗,檢驗結果顯著說明該項目在專家組和對照組之間存在差異,能夠起到鑒別出專家與普通醫生的作用,該項目鑒別力較好。檢驗結果不顯著說明該項目專家組和對照組之間差異不顯著,不能很好的鑒別出專家與普通醫生,該項目鑒別力較差。以專家組和對照組之間獨立樣本T檢驗結果作為項目分析的鑒別力標準,有22個項目由于沒有達到顯著性水平,不能起到鑒別的作用被刪除。其余49個項目由于T檢驗結果達到顯著性,鑒別力較好而被保留。將保留的49道題目以隨機方式編制成初測問卷。
[0034]對包含49道題項的220份數據進行探索性因子分析,KMO數據值為0.849,巴菲力特球形檢驗顯著性水平P < 0.001。選取特征根大于I為截取公因子標準,結果共有9公因子特征根大于1,從分析可以得出只有前5個公因子貢獻率較大,從第6個因子開始貢獻率增加緩慢。
[0035]經最大四次方旋轉后刪除因子負荷小于0.5的題目,以及因子歸屬不明確的題目共8項(第2、20、26、34、44、46、48、49題),保留的41項分屬5個因子,其中第一因子9項,第二因子8項,第三因子8項,第四因子8項,第五因子8項。
[0036]使用本實施例提及的數據方法對篩選出的有效數據和無效數據進行重新處理,最終得出5個維度的要素群,即道德力(morals ability)、思維力(thinking ability)、溝通力(communicat1n ability)、學習力(learning ability)、實踐力(practice ability),并將這5個要素群分解為“理想信念” “職業精神”等15個特征和41個項目,從而構建中醫學“卓越醫生”勝任力的“5A”模型。
[0037]以上顯示和描述了本發明的基本原理和主要特征及本發明的優點。本行業的技術人員應該了解,本發明不受上述實施例的限制,上述實施例和說明書中描述的只是說明本發明的原理,在不脫離本發明精神和范圍的前提下,本發明還會有各種變化和改進,這些變化和改進都落入要求保護的本發明范圍內。本發明要求保護范圍由所附的權利要求書及其等效物界定。
【權利要求】
1.一種用于醫生勝任力模型構建的數據處理方法,其特征在于,包括以下步驟: (1)數據篩選:先后使用KMO數據值、巴菲力特球形檢驗數據對源數據進行篩選,選取KMO數據值大于0.5和巴菲力特球形檢驗數據小于0.05的數據為有效數據,其余數據為無效數據; (2)數據分解:將所有數據按照數據內容的不同分成若干個維度; (3)無效數據二次篩選:篩選出有效數據中每個數據維度的最大值和最小值,然后使用無效數據每個維度中的數據單元與相同維度中有效數據的最大值和最小值進行比較,若無效數據中的數據單元位于有效數據的最大值和最小值之間,則將這一無效數據中這一維度的數據單元標記為有效數據單元,否則,繼續標記為無效數據單元; (4)有效數據單元的二次融合:計算每個有效數據各維度的平均值,然后將無效數據中標記為有效數據單元的數據代替相應維度的平均值,其它維度仍然使用本維度的平均值,形成一個新的有效數據單元,將所有新得到的有效數據單元使用第一加權因子進行加權處理后,融合入原有的有效數據單元中; (5)無效數據單元的處理:將步驟C中仍然標記為無效的數據單元按照維度的相關性進行重新排序,然后對各個維度進行權重排序,按照維度權重值由低到高的順序依次選取各個維度的無效數據單元作為目標值對其相鄰的無效數據單元進行線性擬合,擬合出的各個維度的數據組成的曲面作為醫生勝任力模型構建的二次檢查標準。
2.根據權利要求1所述的用于醫生勝任力模型構建的數據處理方法,其特征在于:步驟(4)中,第一加權因子的計算公式為:
ο
3.根據權利要求1所述的用于醫生勝任力模型構建的數據處理方法,其特征在于:步驟(4)中,將融合后形成的新的有效數據再次進行步驟(I)中的篩選過程,如果符合步驟(I)中的標準,則無需追加處理,如果不符合步驟(I)中的標準,則對第一加權因子進行調整,直至新的有效數據符合步驟(I)的標準。
4.根據權利要求3所述的用于醫生勝任力模型構建的數據處理方法,其特征在于:對第一加權因子進行調整的步驟為:選取第一加權因子的I %作為迭代步長,任意選取正向或負向迭代,通過迭代前后的結果變化率和迭代結果與目標結果差值的絕對值的計算,確定下一次迭代變化量,其關系為,
q = D/k0
【文檔編號】G06F17/30GK104239504SQ201410465407
【公開日】2014年12月24日 申請日期:2014年9月15日 優先權日:2014年9月15日
【發明者】金阿寧 申請人:金阿寧