中文字幕无码日韩视频无码三区

一種書版小樣處理方法及裝置的制作方法

文檔序號:6603450閱讀:577來源:國(guo)知局
專利名稱:一種書版小樣處理方法及裝置的制作方法
技術領域
本發明涉及計算機技術領域中的數據排版技術領域,尤其涉及一種書版小樣處理方法及裝置。
背景技術
書版小樣,是指使用特定語言注解信息的文本文件,已經普遍被出版界所編制和使用。書版小樣中包含書籍的內容以及書籍的各種版式信息,采用特定語言描述書籍的板式、樣式、數學公式、表格等各種對象。目前書版小樣多采用專門用以排版的類似HTML 1.0的標記語言進行編寫,業界稱該語言為BD語言。BD語言由160多個注解組成,每個注解都有自己的功能,指明排版的某些要求,并有確定的作用范圍。BD語言每個注解都有一個或多個參數可選擇,每個參數對應某個功能。多個注解聯合使用,就可以完成比較復雜的版面排版。書版小樣文件通常保存的是一本書籍的全部信息,對于編輯等排版領域的工作人員來說,方便對書籍內容以及格式的全面了解。但書版小樣偏重描述排版效果,采用的編寫語言一般專門用于排版,對于文檔的內容邏輯結構沒有充分的描述,內容對象之間的關系較弱,結構性較差,并且是文本流型的,所以在除排版外的一些其他使用場合時,例如從中提取感興趣的數據進行再加工處理,包括轉換成網頁、幻燈片等其他軟件可接受的文檔,存入數據庫等,從書版小樣中獲取內容將會變得非常復雜。

發明內容
本發明實施例提供一種書版小樣處理方法及裝置,用以解決不能靈活的根據應用需求對書版小樣中的特定內容進行再加工處理的問題,且保留書版小樣中信息內容的完整性。本發明實施例提供一種書版小樣處理方法,包括按照先后順序從待處理書版小樣中獲取當前小樣元素;其中,小樣元素的類型包括文本類型、獨立注解類型和關聯注解類型;文本類型的小樣元素為兩個注解之間的且不與關聯注解相關聯的文本;獨立注解類型的小樣元素為一個獨立注解;關聯注解類型的小樣元素為一個關聯注解和與該關聯注解對應的一個表示結束的文本或注解以及兩者之間的文本和注解;創建與所述當前小樣元素對應的XML對象;將創建的所述XML對象加入到與所述待處理書版小樣對應的XML對象樹中。本發明實施例還提供一種書版小樣處理裝置,包括獲取單元,用于按照先后順序從待處理書版小樣中獲取當前小樣元素;其中,小樣元素的類型包括文本類型、獨立注解類型和關聯注解類型;文本類型的小樣元素為兩個注解之間的且不與關聯注解相關聯的文本;獨立注解類型的小樣元素為一個獨立注解;關聯注解類型的小樣元素為一個關聯注解和與該關聯注解對應的一個表示結束的文本或注解以及兩者之間的文本和注解;第一創建單元,用于創建與所述當前小樣元素對應的XML對象;第二創建單元,用于將創建的所述XML對象加入到與所述待處理書版小樣對應的 XML對象樹中。本發明實施例提供的方法中,將書版小樣劃分為小樣元素,并按先后順序獲取小樣元素,創建與獲取的小樣元素對應的XML對象,并將創建的XML對象加入到與該書版小樣對應的XML對象樹中,即完成了將書版小樣轉換成XML格式文檔,由于XML格式文檔的結構化特性,方便從文檔中獲取特定內容,進而能夠靈活的根據應用需求對獲取的特定內容進行再加工處理;并且本發明實施例中還將小樣元素區分為文本類型、獨立注解類型和關聯注解類型,其中,文本類型的小樣元素為兩個注解之間的且不與關聯注解相關聯的文本,獨立注解類型的小樣元素為一個獨立注解,關聯注解類型的小樣元素為一個關聯注解和與該關聯注解對應的一個表示結束的文本或注解以及兩者之間的文本和注解,通過對小樣元素類型的區分,保留了書版小樣中各種內容信息的完整性,因此,還方便將處理后獲得的XML 格式文檔轉化回原書版小樣。


圖1為本發明實施例提供的書版小樣處理方法的流程圖;圖2為本發明實施例提供的書版小樣處理方法中獲取當前小樣元素的流程圖;圖3為本發明實施例提供的書版小樣處理方法中創建與當前小樣元素對應的XML 對象的流程圖;圖4為本發明實施例提供的書版小樣處理裝置的結構示意圖。
具體實施例方式為了給出解決不能靈活的根據應用需求對書版小樣中的特定內容進行再加工處理的問題的實現方案,本發明實施例提供了一種書版小樣處理方法及裝置,以下結合說明書附圖對本發明的優選實施例進行說明,應當理解,此處所描述的優選實施例僅用于說明和解釋本發明,并不用于限定本發明。并且在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。
本發明實施例提供一種書版小樣處理方法,如圖1所示,包括步驟S101、按照先后順序從待處理書版小樣中獲取當前小樣元素。其中,小樣元素的類型包括文本類型、獨立注解類型和關聯注解類型;文本類型的小樣元素為兩個注解之間的且不與關聯注解相關聯的文本;獨立注解類型的小樣元素為一個獨立注解;關聯注解類型的小樣元素為一個關聯注解和與該關聯注解對應的一個表示結束的文本或注解以及兩者之間的文本和注解。步驟S102、創建與該當前小樣元素對應的XML對象。步驟S103、將創建的XML對象加入到與該待處理書版小樣對應的XML對象樹中。下面結合附圖,用具體實施例對本發明提供的方法及裝置進行詳細描述。書版小樣的內容包括文本和使用BD語言標記的注解,其中,文本為進行排版后在頁面中顯示的字符內容;注解包括獨立注解和關聯注解兩種,獨立注解為注解自身單獨即可在排版時起作用的注解,如表示圖像的注解;關聯注解為與其他文本和/或注解進行組合后共同在排版時起作用的注解,如一個表示表格開始的注解,與其對應的還有一個表示表格結束的注解,為與表格開始注解相關聯的注解,表格開始注解與表格結束注解之間的文本和注解也是與表格開始注解相關聯的。本發明實施例中將書版小樣劃分為若干個小樣元素,并對小樣元素的類型進行區分,包括文本類型、獨立注解類型和關聯注解類型,其中,文本類型的小樣元素為兩個注解之間的且不與關聯注解相關聯的文本;獨立注解類型的小樣元素為一個獨立注解;關聯注解類型的小樣元素為一個關聯注解和與該關聯注解對應的一個表示結束的文本或注解以及兩者之間的文本和注解;具體可以如上述步驟S101,按照先后順序從待處理書版小樣中獲取當前小樣元素,具體的獲取方法可以如圖2所示,包括步驟S201、在第一次獲取當前小樣元素之前,也就是對待處理書版小樣進行處理之前,首先將待處理書版小樣劃分為若干個小樣原子,小樣原子為書版小樣中的一段數據, 類型包括文本類型和注解類型,文本類型的小樣原子為兩個注解之間的文本,注解類型的小樣原子為一個注解,即小樣原子為書版小樣中不可拆分的最小單元。較佳的,為便于后續處理,對于劃分的小樣原子可以按照各小樣原子在書版小樣中的先后順序標記序號,構建原子序列。步驟S202、在待處理書版小樣中獲取當前小樣原子;初始的當前小樣原子為書版小樣中的第一個小樣原子,即原子序列中序號為1的小樣原子。判斷獲取的該當前小樣原子的類型,如果為文本類型,進入步驟S203,否則,進入步驟S204。步驟S203、確定該當前小樣原子為當前小樣元素,并確定該當前小樣元素的類型為文本類型,以及使用當前小樣原子的后一個小樣原子更新當前小樣原子,進入后續步驟 S301。步驟S204、判斷該當前小樣原子表征的注解為獨立注解還是關聯注解,如果為獨立注解,進入步驟S205、否則,進入步驟S206。具體的判斷方法為解析當前小樣原子對應的注解字符串,獲得表征的注解的注解名稱和參數表,根據獲得的注解名稱和參數表進行判斷。步驟S205、確定該當前小樣原子為當前小樣元素,并確定該當前小樣元素的類型為獨立注解類型,以及使用當前小樣原子的后一個小樣原子更新當前小樣原子,進入后續步驟S301。步驟S206、查找表征與該關聯注解對應的一個表示結束的文本或注解的對應小樣原子,并獲取當前小樣原子、該對應小樣原子以及兩者之間的小樣原子,將這多個小樣原子的組合作為當前小樣元素,具體可以為通過序號區間為[M,N]內的小樣原子表示,其中,小樣原子M為該當前小樣原子,小樣原子N為對應小樣原子;并確定該當前小樣元素的類型為關聯注解類型;以及使用該對應小樣原子的后一個小樣原子更新當前小樣原子,進入后續步驟S301。通過上述圖2所示流程獲取當前小樣元素后,執行上述步驟S102和步驟S103,創建與該當前小樣元素對應的XML對象,并將創建的XML對象加入到與該待處理書版小樣對應的XML對象樹中,具體流程可以如圖3所示,包括
步驟S301、判斷獲取的當前小樣元素的類型是否為文本類型,如果是,進入步驟 S302,否則,進入步驟S303。步驟S302、使用相應的轉換規則,創建與該當前小樣元素對應的XML對象,且創建的該XML對象中記錄有該當前小樣元素表征的文本內容。具體使用的轉換規則可以采用現有技術中的各種轉換規則,在此不再進行詳細描述。步驟S303、判斷獲取的當前小樣元素的類型是否為獨立注解類型,如果是,進入步驟S304,否則,進入步驟S305。步驟S304、使用相應的轉換規則,依據與書版小樣關聯的排版輔助信息,創建與該當前小樣元素對應的XML對象,且創建的該XML對象中記錄有該當前小樣元素表征的注解字符串。其中,與書版小樣關聯的排版輔助信息為在對書版小樣進行排版操作時,建立的排版后文檔的頁面元素與書版小樣中的小樣片段的對照關系,其中,頁面元素為排版后文檔的頁面的一個顯示元素,可以是單位元素,如一個字符,一個圖像等,也可以是組合元素, 如表格等;小樣片段是書版小樣中的一段內容,由其在書版小樣中的起始位置(如字節數) 和結束位置標記。具體使用的轉換規則和如何依據與書版小樣關聯的排版輔助信息,可以采用現有技術中的各種方法,在此不再做詳細描述。步驟S305、創建與該當前小樣元素對應的XML對象,由于該當前小樣元素包括了若干個小樣原子,因此,為了使創建的XML對象能夠表征出包括的若干個小樣原子在書版小樣中的結構特征和相互關系,較佳的,可以先根據該當前小樣元素包括的第一個關聯注解及對應的一個表示結束的文本或注解,創建與兩者對應的XML父對象,并根據該當前小樣元素包括的其他文本和注解,創建該XML父對象的若干個XML子對象,其中,XML子對象為對應一個文本或一個注解創建的,或者為對應一個關聯注解及與該關聯注解對應的一個表示結束的文本或注解以及兩者之間的文本和注解創建的;最終,將創建的XML父對象和若干個XML子對象的組合作為與該當前小樣元素對應的XML對象。具體描述如下首先,獲取該當前小樣元素的第一個小樣原子,并查找到與其對應的該當前小樣元素的最后一個小樣原子,創建與第一個小樣原子和最后一個小樣原子兩者對應的一個 XML父對象,該XML父對象中記錄有小樣原子M表征的注解字符串和小樣原子N表征的注解字符串或文本內容;然后,根據該當前小樣元素包括的其他各小樣原子,創建該XML父對象的若干個 XML子對象。此時,當其他各小樣原子中不存在表征關聯注解的小樣原子時,依次分別創建與其他各小樣原子對應的XML子對象;否則,當存在表征關聯注解的小樣原子時,還確定出與該小樣原子對應的表示結束的小樣原子,并針對這兩個小樣原子以及之間的小樣原子的組合創建對應的XML對象(創建方法與本步驟中創建與該當前小樣元素對應的XML對象相同,即實質可以通過遞歸流程實現),作為該XML父對象的一個XML子對象,對于其他不與關聯注解類型的小樣原子相關聯的文本類型的小樣原子和獨立注解類型的小樣原子,依次分別創建對應的XML子對象;
最終,將創建的XML父對象和若干個XML子對象的組合作為與該當前小樣元素對應的XML對象。本步驟中對于每個小樣原子的XML子對象的創建方式,與上述步驟S303和步驟 S304中相同。步驟S306、將創建的該XML對象加入到與該待處理書版小樣對應的XML對象樹中。 其中,當創建的該XML對象為第一個對象時,則先初始化與該待處理書版小樣對應的XML對象樹,然后再將該XML對象加入。進入上述步驟S202,或者在創建的該XML對象為最后一個對象時,結束該待處理書版小樣的處理流程。通過上述圖2和圖3所示的流程,完成了本發明實施例提出的書版小樣處理方法,即實現了將半結構化的、文本流型的書版小樣進行結構化處理,將其轉換成XML格式文檔,由于相比書版小樣XML格式文檔的結構性強,可以通過XML技術方便地對其中的特定內容進行再加工處理,如數據提取和轉換等;并且,本發明實施例中,不僅將書版小樣中的文本內容進行了轉換,還將其中的注解進行轉換,保留了書版小樣中各種內容信息的完整; 并且,在整個處理過程中,無論是劃分小樣元素還是對應小樣元素創建XML對象,均通過對注解類型的區分和小樣元素類型的區分,使得轉化后的XML文檔的結構體現了書版小樣中文本和注解之間的結構特征和相互關系,遵循了文檔排版技術中的流式排版文檔的規范結構,且能夠方便將轉化后的XML格式文檔轉化回原書版小樣。本發明實施例中,還可以對待處理書版小樣進行規范的確定,以便后續處理的方便和一致性,例如,對于非規范版本的書版小樣,可以通過宏處理展開書版小樣中的宏定義數據,再執行轉義字符串處理等將原始書版小樣轉換為規范版本的書版小樣;以及進一步的,還可以設定規范的注解字符串,對于存在不規范的注解字符串的書版小樣,還通過使用設定的規范的注解字符串替換不規范的注解字符串,最終將書版小樣轉化為滿足要求的待處理書版小樣。基于同一發明構思,根據本發明上述實施例提供的書版小樣處理方法,相應地,本發明另一實施例還提供了一種書版小樣處理裝置,其結構示意圖如圖4所示,包括獲取單元401,用于按照先后順序從待處理書版小樣中獲取當前小樣元素;其中, 小樣元素的類型包括文本類型、獨立注解類型和關聯注解類型;文本類型的小樣元素為兩個注解之間的且不與關聯注解相關聯的文本;獨立注解類型的小樣元素為一個獨立注解; 關聯注解類型的小樣元素為一個關聯注解和與該關聯注解對應的一個表示結束的文本或注解以及兩者之間的文本和注解;第一創建單元402,用于創建與該當前小樣元素對應的XML對象;第二創建單元403,用于將創建的該XML對象加入到與所述待處理書版小樣對應的XML對象樹中。較佳的,還包括劃分單元404,用于將該待處理書版小樣劃分為若干個小樣原子;其中,小樣原子的類型包括文本類型和注解類型;文本類型的小樣原子為兩個注解之間的文本;注解類型的小樣原子為一個注解;上述獲取單元401,具體用于在該待處理書版小樣中獲取當前小樣原子;當該當前小樣原子為文本類型時,確定該當前小樣原子為當前小樣元素,并使用該當前小樣原子的后一個小樣原子更新當前小樣原子;當該當前小樣原子為注解類型,且表征的注解為獨立注解時,確定該當前小樣原子為當前小樣元素,并使用該當前小樣原子的后一個小樣原子更新當前小樣原子;當該當前小樣原子為注解類型,且表征的注解為關聯注解時,查找表征與該關聯注解對應的一個表示結束的文本或注解的對應小樣原子,并獲取該當前小樣原子和該對應小樣原子以及兩者之間的小樣原子,作為當前小樣元素,并使用該對應小樣原子的后一個小樣原子更新當前小樣原子。較佳的,上述劃分單元404在判斷為注解類型的所述當前小樣原子表征的注解為獨立注解或關聯注解時,具體用于解析該當前小樣原子對應的注解字符串,獲得表征的注解的注解名稱和參數表;并根據獲得的注解名稱和參數表進行判斷。較佳的,上述第一創建單元402,具體用于當該當前小樣元素為文本類型時,創建與該當前小樣元素對應的XML對象,創建的該XML對象中記錄有該當前小樣元素表征的文本內容;當該當前小樣元素為獨立注解類型時,創建與該當前小樣元素對應的XML對象,創建的該XML對象中記錄有該當前小樣元素表征的注解的注解字符串;當該當前小樣元素為關聯注解類型時,根據所述當前小樣元素包括的第一個關聯注解及對應的一個表示結束的文本或注解,創建與兩者對應的XML父對象,并根據所述當前小樣元素包括的其他文本和注解,創建該XML父對象的若干個XML子對象,XML子對象為對應一個文本或一個注解創建的,或者為對應一個關聯注解及與該關聯注解對應的一個表示結束的文本或注解以及兩者之間的文本和注解創建的;創建的XML父對象和若干個XML子對象的組合為與該當前小樣元素對應的XML對象。較佳的,上述書版小樣處理裝置,還包括轉換單元405,用于對于存在不規范的注解字符串的書版小樣,通過使用設定的規范的注解字符串替換不規范的注解字符串,將該書版小樣轉換為待處理書版小樣。綜上所述,本發明實施例提供的方案,包括按照先后順序從待處理書版小樣中獲取當前小樣元素;其中,小樣元素的類型包括文本類型、獨立注解類型和關聯注解類型;文本類型的小樣元素為兩個注解之間的且不與關聯注解相關聯的文本;獨立注解類型的小樣元素為一個獨立注解;關聯注解類型的小樣元素為一個關聯注解和與該關聯注解對應的一個表示結束的文本或注解以及兩者之間的文本和注解;并創建與該當前小樣元素對應的 XML對象;以及將創建的XML對象加入到與該待處理書版小樣對應的XML對象樹中。采用本發明實施例提供的方案,解決了不能靈活的根據應用需求對書版小樣中的特定內容進行再加工處理的問題,且保留書版小樣中信息內容的完整性。顯然,本領域的技術人員可以對本發明進行各種改動和變型而不脫離本發明的精神和范圍。這樣,倘若本發明的這些修改和變型屬于本發明權利要求及其等同技術的范圍之內,則本發明也意圖包含這些改動和變型在內。
權利要求
1.一種書版小樣處理方法,其特征在于,包括按照先后順序從待處理書版小樣中獲取當前小樣元素;其中,小樣元素的類型包括文本類型、獨立注解類型和關聯注解類型;文本類型的小樣元素為兩個注解之間的且不與關聯注解相關聯的文本;獨立注解類型的小樣元素為一個獨立注解;關聯注解類型的小樣元素為一個關聯注解和與該關聯注解對應的一個表示結束的文本或注解以及兩者之間的文本和注解;創建與所述當前小樣元素對應的XML對象;將創建的所述XML對象加入到與所述待處理書版小樣對應的XML對象樹中。
2.如權利要求1所述的方法,其特征在于,在按照先后順序從待處理書版小樣中獲取當前小樣元素之前,還包括將所述待處理書版小樣劃分為若干個小樣原子;其中,小樣原子的類型包括文本類型和注解類型;文本類型的小樣原子為兩個注解之間的文本;注解類型的小樣原子為一個注解;按照先后順序從待處理書版小樣中獲取當前小樣元素,具體包括在所述待處理書版小樣中獲取當前小樣原子;當所述當前小樣原子為文本類型時,確定所述當前小樣原子為所述當前小樣元素,并使用所述當前小樣原子的后一個小樣原子更新當前小樣原子;當所述當前小樣原子為注解類型,且表征的注解為獨立注解時,確定所述當前小樣原子為所述當前小樣元素,并使用所述當前小樣原子的后一個小樣原子更新當前小樣原子;當所述當前小樣原子為注解類型,且表征的注解為關聯注解時,查找表征與該關聯注解對應的一個表示結束的文本或注解的對應小樣原子,并獲取所述當前小樣原子和所述對應小樣原子以及兩者之間的小樣原子,作為所述當前小樣元素,并使用所述對應小樣原子的后一個小樣原子更新當前小樣原子。
3.如權利要求2所述的方法,其特征在于,判斷注解類型的所述當前小樣原子表征的注解為獨立注解或關聯注解,具體包括解析所述當前小樣原子對應的注解字符串,獲得表征的注解的注解名稱和參數表;根據獲得的注解名稱和參數表進行判斷。
4.如權利要求1所述的方法,其特征在于,創建與所述當前小樣元素對應的XML對象, 具體包括當所述當前小樣元素為文本類型時,創建與所述當前小樣元素對應的XML對象,創建的所述XML對象中記錄有所述當前小樣元素表征的文本內容;當所述當前小樣元素為獨立注解類型時,創建與所述當前小樣元素對應的XML對象, 創建的所述XML對象中記錄有所述當前小樣元素表征的注解的注解字符串;當所述當前小樣元素為關聯注解類型時,根據所述當前小樣元素包括的第一個關聯注解及對應的一個表示結束的文本或注解,創建與兩者對應的XML父對象,并根據所述當前小樣元素包括的其他文本和注解,創建所述XML父對象的若干個XML子對象,所述XML子對象為對應一個文本或一個注解創建的,或者為對應一個關聯注解及與該關聯注解對應的一個表示結束的文本或注解以及兩者之間的文本和注解創建的;創建的所述XML父對象和若干個所述XML子對象的組合為與所述當前小樣元素對應的XML對象。
5.如權利要求1-4任一所述的方法,其特征在于,對于存在不規范的注解字符串的書版小樣,通過使用設定的規范的注解字符串替換不規范的注解字符串,將該書版小樣轉化為所述待處理書版小樣。
6.一種書版小樣處理裝置,其特征在于,包括獲取單元,用于按照先后順序從待處理書版小樣中獲取當前小樣元素;其中,小樣元素的類型包括文本類型、獨立注解類型和關聯注解類型;文本類型的小樣元素為兩個注解之間的且不與關聯注解相關聯的文本;獨立注解類型的小樣元素為一個獨立注解;關聯注解類型的小樣元素為一個關聯注解和與該關聯注解對應的一個表示結束的文本或注解以及兩者之間的文本和注解;第一創建單元,用于創建與所述當前小樣元素對應的XML對象;第二創建單元,用于將創建的所述XML對象加入到與所述待處理書版小樣對應的XML 對象樹中。
7.如權利要求6所述的裝置,其特征在于,還包括劃分單元,用于將所述待處理書版小樣劃分為若干個小樣原子;其中,小樣原子的類型包括文本類型和注解類型;文本類型的小樣原子為兩個注解之間的文本;注解類型的小樣原子為一個注解;所述獲取單元,具體用于在所述待處理書版小樣中獲取當前小樣原子;當所述當前小樣原子為文本類型時,確定所述當前小樣原子為所述當前小樣元素,并使用所述當前小樣原子的后一個小樣原子更新當前小樣原子;當所述當前小樣原子為注解類型,且表征的注解為獨立注解時,確定所述當前小樣原子為所述當前小樣元素,并使用所述當前小樣原子的后一個小樣原子更新當前小樣原子;當所述當前小樣原子為注解類型,且表征的注解為關聯注解時,查找表征與該關聯注解對應的一個表示結束的文本或注解的對應小樣原子, 并獲取所述當前小樣原子和所述對應小樣原子以及兩者之間的小樣原子,作為所述當前小樣元素,并使用所述對應小樣原子的后一個小樣原子更新當前小樣原子。
8.如權利要求7所述的裝置,其特征在于,所述劃分單元在判斷為注解類型的所述當前小樣原子表征的注解為獨立注解或關聯注解時,具體用于解析所述當前小樣原子對應的注解字符串,獲得表征的注解的注解名稱和參數表;并根據獲得的注解名稱和參數表進行判斷。
9.如權利要求6所述的裝置,其特征在于,所述第一創建單元,具體用于當所述當前小樣元素為文本類型時,創建與所述當前小樣元素對應的XML對象,創建的所述XML對象中記錄有所述當前小樣元素表征的文本內容;當所述當前小樣元素為獨立注解類型時,創建與所述當前小樣元素對應的XML對象,創建的所述XML對象中記錄有所述當前小樣元素表征的注解的注解字符串;當所述當前小樣元素為關聯注解類型時,根據所述當前小樣元素包括的第一個關聯注解及對應的一個表示結束的文本或注解,創建與兩者對應的XML父對象,并根據所述當前小樣元素包括的其他文本和注解,創建所述XML父對象的若干個XML子對象,所述XML子對象為對應一個文本或一個注解創建的,或者為對應一個關聯注解及與該關聯注解對應的一個表示結束的文本或注解以及兩者之間的文本和注解創建的;創建的所述XML父對象和若干個所述XML子對象的組合為與所述當前小樣元素對應的XML對象。
10.如權利要求6-9所述的裝置,其特征在于,還包括轉換單元,用于對于存在不規范的注解字符串的書版小樣,通過使用設定的規范的注解字符串替換不規范的注解字符串,將該書版小樣轉換為所述待處理書版小樣。
全文摘要
本發明公開了一種書版小樣處理方法及裝置,包括按照先后順序從待處理書版小樣中獲取當前小樣元素;其中,小樣元素的類型包括文本類型、獨立注解類型和關聯注解類型;文本類型的小樣元素為兩個注解之間的且不與關聯注解相關聯的文本;獨立注解類型的小樣元素為一個獨立注解;關聯注解類型的小樣元素為一個關聯注解和與該關聯注解對應的一個表示結束的文本或注解以及兩者之間的文本和注解;并創建與該當前小樣元素對應的XML對象;以及將創建的XML對象加入到與該待處理書版小樣對應的XML對象樹中。采用本發明提供的方法及裝置,解決了不能靈活的根據應用需求對書版小樣中的特定內容進行再加工處理的問題,且保留了書版小樣中信息內容的完整性。
文檔編號G06F17/25GK102262617SQ201010189450
公開日2011年11月30日 申請日期2010年5月24日 優先權日2010年5月24日
發明者劉婷婷, 曹學軍, 楊燕菲, 繆萍 申請人:北京北大方正電子有限公司, 北大方正集團有限公司
網友詢問留(liu)言(yan) 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1