中文字幕无码日韩视频无码三区

族性化學結構標引系統和標引方法

文檔序號:6615695閱讀:263來源(yuan):國知局(ju)
專利名稱:族性化學結構標引系統和標引方法
技術領域
本發明涉及一種化學結構尤其是族性化學結構的標引系統和標引方法,特 別涉及在建立化學結構尤其是族性化學結構數據庫時的標引系統和標引方法。
背景技術
1924年,美國的Eugene Markush先生申請的一篇染料專利,被授予了美國 專利。Markush先生首先使用族性化學結構表達方法來代表具有相同母體結構但 取代基可變化的一組化合物,用以擴大其申報專利的保護范圍。此后,在化學 領域的專利文獻中常會看到包含有用Rn表示特性的族性化學結構,這種結構被 后人統稱為Markush結構。Markush結構的出現使得化學專利尤其是藥物專利的 成果保護上了一個新臺階。早在上世紀50年代,眾多科學家就開始對在計算機 上處理Markush結構展開了大量研究,但由于此類結構具有可變結構屬性,結構 表述本身具有歧義性,這給計算機處理帶來非常高的難度,因此真正實現商業 化應用的成果很少。直到目前,世界上也只有屈指可數的幾家公司,例如英國 德溫特公司(Derwent)、法國DARC公司和美國化學文摘社(CAS)等擁有對 Markush結構進行計算機檢索的實用技術,而且其技術處在嚴格保密之中。世界 著名化學信息處理公司MDL近年推出的ISIS系列產品,具有結構輸入功能,但 該系列產品是為了確定結構的輸入而設計的,并不適合表達復雜的族性化學結 構邏輯體系,標引人員用其勉強標弓l族性化學結構,發生輸入出錯率高,難以 糾錯,兼容性差和培訓困難等問題,且從數據庫讀回復雜的族性化學結構時, 圖像扭曲、失真嚴重,幾乎無法對錯誤的標引結果進行修改。
Markush結構的標引的基本原理是(1)首先分析專利例如藥物專利、化學 專利中的化學結構及其語言描述;(2)從中提取最主要的化學結構片段作為整 個Markush結構的骨架結構;(3)在骨架結構上用RGroup原子來代表一類可變 基團,其中RGroup原子稱為Rn原子,是由字母R與數字1到32組成的32個 特殊的原子符號之一,例如R1、R2、R19; (4)為每 一種RGroup定義取代基團, 同樣取代基團上可以繼續連接RGroup原子;(5)在每一個取代基團上設置連接
點,以標示出與骨架結構的連接位置;(6)定義RLogic,其中RLogic是由一個 或多個對RGroup進行限定的描述字符串組成的 一 組符號;(7 )把繪制的分子結
構以連接表的形式保存在存儲設備中。
為了解決上述難點,實現M紅kush結構的順利標引和檢索,需要提供一種適 合于復雜Markush結構的,能夠自動.糾錯的Marhish標引系統和標引方法,以適 應曰趨復雜的Markush結構的專利文獻與科技文獻的采集、管理、檢索與輸出, 提高標引輸入的結構適應性、標引的正確性、標引效率以及檢索的準確性。

發明內容
本發明旨在提供一種可對復雜的族性化學結構進行繪圖和對標引結果進行 計算機存儲、檢索處理,且操作方便、準確、易于糾錯的族性化學結構標引系 統和標引方法。
為了達到上述目的,本發明提供一種族性化學結構標引系統,該標引系統 通過包括輸入設備、顯示裝置、主存儲器、存儲設備、處理器和繪圖工具完成 Markiish結構數據的輸入、存儲、處理和輸出。
其中輸入設備用于以圖形形式輸入Markush結構信息。
其中顯示裝置用于顯示圖形用戶界面及輸入結構原始信息和轉換后信息的 可視化輸出。
其中主存儲器用于存儲執行中的計算機程序,以及繪制Markush結構時的實 時數據,數據以二進制序列化形式存于主存儲器中。
其中存儲設備用于存儲計算機程序文件,以連接表形式保存的Markush結構 的mol文件和wmdows位圖(微軟公司定義的一種圖形文件格式)圖形文件, 以及各種配置文件、臨時文件及歷史文件。
其中處理器是系統中主要的數據處理設備,用于分析輸入設備輸入的 Markush結構數據,并根據操作指令對Markush結構數據進行添加、刪除、修改
與轉換等處理。
其中繪圖工具包括一標引操作主模塊, 一結構格式處理主模塊, 一分子結 構顯示主模塊。
其中標引操作主模塊用于管理系統的用戶界面接口 ,并響應用戶的各種操 作。標引操作主模塊還包括一圖形用戶接口管理子模塊, 一族性結構標引子模
塊, 一模板管理子模塊, 一配置管理子模塊。其中圖形用戶接口管理子模塊用 于管理繪圖工具與用戶的交互界面,接收用戶的操作指令。其中族性結構標引 子模塊用于繪制分子骨架結構和取代基結構,形成族性結構,并對輸入的數據 進行實時分析,將分析結果轉換為結構顯示狀態,同時把圖形數據轉換為結構 數據保存到內存中。模板管理子模塊用于管理系統中常用的分子結構模板,包 括普通模板、鏈模板、環模板以及自定義模板,并允許通過直接定義或把存儲. 設備中的mol文件添加到模板庫中,同時允許對模板進行修改、刪除操作。配
置管理子模塊用于管理用戶對系統進行自定義設置的數據和文件,包括用戶對
輸出SDF文件的自定義信息,以及常用原子列表的自定義信息,系統允許通過 自定義數據編輯接口對自定義數據進行編輯修改。
族性結構標引子模塊還包括一確定結構標引子子模塊、一 Rn原子定義子子 模塊、 一連接點定義子子模快、一Rgro叩定義子子模快、一RLogic定義子子模 塊。其中確定結構標引子子模塊用于繪制確定的、無可變基團的分子結構。其 中Rn原子定義子子模塊用于在分子結構中定義一個能夠代表一類取代基的特殊 原子。其中連接點定義子子模塊用于為取代基團定義取代基與骨架結構的連接 位置。Rgroup定義子子模塊用于對取代基團進行分組設置。Rlogic定義子子模塊 用于對RGroup進行范圍限定。模板管理子模塊,用于管理分子結構模板,通過 模板管理操作窗口 ,用戶可以把當前繪制的分子結構或存儲器中的分子結構m o 1
文件添加到指定的模板中,添加后用戶可以直接在模板列表中調用分子結構模 板。
結構格式處理主模塊用于對輸入的分子結構數據進行數據格式處理及顯示 格式處理。結構格式處理主模塊還包括一結構圖形轉換子模塊, 一分子排列子 模塊, 一分子旋轉、放縮功能子模塊。其中結構圖形轉換子模塊提供一導出功 能,可以把當前繪制的分子結構轉換成wmdows位形數據。分子排列子模 塊提供縱向排列、橫向排列等功能,用戶在結構編輯窗口中先選中需要重新排 列的分子結構,然后點擊排列方式,分子結構圖形就會以指定的方式重新排列 放置。分子旋轉、放縮功能子模塊對選中的分子結構數據矩陣進行旋轉、放縮 計算,允許用戶通過鼠標拖動來改變分子結構的顯示尺寸和方向,當用鼠標點 住分子結構的右上角時鼠標顯示為弧形箭頭,此時用鼠標拖住光標進行旋轉, 分子結構就會作相應的旋轉。
分子結構顯示主模塊用于對圖面上的分子結構數據進行結構處理。分子結
構顯示主模塊還包括一錯誤顯示子模塊,一RGroup瀏覽子模塊,一 RGroup邏 輯樹子模塊, 一分子結構預覽子模塊。
其中錯誤顯示子模塊用于當繪制化學結構時出現價鍵錯誤的原子,或把未 設置取代點的分子添加到取代分子列表中,或把含有游離分子結構的族性結構 分子保存到文件中,或未定義Rn,以及族性結構中含有空RGi:oup諸情況時用 文字方式提示錯誤。
其中RGraiip瀏覽子模塊以表格的形式排列顯示所有的取代基團,每一行代 表一個RGroup所包含的取代基團分子結構,據此分辨各取代基團所屬的 RGroup 。
其中RGroup邏輯樹子模塊通過對當前繪圖區域中的所有分子進行遞歸處 理,把所有RGraup的關系通過樹狀形式清晰地顯示出來,通過觀察RGroup的
樹型關系圖,檢査族性結構的邏輯是否正確。
其中分子結構預覽子模塊可以使用戶在保存或打開文件前將繪制的化學結
構轉換為實際的規范化學結構供預覽,當存儲器中擁有大量的mol文件時,此
功能能夠有效提高用戶的操作效率和降低繪圖失誤率。
本發明還提供一種族性化學結構的標引方法,用于標引和繪制Markush結構 圖,對該類結構圖進行編輯、存取、格式處理、數據轉換、錯誤檢查和模板管 理。該方法包含以下步驟
(1)用戶在標引操作主模塊的Markush結構標引子模塊中,用輸入設備以 圖形形式輸入確定化學結構和Markush結構信息,包括輸入骨架結構信息和取代 基1"s息,
用輸入設備輸入Markush結構的步驟如下
(1) 在確定結構標引子模塊中輸入分子骨架結構; (n)在Rn原子定義子模塊中定義Rn原子;
(m)在確定結構標引子模塊中輸入取代基團;
(iv)在連接點定義子模塊中為所有取代基團定義連接點;
(V) 在RGroup定義子模塊中把取代基團添加到RGroup中;
(VI) 在RLogic定義子模塊中對所有RGi:oup邏輯結構進行定義。
(2) 系統主存儲器存儲輸入的信息,并通過結構圖形轉換子模塊將輸入的圖形信息轉換為分子結構數據;
(3) 模板管理子模塊調用結構模板,在結構模板的基礎上進行編輯,或將
當前結構繪制圖轉換成為模板;
(4) 結構圖形轉換子模塊將當前繪制的分子結構轉換成連接表數據或 Windows位形數據,,用于導出系統;
(5) 分子排列子模塊根據用戶在結構編輯窗口中選中需要重新排列的分子 結構及排列方式,以縱向或橫向方式重新排列分子結構;
(6) 分子放縮、旋轉功能子模塊根據用戶的指令,改變分子結構的顯示尺
寸和方向,或進行旋轉;
(7) 錯誤顯示子模塊分析輸入的族性化學結構和用戶的操作指令做出相應 的錯誤提示
I)當繪制的化學結構中出現了價鍵錯誤的原子,則系統用與該原子化學
結構圖顏色相異的色圈圈中該原子;
n)當用戶要把未設置取代點的分子添加到取代分子列表中時系統彈出對
話框提示錯誤設置;
m)當用戶要把含有游離分子結構的族性結構分子保存到文件中時,系統 會提示發現非法游離取代基團;
IV) 如果當前未定義Rn,此時往RGroup中添加取代基時系統提示未找到 對應的RGroup定義;
V) 如果族性分子結構中至少一個RGroup不含有任何分子結構,則在保存 時會提示發現空RGroup。
(8) RGmup瀏覽子模塊根據用戶指令,以表格形式排列顯示所有的取代 基團,每一行代表一個RGroup所包含的所有取代基,該模塊清楚地顯示所有取 代基的歸屬;
(9) RGroup邏輯樹子模塊通過對當前繪圖區域中的所有分子進行遞歸處 理,把所有RGronp的關系通過樹狀形式清晰地顯示出來,通過觀察RGraup的 樹型關系圖,檢查族性結構的邏輯是否正確,如果滿足如下條件即為正確
(I)無游離取代基團,即所有的取代基團都被添加到了 RGroup中; (II )無空RGroup,即所有的RGroup都包含有至少 一個取代基團; (m)取代基團上的連接點數量與RGroup原子的連接鍵數量相同。
利用本發明的系統和方法,可以方便地繪制、排列、存儲、編輯、檢索Markush 結構,并檢査繪圖中的Markush結構錯誤。


圖1是本發明專利族性化學結構的標引系統和標引方法的硬件架構圖。
圖2是本發明族性化學結構標引系統和標引方法的繪圖工具功能模塊圖。
圖3是本發明族性化學結構標引系統模塊界面圖。
圖4是本發明族性化學結構標引系統和標引方法的族性化學結構標引流程圖。
圖5是本發明族性化學結構標引系統和標引方法的結構預覽流程圖。
圖6是本發明族性化學結構標引系統和標引方法的模板管理子模塊使用流 程圖。
圖7是本發明族性化學結構標引系統和標引方法的結構圖形轉換子模塊使 用流程圖。
圖8是本發明族性化學結構標引系統和標引方法的RGroup樹分析流程圖。
圖9是本發明族性化學結構標引系統和標引方法的Markush結構輸入流程圖。
圖io是本發明族性化學結構標引系統和標引方法的分子排列示意圖。
圖11是本發明族性化學結構標引系統和標引方法的族性結構標引示意圖。
圖12是本發明族性化學結構標引系統和標引方法的RGroup樹示意圖。
具體實施例方式
第一實施例
圖l給出了本發明專利族性化學結構標引系統10和標引方法的硬件架構圖。 該系統架構包括一處理器12、 一主存儲器13、 一個或多個存儲設備14、 一顯示 裝置15, —輸入設備16。各硬件通過系統總線11相互連接,進行信息的傳遞。
處理器12是族性化學標引系統10進行數據處理的核心,負責處理、運算族 性化學結構標引系統10內部的所有數據。而總線11則負責族性化學結構標引系 統10內部所有數據的交換。主存儲器13用于存儲處于執行狀態的程序和數據。 存儲設備14用于存儲計算機程序以及計算機操作數據,其具體可以分為硬盤、軟盤、磁帶、光存儲設備以及其它數據存儲設備。顯示裝置5是向用戶展示計
算機操作結果的設備,而輸入設備16包含一鍵盤161及一鼠標162,用于接收
用戶輸入信息,以控制計算機運行或為計算機提供操作原始數據。
計算機程序(又稱計算機控制邏輯)存儲于主存儲器13或存儲設備14中。 這些計算機程序所執行的功能是首先在處理器12控制下加載程序到主存儲器 中,然后以指令為單位,逐一傳送到處理器12中運行,控制族性化學結構標引 系統IO中各部分的協同作業。 '
圖2給出了本發明族性化學結構標引系統和標引方法的繪圖工具20的功能
模塊圖。
本發明所稱的模塊是指完成一特定功能的計算機程序段,用以描述一段特 定功能模塊的執行過程。該繪圖工具20包括一標引操作主模塊21, 一結構格式 處理主模塊22, 一分子結構顯示主模塊23。
其中標引操作主模塊21包含一圖形用戶接口管理子模塊211, 一族性結構 標引子模塊212, 一結構預覽子模塊213, 一模板管理子模塊214。
圖形用戶接口管理子模塊211用于管理與用戶交互的所有工具,包括菜單、 工具條以及窗口界面。
族性結構標引子模塊212用于標引族性化學結構,首先用戶通過輸入設備 16輸入化學結構,本模塊分析輸入設備發出的指令,根據指令要求在主存儲區 創建對應分子結構的矩陣數據,并對矩陣數據進行分析計算,最后根據指令把 主存儲區中的數據轉換成文本數據輸出到存儲設備M中。該模塊還包括將分子 結構及其相關數據轉換成SDF文件格式,以便用于操作大量的分子結構數據。 保存數據時,同時保存與標引分子結構相關的附屬信息,例如分子的編輯曰期 以及結構屬性數據。
配置管理子模塊213用于管理用戶對系統進行自定義設置的數據和文件。包 括用戶對輸出SDF文件的自定義信息,以及常用原子列表的自定義信息。系統
允許通過自定義數據編輯接口對自定義數據進行編輯修改。
模板管理子模塊214用于管理系統中常用的分子結構模板,包括普通模板、
鏈模板、環模板以及自定義模板,并允許通過直接定義的方式添加模板信息, 同時允許對模板進行修改和刪除操作。
結構格式處理子模塊22包含一結抅圖形轉換子模塊221,分子排列子模塊222,分子放縮、旋轉功能子模塊223。
結構圖形轉換子模塊221用于把用戶輸入的分子圖形轉換為主存儲器13中 的矩陣數據,或者把主存儲器13中的矩陣數據轉換為文本描述數據或Windows 位圖數據。
分子排列子模塊222用于根據用戶指令對分子結構進行排列,排列的基點 坐標按照每個分子的中心坐標計算,每個分子在排列后其中的原子相對于分子 的中心點坐標位置不變。
分子放縮、旋轉功能子模塊223用于計算并修改主存儲器13中的矩陣數據
來改變分子結構的顯示尺寸和方向,或進行旋轉。
其中分子結構顯示子模塊23包含一錯誤顯示子模塊231,一RGroup瀏覽子
模塊232, 一 RGroup邏輯樹子模塊233和一分子結構預覽子模塊234。
錯誤顯示子模塊231對出現錯誤的分子結構或原子進行提示出錯處理,其能 夠識別并做出相應處理的錯誤情況包括但不限于以下幾種
I)當繪制的化學結構中出現了價鍵錯誤的原子,則系統用與該原子化學 結構圖顏色相異的色圏圏中該原子;
n)當用戶要把未設置取代點的分子添加到取代分子列表中時系統彈出對 話框提示錯誤設置;
in)當用戶要把含有游離分子結構的族性結構分子保存到文件中時,系統 會提示發現非法游離取代基團;
IV) 如果當前未定義Rn,此時往RGroup中添加取代基時系統提示未找到 對應的RGroup定義;
V) 如果族性分子結構中至少一個RGroup不含有任何分子結構,則在保存 時會提示發現空RGroup。
RGroup瀏覽子模塊232用于以分組排列的單元格形式顯示所有取代基團, 由于每一行代表一個RGroup所包含的取代基團分子結構,根據此就能夠分辨出 各取代基團所屬的RGraup,在單元格中的分子基團如果其尺寸大于單元格的范 圍則隱藏超出單元格的部分。
RGraup邏輯樹子模塊233用于分析分子結構中各RGroup之間的關系,并 以倒樹結構顯示,其中RGroup原子名字做為樹的結點,樹的起始結點為骨架結 構上的RGroup原子。
分子結構預覽子模塊234用于在不打開mol文件時可以查看文件的內容,首 先結構圖形轉換子模塊221把文件內容轉換為矩陣數據存儲在主存儲器13中, 再由模塊234把分子結構的簡化圖形輸出到顯示裝置15中。
族性結構標引子模塊212包含一確定結構標引子子模塊2121, —Rn原子定 義子子模塊2122, —連接點定義子子模塊2123, 一 RGi:oup定義子子模塊2124, 一RLogk定義子子模塊2125。
其中確定結構標引子子模塊2121用于在繪圖區域中創建確定的、不含有可 變基團的分子結構。
其中Rn原子定義子子模塊2122用于在確定結構或取代基團上創建Rn原子。
其中連接點定義子子模塊2123用于在取代基團上創建兩個連接點以標示取
代基團與骨架結構相連接的位置。
其中RGroup定義子子模塊2124用于在主存儲區中創建可變基團的管理區 域,以管理取代基團,可以通過此模塊對取代基團進行添加、刪除、修改。
其中RLogic定義子子模塊2125用于對族性結構中的RGraup進行限定,限
定字符包含數字和比較操作符(<、〉、=)。
如圖3所示,是本發明族性化學結構標引系統模塊主界面圖310。該主界面 分割為多個區域,包括一菜單欄311, —系統工具欄312, 一RG1:cmp工具欄313, 一排列工具欄314,兩個模板工具欄即常用結構模板工具欄315和超原子工具欄 316, 一繪圖區317, 一繪圖工具欄318, 一 RGroup瀏覽區319, 一超原子工具 欄320。繪圖區317和RGroup瀏覽區319可分別擴大與縮小各自的尺寸。
其中菜單欄311包含打開、保存、打印、剪切、粘貼、撤銷、導入、導出、 選擇、清除、SDF設置、原子列表設置、自定義模板、定義RGroup原子、定義 RGraup、定義連接點和定義RGroup樹功能按鈕。
系統工具欄312包含新建、打開、保存、剪切、復制、粘貼和打印功能按鈕。
RGroup工具欄313包括定義RGroup、定義RLogic、定義連接點和定義 RGraup原子功能按鈕。
排列工具欄314包含對分子結構上對齊、下對齊、右居中、左對齊和上居中
功能按鈕。
模板工具欄包含常用結構模板工具欄315和超原子工具欄316功能按鈕。 繪圖區317是Markush結構圖的主繪制區,在該區域輸入各種化學結構及進行各類定義。
繪圖工具欄318包括矩形選擇工具、不規則選擇工具、橡皮、文本工具、單 鍵、雙鍵、三鍵、碳鏈工具、單鍵形楔出鍵、單鍵形楔入鍵、楔出鍵、楔入鍵、 未定義立體鍵、任意鍵和聚合物工具的功能按鈕。
RGroup瀏覽區319顯示RGroup名稱和RGroup所包含的取代基團列表,取 代基團以先后順序排列在RGroup名稱后面。如果取代基團較大無法完全顯示, 則超出單元格的部分被隱藏起來。
超原子工具欄320包含鹵素、任意金屬、非氫原子、非C非H原子、錒系
原子、烷基/亞烷基(非環飽和烴基)、烯基/亞烯基(只含單鍵和雙鍵的非環 不飽和烴基)、炔基/亞炔基(至少含一個三鍵的非環不飽和烴基)、雜鏈烴基 /亞雜鏈烴基(非環烴基,含有雜原子取代非端點及連接點的碳原子)、芳基/ 亞芳基(含有芳香性基團的環烴基)、非芳香性環烴基/亞非芳香性環烴基、雜 芳基/亞雜芳基(含有芳香性基團的雜環基)、非芳香性雜環基/亞非芳香性雜 環基、聚合物的端基、染料殘基、熒光發色基團、聚合物或聚合肽的殘基、酸 官能團去掉羥基后得到的基團、保護基或官能阻斷基的功能按鈕。
如圖4所示,是本發明族性化學結構標引系統和標引方法的族性化學結構 標引流程圖。族性結構標引過程如下(1)新建一個繪圖窗口 (步驟411),用 于繪制建立化學結構標引圖;(2)在繪圖區域中繪制一個化合物骨架結構(步 驟412); (3)在繪圖區域中繪制取代基團(步驟413); (4)在取代基團上設置 連接點(步驟414); (5)分別把取代基團設置到對應的RGroup中(步驟41",
此時系統會判斷取代基團的連接點設置的是否正確,如果正確則繼續,否則重 新設置(步驟416); (6)設置RLogic (步驟""7); (7)將繪制的圖形轉換成連 接表文本數據并保存為Mol文件或SDF文件,或者將繪制的圖形轉換成Wmdows 位形數據并保存為位圖文件(步驟418); (8)判斷是否為合法的族性化學 結構,如果正確則繼續,否則重新修改結構(步驟419); (9)把Mol文件或SDF 文件或位圖文件輸出到存儲器中(步驟420)。
如圖5所示,是本發明族性化學結構標引系統和標引方法的結構預覽流程 圖。其過程如下(1)啟動預覽文件窗口,運行族性化學結構標引系統的主程 序(步驟51); (2)用輸入工具點擊文件打開按鈕,打開文件對話框,在文件對 話框中用輸入工具選擇要查看的mol文件(步驟52); (3) mol文件內容被載入到
主存儲裝置13中,在結構圖形轉換子模塊中mol文件內容被轉換成結構圖形矩陣
(步驟W); (4)轉換后的矩陣被輸出到顯示裝置15中(步驟54)。
如圖6所示,是本發明族性化學結構標引系統和標引方法的模板管理子模 塊使用流程圖。其過程如下(1)運行族性化學結構標引系統的主程序,在結 構標引子模塊21中繪斜確定分子結構(步驟61); (2)選中需要設置為模板的 分子結構(步驟62); (3)通過輸入工具執行"添加到模板"命令(步驟63);
(4)通過輸入工具為新模板命名(步驟64); (5)選擇目標模板庫(步驟6";
(6)執行添加命令(步驟66); (7)模板被添加到目標模板庫中(步驟67)。 如圖7所示,是本發明族性化學結構標引系統和標引方法的結構圖形轉換 子模塊使用流程圖。其過程如下(1)運行族性化學結構標引系統的主程序, 在結構標引模塊中繪制分子結構圖形(步驟71)或通過輸入設備16輸入mol文 件(步驟");(2)分子結構圖形被轉換為矩陣數據(步驟");(3)矩陣數據 被轉換為mol文件內容(步驟74)或被轉換為位圖文件(步驟"75); (4) mol文 件或位圖文件被輸出到存儲設備14中(步驟76)。
如圖8所示,是本發明族性化學結構標引系統和標引方法的RGraup樹分析 流程圖,其過程如下(1)運行族性化學結構標引系統的主程序,在結構標引 模塊21中繪制族性化學結構分子(步驟81); (2)執行"RGroupTree"命令, 遞歸遍歷所有Rgroup (步驟82); (3)分析分子結構中RGroup之間的邏輯關系
(步驟83); (4)建立以骨架結構上的RGroup為根結點的倒樹形結構結構樹(步 驟84); (5)把建立的倒樹形結構以圖形方式輸出到顯示裝置中(步驟85)。
如圖9所示,是本發明族性化學結構標引系統和標引方法的Markush結構輸 入流程圖,其過程如下(1)在確定結構標引子子模塊2121中輸入分子骨架結 構(步驟91);在Rn原子定義子子模塊2122中定義Rn原子(步驟9"; (3) 在確定結構標引子子模塊2121中輸入取代基團(步驟93); (4)在連接點定義 子子模塊2123中為所有取代基團定義連接點(步驟94); (5)在RGraup定義子 子模塊2〗24中把取代基團添加到RGroup中(步驟95); (6)在RLogic定義子 子模塊2125中對所有RGroup邏輯結構進行定義(步驟%)。
如圖IO所示,是本發明族性化學結構標引系統和標引方法的分子排列示意 圖,原始分子結構圖101經由分子排列子模塊222計算后橫向排列為分子結構圖 102,縱向排列為分子結構圖103。
如圖ll所示,是本發明族性化學結構標引系統和標引方法的族性結構標引
示意圖,通過族性化學結構標引系統標引一個族性分子結構的步驟如下
(1) 在確定結構標引子子模塊2121中繪制骨架結構in,并在Rn原子定義 子子模塊2122中定義R1原子,Rl原子為Rn原子中的一種;
(2) 在確定結構標引子子模塊2121中繪制取代基團112、取代基113和取 代基1H,并在Rn原子定義子子模塊2122中為取代基113定義R3原子和為取 代基114定義R2原子,R2和R3原子也都屬于Rn原子;
(3) 在連接點定義子子模塊2123中為取代基"2、取代基113和取代基114 定義連接點,即取代基上用紅色色圈圈著的位置,取代基上最多可以定義兩個 連接點,第二個連接點用藍圏表示;
(4) 在RGroup定義子子模塊2124中把取代基112、取代基113和取代基 114定義到Rl (圖1111)中;
(5) 重復步驟2到步驟4分別定義R2 (圖2222),其中包括取代基115和 取代基116,定義R3 (圖3333),其中包括取代基117,定義R4 (圖4444),其 中包括取代基118和取代基119, R4原子為Rn原子中的一種;
(6) 在RLogic定義子子模塊2125中定義RLogic結構1110,其中"R1>0" 表示Rl的數量不得少于1個,"R2〉0"表示R2的數量不得少于1個,"R3>0" 表示R3的數量不得少于1個,"R4>0"表示R4的數量不得少于1個,"RestH" 表示其RGroup原子可以為"H"原子。
如圖12所示,是本發明族性化學結構標引系統和標引方法的RGmup樹示 意圖。樹結構圖120是RGi:oup邏輯樹子模塊233對圖11中所示的標引結果做 出分析后,以樹型結構把所有RGroup的關系顯示出來。其中R1代表骨架結構 111上的Rl原子,Rl包含R2和R3, R2代表取代基114上的R2原子,R3代表 取代基"3上的R3原子,R2又包含R4,R4代表取代基115上的R4原子,RGroup 邏輯樹子模塊233以Rl為起始根結點進行遞歸遍歷所有RGrcmp生成樹型結構 圖Rl-R3和Rl-R2-R4。
第二實施例
下面描述的是第二實施例,其中與第一實施例功能相同的部分,在此不再 贅述。
如圖2給出的族性化學結構標引系統和標引方法的繪圖工具20的功能模塊 圖。
標引搡作主模塊21中的族性結構標引子模塊212用于標引族性化學結構, 首先用戶通過輸入設備16輸入化學結構,本模塊分析輸入設備發出的指令,根 據指令要求在主存儲區創建對應分子結構的矩陣數據,并對矩陣數據進行分析 計算,最后根據指令把主存儲區中的數據轉換成Windows位形數據輸出到 存儲設備"中。該模塊還包括將分子結構及其相關數據轉換成SDF文件格式,
以便用于操作大量的分子結構數據。保存數據時,同時保存與標引分子結構相 關的附屬信息,例如分子的編輯日期以及結構屬性數據。
標引操作主模塊21中的模板管理子模塊214用于管理系統中常用的分子結
構模板,包括普通模板、鏈模板、環模板以及自定義模板,并可以把存儲設備 中的mol文件添加到模板庫中,同時允許對模板進行修改和刪除操作。
以上描述的實施例僅僅是舉例或者說明性的描述,并非旨在是窮舉的或者 限制本發明,對于本領域普通技術人員來說,在本發明的精神和范圍內進行許 多修改、變化或替換是顯而易見的。選擇和描述的實施例僅僅是為了更好地解 釋本發明的原理。
權利要求
1.一種族性化學結構標引系統,包括輸入設備、顯示裝置、主存儲器、存儲設備、處理器和繪圖工具,用于完成Markush結構數據的輸入、存儲、處理和輸出,其特征在于繪圖工具包括一標引操作主模塊,一結構格式處理主模塊,一分子結構顯示主模塊;標引操作主模塊用于管理系統的用戶界面接口,接收用戶由用戶界面輸入的各種繪圖操作指令,并將用戶繪制的分子骨架結構及取代基結構形成族性結構;結構格式處理主模塊用于實時的對用戶輸入的分子結構數據進行分析,并將分析結果轉換為計算機可識別的族性結構的mol文件和windows位圖(微軟公司定義的一種圖形文件格式)的圖形文件,同時把所述圖形文件保存到內存中;分子結構顯示主模塊用于對圖面上的分子結構數據進行結構處理,并通過用戶界面接口顯示結構信息;用戶由標引操作主模塊完成Markush結構數據的輸入,而結構格式處理主模塊對用戶輸入的Markush結構數據進行存儲和格式轉換,并通過分子結構顯示模塊顯示經過處理的、用戶可識別的結構信息。
2. 如權利要求l所述的一種族性化學結構標引系統,其特征在于標引操 作主模塊包含一圖形用戶接口管理子模塊, 一族性結構標引子模塊, 一模板管 理子模塊,一配置管理子模塊;其中圖形用戶接口管理子模塊用于管理繪圖工具與用戶的交互界面,接收用戶的操作指令;其中族性化學結構標引子模塊用于繪制分子骨架結構和取代基結構,形成族性結構,并對輸入的數據進行實時 分析,將分析結果轉換為結構顯示狀態,同時把圖形數據轉換為結構數據保存到內存中;模板管理子模塊用于管理分子結構模板,通過模板管理操作窗口,把當前繪制的分子結構或存儲器中的分子結構mol文件添加到指定的模板中,添加后用戶可以直接在模板列表中調用分子結構模板;配置管理子模塊用于管理用戶對系統進行自定義設置的數據和文件,包括用戶對輸出SDF文件的自定義信息,以及常用原子列表的自定義信息。
3. 如權利要求l所述的一種族性化學結構標引系統,其特征在于結構格 式處理主模塊包括一結構圖形轉換子模塊, 一分子排列子模塊, 一分子旋轉、 放縮功能子模塊;其中結構圖形轉換子模塊用于提供一導出功能,可以把當前繪制的分子結構轉換成windows位形數據;分子排列子模塊用于提供縱向排列、橫向排列功能;分子旋轉、放縮功能子模塊用于改變分子結構的顯示尺 寸和方向。
4. 如權利要求l所述的一種族性化學結構標引系統,其特征在于分子結 構顯示主模塊還包括一錯誤顯示子模塊,一RGroup瀏覽子模塊,一RGroup邏 輯樹子模塊, 一分子結構預覽子模塊;錯誤顯示子模塊對出現錯誤的分子結構 或原子進行提示出錯處理,其能夠識別并做出相應處理的錯誤情況包括但不限 于以下幾種I)當繪制的化學結構中出現了價鍵錯誤的原子,則系統用與該原子化學 結構圖顏色相異的色圈圈中該原子;n)當用戶要把未設置取代點的分子添加到取代分子列表中時系統彈出對話框提示錯誤設置;m)當用戶要把含有游離分子結構,即包含已設置了連接點但未被添加到任何RGroup的取代基團的族性結構分子保存到文件中時,系統會提示發現非法游離取代基團;IV) 如果當前未定義Rn原子,此時往RGroup中添加取代基時系統提示未 找到對應的RGraup定義;V) 如果族性分子結構中至少一個RGixmp不含有任何分子結構,則在保存 時會提示發現空RGroup。
5. 如權利要求l所述的一種族性化學結構標引系統,其特征在于族性化 學結構標引系統主界面分割的區域中同時包含繪圖區和瀏覽區,可分別擴大與縮小所述繪圖區和瀏覽區尺寸。
6. 如權利要求2所述的一種族性化學結構標引系統,其特征在于族性結 構標引子模塊包含一確定結構標引子子模塊,一Rn原子定義子子模塊,連接點 定義子子模塊,一 RGmup定義子子模塊,一 RLogic定義子子模塊;其中確定 結構標引子子模塊用于繪制確定的、無可變基團的分子結構;其中Rn原子定義 子子模塊用于在分子結構中定義一個能夠代表一類取代基的特殊原子;其中連接點定義子子模塊用于為取代基團定義取代基與骨架結構的連接位置;Rgraup 定義子子模塊用于對取代基團進行分組設置;Riogic定義子子模塊用于對 RGroup進行范圍限定。
7. 如權利要求2所述的一種族性化學結構標引系統,其特征在于分子結構子模板采用xml格式文件管理,xml文件中保存有分子結構和分子相關屬性信 白
8. 如權利要求3所述的一種族性化學結構標引系統,其特征在于結構圖 形轉換子模塊將分子結構數據轉換為Windows位形格式文件。
9. 如權利要求3所述的一種族性化學結構標引系統,其特征在于分子排 列子模塊將選中的標引化學結構按橫向或縱向的方式進行排序,每個分子的中 心坐標作為基準點坐標。
10. 如權利要求3所述的一種族性化學結構標引系統,其特征在于分子旋轉、放縮功能子模塊對選中的分子結構數據矩陣進行旋轉、放縮計算。
11. 如權利要求4所述的一種族性化學結構標引系統,其特征在于所述 Rn原子是由字母R與數字1到32組成的32個特殊的原子符號之一。
12. 如權利要求4所述的一種族性化學結構標引系統,其特征在于RGroup 瀏覽子模塊以單元格的形式顯示取代基化學結構,由于每一行代表一個RGroup 所包含的取代基團分子結構,根據此就能夠分辨出各取代基團所屬的RGroup。
13. 如權利要求4所述的一種族性化學結構標引系統,其特征在于RGroup 邏輯樹子模塊通過對當前繪圖區域中的所有分子進行遞歸處理,把所有RGroup 的關系通過樹狀形式清晰地顯示出來,通過觀察RGraup的樹型關系圖,能夠檢 査族性結構的邏輯是否正確,如果滿足如下條件即為正確無游離取代基團,即所有的取代基團都被添加到了 RGroup中; 無空RGroup,即所有的RGroup都包含有至少一個取代基團; 取代基團上的連接點數量與RGi:oup原子的連接鍵數量相同。
14. 一種族性化學結構標引方法,用于標引和繪制Mat:kush結構圖,對該類 結構圖進行編輯、存取、格式處理、數據轉換、錯誤檢查和摸板管理,其特征 在于,包含以下步驟(1) 用輸入設備以圖形形式輸入確定化學結構和Markush結構信息,包括輸入骨架結構信息和取代基信息;(2) 系統主存儲器存儲輸入的信息,并通過結構圖形轉換子模塊將輸入的 圖形信息轉換為分子結構數據; (3) 模板管理子模塊調用結構模板,在結構模板的基礎上進行編輯,或將當前結構繪制圖轉換成為模板;(4) 結構圖形轉換子模塊將當前繪制的分子結構轉換成連接表數據或Windows位形數據,用于導出系統;(5) 分子排列子模塊根據在結構編輯窗口中選中需要重新排列的分子結構及排列方式,以縱向或橫向方式重新排列分子結構; .(6) 分子旋轉、放縮功能子模塊根據指令,改變分子結構的顯示尺寸和方 向,或進行旋轉;(7) 錯誤顯示子模塊分析輸入的化學結構和用戶的操作指令做出相應的錯誤提示。(8) RGroup瀏覽子模塊根據指令,以表格形式排列顯示所有的取代基團, 每一行代表一個RGroup所包含的所有取代基。(9) RGroup邏輯樹子模塊通過對當前繪圖區域中的所有分子進行遞歸處 理,把所有RGroup的關系通過樹狀形式顯示出來,通過RGroup樹型關系圖, 檢查族性結構的正確性。全文摘要
一種涉及在建立化學結構尤其是族性化學結構數據庫時的標引系統和標引方法,用于標引和繪制Markush結構圖,具有編輯、存取、格式處理、數據轉換、錯誤檢查和模板管理功能。該方法包括如下主要步驟(a)以圖形形式輸入確定化學結構和Markush的骨架結構信息和取代基信息;(b)將輸入的圖形信息轉換為分子結構數據;(c)將當前繪制的分子結構轉換成連接表數據或Windows位形數據;(d)以縱向或橫向方式重新排列分子結構;(e)對輸入的錯誤化學結構做出相應的錯誤提示;(f)以表格形式排列顯示所有的取代基團;(g)顯示RGroup樹型關系圖。上述能夠自動糾錯的Markush標引系統和標引方法提高了標引輸入的結構適應性、標引的正確性、標引效率以及檢索的準確性。
文檔編號G06F19/00GK101196963SQ20071030386
公開日2008年6月11日 申請日期2007年12月26日 優先權日2007年12月26日
發明者劉延淮, 峻 徐, 王新毅 申請人:北京時代楷模科技有限公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1