一種面向多尺度計算的計算機系統的制作方法
【專利摘要】本實用新型公開了一種面向多尺度計算的計算機系統。所述計算機系統包括多個通用多核處理器、多指令多數據眾核處理器、單指令多數據眾核處理器及網絡接口卡,其中,所述多個通用多核處理器用于計算過程的控制與調度,所述多指令多數據眾核處理器用于判斷和分支較多的計算任務的處理,所述單指令多數據眾核處理器用于判斷和分支較少的計算任務的處理,所述網絡接口卡用于將所述計算機系統連接至計算機網絡。采用本實用新型提供的計算機系統,能夠使多尺度計算中不同特點計算任務獲得相適應的高效執行部件,提高計算的總體效率,從而縮短求解時間,減少運行費用。
【專利說明】一種面向多尺度計算的計算機系統
【技術領域】
[0001]本實用新型涉及高性能計算機領域,尤其涉及一種面向多尺度計算的計算機系統。
【背景技術】
[0002]隨著現代科學技術的飛速發展,傳統的科學實驗和理論研究方法已不能完全滿足當代科學研究與技術進步的需求,計算機模擬作為20世紀發展起來的新型科研手段被視為現代科學技術進步的“加速器”而受到越來越多的重視。大型計算機模擬是以計算能力為基礎,依據研究目標的理論模型運用數值計算方法,在計算機上進行虛擬實驗。大型計算機模擬的特點是費用低、周期短、方便靈活、應用廣泛,甚至可以模擬人類現代技術無法實現的科學實驗,如星系演化和宇宙形成過程等。因此,超級計算系統已經成為世界各國競相研制的科研設備。
[0003]經研究發現,多尺度結構和離散性是大多數模擬對象的共同特征。經過進一步的實例研究,可以采用下面的具有普遍性的技術對具有多尺度結構的復雜系統進行模擬:
[0004]I)在適當尺度上將系統離散為大量具有近程可疊加相互作用的簡單模型單元;
[0005]2)除上述單元間的相互作用外,它們還受一個或多個變分或極值條件的約束,從而具有與單獨運動時不同的行為;
[0006]3)施加的約束的形式也決定于受約束單元的行為,因此可以設置更高層次、更復雜的模型單元,通過與較低層單元的相互作用來體現這種約束-反饋機制;
[0007]4)上述單元間的關系可以嵌套,從而形成多層次計算模型。
[0008]針對上述技術,我們可以設計多層次近程連接、自上而下由繁到簡、由少到多的計算單元系統,使計算單元與模型單元、模型單元間的作用與計算單元間的連接之間建立適當的映射關系,從而最大限度地發揮計算硬件的性能,減少不必要的硬件開銷。同時,采用這種技術,根據模擬對象物理上的穩定性條件,我們還可以通過上層單元對下層單元的約束來修正計算誤差,從機理上保證計算的精度。
[0009]在中國實用新型專利200910237027.1提出了一種面向多尺度復雜系統,基于變分多尺度方法的計算機軟硬件結構,高效的實現了對復雜系統的合理模擬。但是,所公開的計算機軟硬件結構是為解決復雜系統的合理模擬而定制的,適用范圍較窄。
[0010]單指令多數據技術又被稱為單指令流多數據流技術,是使用單個控制單元來異步地控制多個運算單元,從而實現并行計算的技術。多指令多數據技術又被稱為多指令流多數據流技術,是使用多個控制單元來異步地控制多個運算單元,實現并行計算的技術。
[0011]顯式算法和隱式算法是動力學分析中常見的兩種算法。顯式算法采用動力學方程的一些差分格式,不需要進行平衡迭代,計算速度快,時間步長只要取的足夠小,一般不存在收斂性問題。因此需要的內存也比隱式算法要少。并且數值計算過程可以很容易地進行并行計算,程序編制也相對簡單。但顯式算法采用的時間步長一般較小,只有在計算問題的規模足夠大時才能顯示其優勢。[0012]隱式算法中,在每一時間步內都需要對動力學平衡方程進行迭代求解,并且每次迭代都需要求解大型的線性方程組,這個過程需要占用相當數量的計算資源、磁盤空間和內存。該算法中的時間步長可以比較大,至少可以比顯式算法大得多,但是實際運算中上要受到迭代次數及非線性程度的限制,需要取一個合理值。
實用新型內容
[0013]本實用新型的目的在于提出一種面向多尺度計算的計算機系統,所述的計算機系統能夠采用多尺度計算技術提高計算效率,同時適用范圍廣,可擴展性強。
[0014]為達此目的,本實用新型采用以下技術方案:
[0015]一種面向多尺度計算的計算機系統,所述計算機系統包括:
[0016]多個通用多核處理器,用于計算過程的控制與調度;
[0017]多指令多數據眾核處理器,用于判斷和分支較多的計算任務的處理;
[0018]單指令多數據眾核處理器,用于判斷和分支較少的計算任務的處理;
[0019]網絡接口卡,用于將所述計算機系統連接至計算機網絡。
[0020]進一步的,所述多個通用多核處理器、多指令多數據眾核處理器、單指令多數據眾核處理器及多個網絡接口卡均與外部設備總線(PCI)連接,以實現多個處理器之間及處理器與所述網絡接口卡之間的通信。
[0021]進一步的,所述多個通用多核處理器均通過存儲總線與共享存儲器連接,以實現多個通用多核處理器之間的存儲共享。
[0022]進一步的,所述多個通用多核處理器之間通過高速總線相互連接,以實現多個通用多核處理器之間的通信。
[0023]進一步的,所述通用多核處理器采用英特爾(Intel)公司的至強(Xeon)系列處理器;所述通用多核處理器之間的高速總線采用英特爾(Intel)公司的快速通道互聯(QuickPath Interconnect, QPI)技術。
[0024]進一步的,所述通用多核處理器采用AMD公司的羿龍(Phenom)系列處理器;所述通用多核處理器之間的高速總線采用AMD公司的超傳送(Hyper Transport, HT)總線。
[0025]進一步的,所述多指令多數據眾核處理器采用英特爾(Intel)公司的集成眾核(Many Integrated Core, MIC)系列眾核處理器。
[0026]進一步的,所述單指令多數據眾核處理器采用英偉達(Nvidia)公司的費爾米(Fermi)系列通用計算圖形處理器。
[0027]進一步的,所述單指令多數據眾核處理器采用英偉達(Nvidia)公司的開普勒(Kepler)系列通用計算圖形處理器。
[0028]進一步的,所述網絡接口卡采用以太網卡。
[0029]進一步的,所述網絡接口卡采用無限帶寬(InfiniBand)接口卡。
[0030]本實用新型提出了適用于多個科研領域的大量超級計算問題的面向多尺度計算的計算機系統。相對于其它用于科研計算的超級計算機系統,所述面向多尺度計算的計算機系統具有以下特點:
[0031]I)適用范圍廣。利用此框架,代表各種單元間的各種作用方式可模塊化的嵌入通用的總體算法和數據結構中,無需獨立的編寫相應的計算軟件。[0032]2)可擴展性強。通用超級計算系統為適應各種不同的算法和應用問題,需要任何一對處理器間能快速交換數據,多尺度離散模擬的特點決定了每個處理器只需和特定的極少數處理器交換或共享數據,只要可靠性允許,這樣的系統中處理器數量可以任意擴展而保持相對的成本和使用效率不變。
[0033]3)并行效率高。各離散單元間作用的計算可在大量處理器上同時進行,而不必采用傳統的中央處理器(CPU )順序處理,可極大地提高處于計算操作中的元器件的比例,減少存儲硬件的開銷,從而降低同樣制造能力下硬件制造能力、成本及運行功耗。
【專利附圖】
【附圖說明】
[0034]圖1是本實用新型具體實施例提供的計算機系統的邏輯結構示意圖。
[0035]圖2是本實用新型具體實施例提供的計算機系統的實現裝置的物理布置示意圖。
【具體實施方式】
[0036]下面結合附圖并通過【具體實施方式】來進一步說明本實用新型的技術方案。
[0037]圖1是本實用新型具體實施例提供的計算機系統的邏輯結構示意圖。
[0038]圖2是本實用新型具體實施例提供的計算機系統的實現裝置的物理布置示意圖。
[0039]參見圖1,所述面向多尺度計算的計算機系統包括多個通用多核處理器101、存儲總線102、共享存儲器103、外部設備總線(PCI) 104、高速總線105、多指令多數據眾核處理器106、單指令多數據眾核處理器107及網絡接口卡108。
[0040]所述多個通用多核處理器101與所述外部設備總線(PCI)104相連接。通過所述外部設備總線(PCI) 104,所述通用多核處理器101可以同所述多指令多數據眾核處理器106及所述單指令多數據眾核處理器107進行通信。所述通用多核處理器101與所述多指令多數據眾核處理器106及所述單指令多數據眾核處理器107之間的通信采用中斷方式。具體的,當所述通用多核處理器101需要通過所述外部設備總線(PCI )104與所述多指令多數據眾核處理器106或者所述單指令多數據眾核處理器進行通信時,所述通用多核處理器通過所述外部設備總線(PCI) 104的中斷引腳發送中斷請求消息,接收到中斷確認消息后所述通用多核處理器101即可與目標處理器進行通信。
[0041]根據本實施例的一種實施方式,所述通用多核處理器101是英特爾(Intel)公司的至強(Xeon)系列處理器。根據本實施例的另一種實施方式,所述通用多核處理器101是AMD公司的羿龍(Phenom)系列處理器。
[0042]所述存儲總線102將所述多個通用多核處理器與所述共享存儲器103相連,用于實現所述多個通用多核處理器101對所述共享存儲器103的讀寫。所述存儲總線102包括地址線和數據線。所述地址線用于傳輸地址信號,以確定某一時刻所述通用多核處理器101所讀取或者寫入的存儲單元的地址。所述數據線用于傳輸數據信號。所述通用多核處理器101通過所述數據線傳輸對所述共享存儲器103進行讀取或者寫入的數據信息。
[0043]所述共享存儲器103通過存儲總線102與所述多個通用多核處理器101相連接。所述共享存儲器103用于為多個通用多核處理器101提供共享的存儲區域。通過所述共享的存儲區域,可以實現多個通用多核處理器101之間大量的數據交換。所述共享存儲器103采用雙數據率同步動態隨機訪問存儲器(DDRSRAM )。[0044]所述外部設備總線(PCI)104與所述多個通用多核處理器101、多指令多數據眾核處理器106、單指令多數據眾核處理器相連107及網絡接口卡108相連,用于實現多個處理器及網絡接口卡之間的通信。
[0045]所述外部設備總線(PCI) 104的總線寬度是64位,并且所述外部設備總線(PCI)的總線速度是133MHz。所有連接至所述外部設備總線(PCI )104的設備之間的通信通過中斷方式完成。
[0046]所述高速總線105將所述多個通用多核處理器101相連,用于實現所述多個通用多核處理器101之間的通信。所述高速總線主要用于所述多個通用多核處理器101之間數據規模較小,通信次數較為頻繁的數據交互,例如所述多個通用多核處理器之間控制信令的交互。
[0047]如果所述多個通用多核處理器是英特爾(Intel)公司的至強(Xeon)系列處理器,則所述高速總線是英特爾(Intel)公司的快速通道互聯(Quick Path Interconnect, QPI)技術;如果所述多個通用多核處理器是AMD公司的的羿龍(Phenom)系列處理器,則所述高速總線是AMD公司的超傳送(Hyper Transport, HT)總線。
[0048]所述多指令多數據眾核處理器106與所述外部設備總線(PCI)104相連,用于處理判斷和分支較多的計算任務。根據本實施例的一種實施方式,所述多指令多數據眾核處理器106是英特爾(Intel)公司的集成眾核(Many Integrated Core, MIC)系列眾核處理器。
[0049]所述單指令多數據眾核處理器107與所述外部設備總線(PCI)104相連,用于處理判斷和分值較少的計算任務。根據本實施例的一種實施方式,所述單指令多數據眾核處理器107是英偉達(Nvidia)公司的費爾米(Fermi)系列通用計算圖形處理器。根據本實施例的另一種實施方式,所述單指令多數據眾核處理器107是英偉達(Nvidia)公司的開普勒(Kepler)系列通用計算圖形處理器。
[0050]參見圖2,所述計算機系統的實現裝置為一種機架式服務器。所述機架式服務器包括機箱201、主板202、電源203、風扇204、硬盤205、存儲器206、通用多核處理器101、多指令多數據眾核處理器106、單指令多數據眾核處理器107及網絡接口卡108。其中,機箱201內安裝有主板202、風扇204及硬盤205。所述主板202是集成電路板,所述實現裝置的所有器件都安裝在所述主板上。所述風扇204為所述實現裝置中的各個處理器的散熱而設置。所述硬盤205是所述實現裝置的主要存儲介質。
[0051]所述主板202上安裝有電源203、共享存儲器槽位206、外部設備擴展槽207、通用多核處理器槽位208。所述電源203將連接至機箱上的交變市電通過變壓及整流變換成連接至主板202的處理器及其他設備可用的直流電源,并將變換得到的直流電源提供給連接至主板202的處理器及其他設備。
[0052]所述共享存儲器槽位206用于插接所述共享存儲器103。并且,所述共享存儲器槽位206通過存儲總線102與所述實現裝置的通用多核處理器槽位208相連接,以便所述通用多核處理器101能夠通過所述存儲總線102訪問所述共享存儲器103。
[0053]所述外部設備擴展槽207用于插接所述多指令多數據眾核處理器106及所述單指令多數據眾核處理器107。并且,所述外部設備擴展槽207與所述外部設備總線(PCI) 108相連,以便各個處理器之間通過所述外部設備總線(PCI) 108進行通信。
[0054]所述通用多核處理器槽位208用于插接所述通用多核處理器101。并且,所述通用多核處理器槽位208與所述外部設備總線(PCI) 108相連,以便各個處理器之間通過所述外部設備總線(PCI)IOS進行通信。同時,所述通用多核處理器槽位208與所述高速總線102相連,使得插接在所述通用多核處理器槽位208上的多個通用多核處理器101相互之間
可以通信。
[0055]為了進一步說明所述計算機系統在提高計算效率方面的有益效果,下面對將本實施例應用于顆粒流體系統的多尺度離散模擬的應用場景進行具體說明。
[0056]在本應用場景下,所述通用多核處理器采用英特爾(Intel)公司的至強(Xeon)系列處理器。所述通用多核處理器之間的高速通信連接采用英特爾(Intel)公司的快速通道互聯(Quick Path Interconnect, QPI)技術。所述多指令多數據眾核處理器采用英特爾(Intel)公司的集成眾核(Many Integrated Core, MIC)系列眾核處理器。所述單指令多數據眾核處理器采用英偉達(Nvidia)公司的費爾米(Fermi)系列通用計算圖形處理器。
[0057]所述計算機系統用于小規模顆粒流體系統及大規模顆粒流體系統的多尺度模擬。小規模顆粒流體系統中流體的計算一般可以由顯式算法執行。所述顯式算法具有良好的數據局部性與操作一致性,并且邏輯判斷與分支較少,更適合單指令多數據并行處理。顆粒間作用的檢查,作用處理與顆粒狀態更新雖然也具有較好的局部性,但不同顆粒的作用對象與作用計算的操作不同,并且計算中含有相當多的判斷與分支,因此更適合多指令多數據并行處理。因此,在模擬小規模顆粒流體系統時,所述通用多核處理器101執行流場全局分布的計算,其內容包括多目標優化和偏微分方程隱式數值求解等,同時負責整個計算過程的控制與調度。所述多指令多數據眾核處理器106負責顆粒或顆粒團的演化計算,內容主要是顆粒間作用的檢查、作用處理與顆粒狀態更新。所述單指令多數據眾核處理器107負責基于顯式算法的流體運動偏微分方程數值求解,其求解的分辨率一般小于顆粒或顆粒團尺寸。
[0058]在模擬大規模顆粒流體系統時,為了提高計算速度,也可以采用比顆粒或顆粒團更大的流體計算網格。此時從數值算法穩定性和效率的角度,宜采用隱式算法。所述隱式算法含有較多的數據交換和判斷操作,因而由單指令多數據處理器107負責顆粒的計算,而由多指令多數據處理器106負責流體的計算。在所述顆粒流體系統多尺度離散模擬的兩種模擬方式下,單指令多數據眾核處理器107的配置數量均應多于多指令多數據眾核處理器106,以適應相應的計算量。
[0059]對含有多個所述計算機系統的大型并行處理系統,所述模擬可采用空間分區的方式在各計算機系統間并行處理,其區域邊界上的信息通過各自的網絡接口卡108進行交換。
[0060]在所述的應用場景下,由于計算機系統根據多尺度模擬的概念根據不同計算任務的特點對不同處理器所處理的計算任務進行了分配,使得每個處理器能夠處理更適合自身處理特點的計算任務,因而提高了整個計算機系統的計算效率。
[0061]本實施例提供的面向多尺度計算的計算機系統包括多個不同的處理器及各個處理器之間進行高效通信的通信總線及共享存儲器,能夠按照不同計算任務的特點選擇適合處理所述計算任務的處理器進行任務處理,提高了計算效率;同時,所述計算機系統采用了通用的處理器芯片和總線標準,擴大了適用范圍,提高了系統的可擴展性,實現了很好的并行計算效果。[0062]盡管上文對本實用新型進行了詳細說明,但是本實用新型不限于此,本【技術領域】技術人云可以根據本實用新型的原理進行各種修改。因此,凡按照本實用新型原理所作的修改,都應當理解為落入本實用新型的保護范圍。
【權利要求】
1.一種面向多尺度計算的計算機系統,其特征在于,所述計算機系統包括: 多個通用多核處理器,用于計算過程的控制與調度; 多指令多數據眾核處理器,用于判斷和分支較多的計算任務的處理; 單指令多數據眾核處理器,用于判斷和分支較少的計算任務的處理; 網絡接口卡,用于將所述計算機系統連接至計算機網絡。
2.根據權利要求1所述的面向多尺度計算的計算機系統,其特征在于,所述多個通用多核處理器、多指令多數據眾核處理器、單指令多數據眾核處理器及多個網絡接口卡均與外部設備總線(PCI)連接,以實現多個處理器之間及處理器與所述網絡接口卡之間的通信。
3.根據權利要求1所述的面向多尺度計算的計算機系統,其特征在于,所述多個通用多核處理器均通過存儲總線與共享存儲器連接,以實現多個通用多核處理器之間的存儲共享。
4.根據權利要求1所述的面向多尺度計算的計算機系統,其特征在于,所述多個通用多核處理器之間通過高速總線相互連接,以實現多個通用多核處理器之間的通信。
5.根據權利要求1或4所述的面向多尺度計算的計算機系統,其特征在于,所述通用多核處理器采用英特爾(Intel)公司的至強(Xeon)系列處理器;所述通用多核處理器之間的高速總線采用英特爾(Intel)公司的快速通道互聯(Quick Path Interconnect, QPI)技術。
6.根據權利要求1或4所述的面向多尺度計算的計算機系統,其特征在于,所述通用多核處理器采用AMD公司的羿龍(Phenom)系列處理器;所述通用多核處理器之間的高速總線采用AMD公司的超傳送(Hyper Transport, HT)總線。
7.根據權利要求1所述的面向多尺度計算的計算機系統,其特征在于,所述多指令多數據眾核處理器采用英特爾(Intel)公司的集成眾核(Many Integrated Core, MIC)系列眾核處理器。
8.根據權利要求1所述的面向多尺度計算的計算機系統,其特征在于,所述單指令多數據眾核處理器采用英偉達(Nvidia)公司的費爾米(Fermi)系列通用計算圖形處理器。
9.根據權利要求1所述的面向多尺度計算的計算機系統,其特征在于,所述單指令多數據眾核處理器采用英偉達(Nvidia)公司的開普勒(Ifepler)系列通用計算圖形處理器。
10.根據權利要求1所述的面向多尺度計算的計算機系統,其特征在于,所述網絡接口卡采用以太網卡或無限帶寬(InfiniBand)接口卡。
【文檔編號】G06F15/167GK203465722SQ201320106696
【公開日】2014年3月5日 申請日期:2013年3月8日 優先權日:2013年3月8日
【發明者】葛蔚, 李博, 李靜海 申請人:中國科學院過程工程研究所