集群計算
出自 MBA智库百科(https://wiki.mbalib.com/)
集群計算(Cluster Computing)
目錄 |
集群計算指的是電腦集群將一組鬆散集成的電腦軟體或硬體連接起來高度緊密地協作完成計算工作。在某種意義上,他們可以被看作是一臺電腦。集群系統中的單個電腦通常稱為節點,通常通過區域網連接,但也有其它的可能連接方式。集群電腦通常用來改進單個電腦的計算速度和/或可靠性。一般情況下集群電腦比單個電腦,比如工作站或超級電腦性價比要高得多。
根據組成集群系統的電腦之間體繫結構是否相同,集群可分為同構與異構兩種。集群電腦按功能和結構可以分為,高可用性集群(High-availability (HA) clusters)、負載均衡集群(Loadbalancing clusters)、高性能計算集群(High-performance (HPC)clusters)、網格計算(Grid computing)。
高可用性集群,一般是指當集群中有某個節點失效的情況下,其上的任務會自動轉移到其他正常的節點上。還指可以將集群中的某節點進行離線維護再上線,該過程並不影響整個集群的運行。
負載均衡集群,負載均衡集群運行時,一般通過一個或者多個前端負載均衡器,將工作負載分發到後端的一組伺服器上,從而達到整個系統的高性能和高可用性。這樣的電腦集群有時也被稱為伺服器群(Server Farm)。一般高可用性集群和負載均衡集群會使用類似的技術,或同時具有高可用性與負載均衡的特點。Linux虛擬伺服器(LVS)項目在Linux操作系統上提供了最常用的負載均衡軟體。
高性能計算集群,高性能計算集群採用將計算任務分配到集群的不同計算節點兒提高計算能力,因而主要應用在科學計算領域。比較流行的HPC採用Linux操作系統和其它一些免費軟體來完成並行運算。這一集群配置通常被稱為Beowulf集群。這類集群通常運行特定的程式以發揮HPC cluster的並行能力。這類程式一般應用特定的運行庫, 比如專為科學計算設計的MPI庫。HPC集群特別適合於在計算中各計算節點之間發生大量數據通訊的計算作業,比如一個節點的中間結果或影響到其它節點計算結果的情況。
(1)網格與傳統集群的主要差別是網格是連接一組相關並不信任的電腦,它的運作更像一個計算公共設施而不是一個獨立的電腦。網格通常比集群支持更多不同類型的電腦集合。
(2)網格本質上就是動態的,集群包含的處理器和資源的數量通常都是靜態的。在網格上,資源則可以動態出現,資源可以根據需要添加到網格中或從網格中刪除。
(3)網格天生就是在本地網、城域網或廣域網上進行分佈的。網格可以分佈在任何地方。而集群物理上都包含在一個位置的相同地方,通常只是區域網互連。集群互連技 術可以產生非常低的網路延時,如果集群距離很遠,這可能會導致產生很多問題。物理臨近和網路延時限制了集群地域分佈的能力,而網格由於動態特性,可以提供 很好的高可擴展性。
(4)集群僅僅通過增加伺服器滿足增長的需求。然而,集群的伺服器數量、以及由此導致的集群性能是有限的:互連網絡容量。也就是說如果一味地想通過擴大規模來提高集群電腦的性能,它的性價比會相應下降,這意味著我們不可能無限制地擴大集群的規模。 而網格虛擬出空前的超級電腦,不受規模的限制,成為下一代Internet的發展方向。
(5)集群和網格計算是相互補充的。很多網格都在自己管理的資源中採用了集群。實際上,網格用戶可能並不清楚他的工作負載是在一個遠程的集群上執行的。儘管網格與集群之間存在很多區別,但是這些區別使它們構成了一個非常重要的關係,因為集群在網格中總有一席之地—— 特定的問題通常都需要一些緊耦合的處理器來解決。然而,隨著網路功能和帶寬的發展,以前採用集群計算很難解決的問題現在可以使用網格計算技術解決了。理解網格固有的可擴展性和集群提供的緊耦合互連機制所帶來的性能優勢之間的平衡是非常重要的。