您的位置:首頁>手機>正文

容錯伺服器 技術行業加速創新利器

容錯伺服器技術來自美國矽谷,屬於創新的高新技術,該技術上世紀八十年代誕生,在美國、歐洲、日本、亞太地區都有著龐大的用戶群。從銀行到製造業、資訊產業等諸多領域都在使用容錯伺服器來支撐其龐大的工作負載。這幾年,隨著“中國製造2025”、“工業4.0”的創新要求,容錯伺服器技術被引進國內,成為推動越來越多的行業創新快速發展的利器。下面重點從技術的角度介紹容錯伺服器技術,幫助企業、研發機構、技術愛好者等群體更好了認識容錯伺服器技術的發展趨勢。

容錯伺服器的定義

容錯伺服器是基於容錯技術的原理,採用硬體全冗餘技術,在兩套硬體之間通過獨立晶片和軟體保證故障時零時間切換的伺服器。簡單的說就是在伺服器系統中出現資料或檔丟失及損壞時,自動回復到損壞前的正常狀態,確保伺服器正常使用,用以體現伺服器對錯誤的容納能力

容錯伺服器的基本原理

容錯電腦系統(fault-tolerant computer system)包括大量的硬體措施和軟體措施,還包括電源元件,電源元件可以提供不間斷的不被打斷的環境。包容錯誤程式的電腦使用特殊軟體的慣常程式和自我檢查的邏輯程式,將其設計為電路的一部分,用來檢查硬體問題,並可以自動轉換成後備設施。在不涉及電腦系統的情況下,電腦的一些部分可以進行移除,也可以進行修理。

容錯伺服器功能的基礎是建立在時鐘同步(lockstep)技術上的體系架構,採用即使在故障出現也可保證連續處理的冗餘部件來消除單點故障。許多“強壯的”伺服器提供冗餘的電源供給、風扇和磁片,然而只有容錯伺服器可以提供對核心系統元件,包括主機板、處理器、記憶體、I/O匯流排和I/O適配器的保護。

Lockstep技術可以保持多CPU/記憶體單元在精確的同步狀態——同一時鐘週期執行相同的指令。Lockstep能夠確保包括暫態錯誤在內的任何錯誤都不會影響到系統運行,系統可以在任何CPU/記憶體單元發生錯誤的情況下不丟失資料或狀態,也不需產生中斷進行錯誤處理。

(圖)容錯伺服器技術

容錯I/O系統物理上與CPU-Memory系統分離。硬體邏輯,以定制的晶片組形式,作為CPU和I/O間的PCI橋接,同時提供核心錯誤偵測、故障隔離、以及時鐘同步結構的同步邏輯。CPU/Memory子系統中的定制邏輯包含主要的PCI介面、中斷控制功能,和交易排序邏輯。I/O子系統中的定制邏輯包含表決邏輯、次級PCI介面,以及錯誤寄存器。定制的晶片組使用被動匯流排連接伺服器中冗餘的CPU和I/O模組。

容錯伺服器的I/O以雙份的I/O匯流排、冗餘的I/O適配器,和冗餘的設備組成。所有關鍵PCI適配器是冗餘的:SCSI、SATA、乙太網、遠端系統管理,和光通道。內部SCSI和SATA磁片存儲和擴展光通道存儲為鏡像的(RAID 1),通過兩條獨立的存儲I匯流排連接。外部光通道硬體RAID陣列的連接也是冗餘,可保證完全容錯的操作。對任何邏輯I/O操作,包括內部和外部存儲操作,都是多路經可行的。任何I/O操作故障將引發選擇另一條路徑作操作重試,確保I/O操作的成功完成。

容錯伺服器的發展歷史

上世紀80年代,第一代容錯技術就開始進入商用領域。美國Stratus(容錯公司)在Stratus獨特的硬體級容錯技術及VOS專有作業系統環境下,採用了Motorola M68000處理器。

1993年,英特爾I860處理器在Stratus的硬體級容錯體系結構中成功應用,在軟體環境方面,還能滿足業界對開放性要求的Unix作業系統FTX,即AT&T UNIX SVR4。

1996年,容錯技術得到HP的支援,共同推出Stratus Continuum系列,將Stratus容錯結構結合HP PA-RISC對稱多處理技術。

進入21世紀以來,製造、中小企業、能源、交通等領域對伺服器,特別是中低端IA伺服器的需求激增,過去僅僅可以應用在RISC平臺、HP-UX環境下的容錯產品也面臨著新的挑戰。另一方面,企業越來越依賴資訊系統來完成關鍵業務的應用,同時他們不可能配備更多的專業人員來進行專職維護。雙機熱備、集群伺服器遇到難題。

如今,很多硬體製造商,通過與美國容錯公司多年的合作,大量推出了基於IA架構、支持Microsoft Windows Server 和Linux的容錯伺服器,而這種即時保護技術正是來源於STRATUS的鎖步(lockstep)專利技術。

容錯伺服器的發展趨勢

容錯技術的應用已經開始從過去的證券、電信等領域進入基礎行業,如製造、能源、物流、交通及有著"7×24"不間斷運營需求的中小商業團體和政府。為迎合互聯網的高速增長,為容錯伺服器引入了最新的穩定、安全、可升級、功能強大的Linux版本。

容錯的未來將會向更高的可用性、更卓越的可維護性發展。調查顯示,越來越多的使用者開始注重TCO(擁有權總成本)而不是初期購買價格,更多的企業決定逐步放棄採用雙機熱備的方式來維護複雜的集群伺服器,轉而將目光瞄向具有容錯技術的平臺或容錯伺服器平臺。

在中國市場,容錯伺服器的鼻祖美國容錯技術有限公司(Stratus)與上海海得控制系統股份有限公司(HiTE)的合作在一定程度上彌補了容錯伺服器在中國市場服務拓展領域的短板。這將引發國內各領域的容錯技術與應用的井噴式發展。

容錯伺服器的先天優勢

容錯伺服器之所以擁有6個9的可靠性能,在於它的雙硬體系統結構,簡而言之就是容錯伺服器擁有2台獨立的硬體系統,每台獨立的硬體相當於一台伺服器。但不同的是,兩台獨立的硬體受一套時鐘鎖步系統控制,在相同的運算速度內同時執行同一條指令。

再通過容錯系統特有的ASIC故障檢測系統對CPU、記憶體、晶片組、硬碟、I/O等不見得處理結果進行比對,相同則執行下一步,不相同則重新計算。當其中任何部件出現硬體故障時,系統失去容錯能力,降低為一套硬體系統的可靠性,更換後,系統恢復容錯能力。

這就是容錯伺服器穩定性的核心所在,但由於是2台硬體系統,高昂的價格成為了阻礙容錯伺服器在國內市場發展的重要因素之一。但通過在中國市場20年的摸爬滾打,餘秀琍表示開放的平臺降低了總體的硬體成本,現在的容錯伺服器已經不再是封閉的系統,而是可以運行Windows、Linux、VMware的硬體平臺。

容錯伺服器與雙機伺服器集群的互補之道

一種是硬體的方式一種是軟體的方式,可能在過去的時間裡,這兩種方式一直處於平行的狀態,但在今天這個發展迅速,複雜多變的市場裡,一成不變不是一個明智的做法。Stratus就給出了一個順應時代的做法,將硬體與軟體相結合。07年Stratus開始於VMware合作,將VMware軟體的HA與Stratus硬體HA相結合,通過虛擬化來調配所有東西。在雲計算上,憑藉VMware在虛擬化軟體上的優勢結合Stratus硬體上的穩定,為私有雲用戶提供了一個更加穩定,可靠的平臺。呂祁峰最後也表示“這幾年VMware的市場越來越大,我們應當順應潮流,小機的應用會越來越少,因為它的造價成本提高,維護成本提高,這已經不是今天的主流。就像手機Android系統的佔有率越來越高,因為開放,所以人才會接受。”

喜欢就按个赞吧!!!
点击关闭提示