上世紀80年代,第一代容錯技術就開始進入商用領域。美國Stratus(容錯公司)在Stratus獨特的硬件級容錯技術及VOS專有操作系統(tǒng)環(huán)境下,采用了Motorola M68000處理器。
1993年,Intel I860處理器在Stratus的硬件級容錯體系結構中成功應用,在軟件環(huán)境方面,還能滿足業(yè)界對開放性要求的Unix操作系統(tǒng)FTX,即AT&T UNIX SVR4。
1996年,容錯技術得到HP的支持,共同推出Stratus Continuum系列,將Stratus容錯結構結合HP PA-RISC對稱多處理技術。
進入21世紀以來,制造、中小企業(yè)、能源、交通等領域對服務器,特別是中低端IA服務器的需求激增,過去僅僅可以應用在RISC平臺、HP-UX環(huán)境下的容錯產品也面臨著新的挑戰(zhàn)。另一方面,企業(yè)越來越依賴信息系統(tǒng)來完成關鍵業(yè)務的應用,同時他們不可能配備更多的專業(yè)人員來進行專職維護。雙機熱備、集群服務器遇到難題。
NEC通過與美國容錯公司多年的合作,于2001年推出了業(yè)界第一臺基于IA架構、支持Microsoft Win-dows Server 2000標準操作系統(tǒng)環(huán)境的容錯服務器。NEC的Express5800/ft系列在Windows及Linux平臺上的可靠性達到了99.999%,這種實時保護技術來源于STRATUS連續(xù)處理技術(Fundamentals of Continuous Pro-cessing Design),它包括:
1、LOCKSTEP 技術
LOCKSTEP技術使用相同的、冗余的硬件組件在同一時間內處理相同的指令。LOCKSTEP技術可以保持多個CPU、內存精確的同步,在正確的相同時鐘周期內執(zhí)行相同的指令。該技術保證能夠發(fā)現(xiàn)任何錯誤,即使短暫的錯誤,系統(tǒng)也能在不間斷處理和不損失數據的情況下恢復正常運行。
2、安全故障(FAILSAFE)軟件
FAILSAFE 軟件和LOCKSTEP技術運行一樣,可防止很多軟件錯誤和儲運耗損。該軟件在Windows 2000/2003環(huán)境下采用熱插拔、內存鏡像、負載均衡、多點終止失效、多通道I/O等方式,大大增強了系統(tǒng)連續(xù)運行的穩(wěn)定性。 FAILSAFE可以管理和診斷特征捕獲,分析和通報服務器的軟件問題,從而允許個人在軟件發(fā)生錯誤之前去糾正錯誤。
FAILSAFE軟件的下列功能增強了NEC Express5800/ft系統(tǒng)在Windows環(huán)境中的可靠性:保護短暫的硬件故障;通過增強的驅動程序預防軟件失效;軟件問題的捕獲、分析及修正;內存數據的連續(xù)性維持;豐富的糾錯功能可以解決各種不同的錯誤。為了避免物理撞擊等意外故障,安全故障軟件還提供了自動重啟功能,能夠將宕機前CPU與內存數據即時保存下來,最大限度地避免數據的意外丟失。
3、激活服務(ACTIVE SERVICE )
當然,假如容錯服務器的硬件發(fā)生永久性故障,盡管系統(tǒng)能夠正常運行,也必須及時更換硬件才能維持容錯的冗余架構。容錯服務器都配備了簡易直觀的圖形界面來管理監(jiān)測工具,(如NECExpress5800/ft提供了ESMPRO 管理軟件),能夠對服務器中硬件運行及故障狀態(tài)進行適時監(jiān)控。
容錯技術的應用已經開始從過去的證券、電信等領域進入基礎行業(yè),如制造、能源、物流、交通及有著 7×24 不間斷運營需求的中小商業(yè)團體和政府。NEC為迎合互聯(lián)網的高速增長,為容錯服務器引入了最新的穩(wěn)定、安全、可升級、功能強大的Linux版本。 容錯的未來將會向更高的可用性、更卓越的可維護性發(fā)展。調查顯示,越來越多的用戶開始注重TCO(總擁有成本)而不是初期購買價格,更多的企業(yè)決定逐步放棄采用雙機熱備的方式來維護復雜的集群服務器,轉而將目光瞄向具有容錯技術的平臺或容錯服務器平臺。
新聞熱點
疑難解答
圖片精選