張興彤 黃 勝
(四川啟明星鋁業(yè)有限責任公司,四川 眉山 620041)
四川啟明星鋁業(yè)有限責任公司在2002年新建廠時,為了提高整個生產(chǎn)控制系統(tǒng)的穩(wěn)定性和存儲數(shù)據(jù)的安全性,在焙燒車間的焙燒火焰控制系統(tǒng)、煅燒車間的煅燒及余熱發(fā)電DCS系統(tǒng)、供電車間的供電綜合自動化系統(tǒng)中均采用雙機熱備技術(shù)。系統(tǒng)還配備了以態(tài)網(wǎng)模塊和工業(yè)交換機,用戶可以通過光纜與其他崗位進行通信。由于完善的設計,使得整個系統(tǒng)的穩(wěn)定性、安全性得到保障。自投產(chǎn)以來,系統(tǒng)工作狀態(tài)非常穩(wěn)定,有力地保障了生產(chǎn)。雙機熱備技術(shù)從廣義上講就是使用兩臺服務器對重要的服務互相備份,共同執(zhí)行同一服務,當一臺服務器出現(xiàn)故障時,可以由另一臺服務器承擔服務任務,從而在不需要人工干預的情況下確保系統(tǒng)能持續(xù)提供服務。
雙機熱備份技術(shù)是一種軟硬件相結(jié)合的具有較高容錯能力的解決方案。根據(jù)兩臺服務器的工作方式,在雙機備份方案中可以有三種不同的工作模式,即雙機熱備模式、雙機互備模式和雙機雙工模式。
①雙機熱備模式即目前通常所說的active/standby方式,active服務器處于工作狀態(tài),而standby服務器處于監(jiān)控準備狀態(tài)。當active服務器出現(xiàn)故障時,standby服務器通過軟件偵測或手工方式將standby機器激活,從而保證應用在短時間內(nèi)完全恢復正常使用。
②雙機互備模式是指兩臺設備之間互相備份,彼此獨立工作,完成不同的數(shù)據(jù)類型傳輸(如設備甲傳輸A類業(yè)務數(shù)據(jù),設備乙傳輸B類業(yè)務數(shù)據(jù)),當其中某一臺設備發(fā)生故障時,另一臺設備在完成自己傳輸工作的同時,接替另一臺設備的傳輸工作,達到備份的目的。但此模式對服務器的性能要求比較高,服務器配置相對較好。
③雙機雙工模式是目前Cluster(集群)的一種形式,兩臺服務器均為活動狀態(tài),同時運行相同的應用,保證整體的性能,也實現(xiàn)了負載均衡和互為備份[1-2]。
雙機熱備有兩種實現(xiàn)模式,一種是基于共享的存儲設備的方式;另一種是沒有共享的存儲設備的方式,一般稱為純軟件方式。基于存儲共享的雙機熱備是雙機熱備的最佳方案。這種方式采用兩臺(或多臺)服務器,使用共享的存儲設備(磁盤陣列柜或存儲區(qū)域網(wǎng)SAN)。兩臺服務器可以采用熱備(主從)、互備和雙工(并行)等不同的方式。在工作過程中,兩臺服務器將以一個虛擬的IP地址對外提供服務,并按照工作方式的不同將服務請求發(fā)送給其中一臺服務器承擔。同時,服務器通過心跳線(目前往往采用建立私有網(wǎng)絡的方式)偵測另一臺服務器的工作狀況。當一臺服務器出現(xiàn)故障時,另一臺服務器根據(jù)心跳偵測的情況作出判斷并進行切換,接管服務。對于用戶而言,這一過程是全自動的,它能在很短的時間內(nèi)完成,因而不會對業(yè)務造成影響。由于使用共享的存儲設備,因此兩臺服務器使用的是相同的數(shù)據(jù),由雙機或集群軟件對其進行管理[3-4]。
2.1.1 控制系統(tǒng)介紹
2002年,經(jīng)多方論證,四川啟明星鋁業(yè)公司在建設25萬t電解鋁工程項目時決定在煅燒工藝控制中采用分散集中式控制系統(tǒng)DCS控制技術(shù)。DCS控制系統(tǒng)是隨著現(xiàn)代大型工業(yè)生產(chǎn)自動化的不斷興起和過程控制要求的日益復雜應運而生的綜合控制系統(tǒng)。它集計算機技術(shù)、系統(tǒng)控制技術(shù)、網(wǎng)絡通信技術(shù)和多媒體技術(shù)于一體,可提供窗口友好的人機界面和強大的通信功能,是完成過程控制、過程管理的現(xiàn)代化設備。它的應用對鋁用碳素煅燒工藝來說,無疑是一個重大的突破。目前,除廣元啟明星鋁業(yè)煅燒車間余熱發(fā)電部分采用了DCS之外,其他鋁廠的煅燒工藝基本上采用局部PLC控制或原始的電氣控制。其系統(tǒng)硬件結(jié)構(gòu)如圖1所示,PLX即為Process Logix。
圖1 Process Logix系統(tǒng)硬件結(jié)構(gòu)Fig.1 Hardware structure of Process Logix system
2.1.2 控制系統(tǒng)工作原理
四川啟明星鋁業(yè)有限責任公司控制煅燒工藝的DCS采用的是美國Rockwell的Process Logix R510系統(tǒng)。為保證控制系統(tǒng)的穩(wěn)定可靠運行,四川啟明星鋁業(yè)有限責任公司在方案中采用雙機熱備技術(shù),兩臺服務器的工作模式為active/standby模式:兩臺Dell服務器(即圖1中的PLX服務器A和PLX服務器B)互為主備狀態(tài),先啟動的服務器默認為主服務器,后啟動的服務器為備用服務器,當兩臺服務器啟動后,需要在Process Logix R510系統(tǒng)軟件中進行數(shù)據(jù)同步,通過數(shù)據(jù)同步過程,保證主備服務器數(shù)據(jù)的一致性。假如PLX服務器A為主服務器,PLX服務器B為備用服務器,當PLX服務器A出現(xiàn)故障時,PLX服務器B自動切換為主服務器,接替PLX服務器A的所有工作,工作站也相應自動切換,并與PLX服務器B進行數(shù)據(jù)交換;當PLX服務器A恢復正常啟動后,PLX服務器B通過數(shù)據(jù)同步過程成為備用服務器。整個系統(tǒng)基于數(shù)據(jù)復制的方式同步完成,保證主備服務器的數(shù)據(jù)一致性。
2.2.1 控制系統(tǒng)的組成
焙燒車間的陽極焙燒過程就是粘結(jié)劑-瀝青炭化變成焦炭的熱處理過程,焙燒陽極的質(zhì)量受諸多因素的影響,如焙燒工藝、原料組成、混捏均勻度和振動成型過程等一系列工藝過程。而在焙燒的生產(chǎn)過程中,由于其他因素的不可控性,計算最優(yōu)焙燒溫度、調(diào)節(jié)焙燒過程中溫度場和焙燒陽極揮發(fā)份的濃度含量等參數(shù)就成為提高陽極炭塊質(zhì)量的關(guān)鍵。為保證陽極焙燒質(zhì)量,四川啟明星鋁業(yè)有限責任公司引進瑞士RD公司的焙燒爐過程控制系統(tǒng)(bake furnace process control system,BPS)燃燒控制系統(tǒng),在填充料的保護下采用天然氣作為燃料,按照既定的焙燒曲線進行高溫熱處理,使瀝青轉(zhuǎn)化成瀝青焦,從而形成具有較高導電性和強度的陽極熟塊,再按一定速度冷卻后出爐,從而有效地提高了陽極焙燒質(zhì)量。
焙燒火焰控制系統(tǒng)硬件結(jié)構(gòu)如圖2所示。
圖2 焙燒火焰控制系統(tǒng)硬件結(jié)構(gòu)Fig.2 Hardware structure of the roasting fire control system
2.2.2 控制系統(tǒng)工作原理
焙燒爐過程控制系統(tǒng)(BPS)采用雙機雙工模式,實現(xiàn)模式是基于共享的存儲設備的方式。整個系統(tǒng)由兩臺HP高端服務器、一臺磁盤陣列柜和磁盤陣列卡構(gòu)成雙機備份模式,兩臺服務器互為備份,當一臺服務器出現(xiàn)問題停機時,另一臺服務器能實時接管中斷的工作,保證業(yè)務系統(tǒng)的正常運行。操作系統(tǒng)和應用程序安裝在兩臺服務器的本地系統(tǒng)盤上,整個網(wǎng)絡系統(tǒng)的數(shù)據(jù)通過磁盤陣列進行集中管理和數(shù)據(jù)備份。數(shù)據(jù)集中管理是通過雙機熱備份系統(tǒng),將所有站點的數(shù)據(jù)直接從中央存儲設備讀取和存儲,并由專業(yè)人員進行管理,極大地保護了數(shù)據(jù)的安全性和保密性。用戶的數(shù)據(jù)存放在外接共享磁盤陣列中,當一臺服務器出現(xiàn)故障時,備機主動代替主機工作,保證網(wǎng)絡服務不間斷。
磁盤柜磁盤具有熱插拔功能,故可以靈活組成RAID 5模式,當一塊硬盤發(fā)生損壞時,數(shù)據(jù)可以恢復,保證數(shù)據(jù)不丟失。由于采用了雙機容錯的集群結(jié)構(gòu),系統(tǒng)具有極高的可靠性。兩臺服務器可以作為一個整體為網(wǎng)絡提供服務,且相互間互為監(jiān)控。集群具有一定的負載平衡功能,可將一個任務的多個進程分攤到兩臺服務上運行,提高系統(tǒng)的整體性能。當一臺服務器發(fā)生故障時,其所運行的進程及服務可以自動地由另一臺服務器接管,保證客戶端的工作不受影響。同時,如果系統(tǒng)采用RAID技術(shù)對數(shù)據(jù)進行保護,可確保重要數(shù)據(jù)不因系統(tǒng)故障而造成損失。
BPS燃燒控制系統(tǒng)采用基于共享的存儲設備的實現(xiàn)方式,數(shù)據(jù)庫放在共享的磁盤柜磁盤上。當一臺服務器提供服務時,服務器直接在磁盤柜磁盤上進行讀寫;而當系統(tǒng)切換后,另一臺服務器也同樣讀取該磁盤柜磁盤上的數(shù)據(jù)。它可以在無人值守的情況下提供快速的切換,保證不會發(fā)生數(shù)據(jù)丟失現(xiàn)象。
2.3.1 供電系統(tǒng)的作用
電解鋁廠對供電系統(tǒng)的可靠性要求非常高,且電能占生產(chǎn)成本的30%以上。高可靠性的綜合自動化系統(tǒng)項目的實施,加強了整個變電整流系列的保護和監(jiān)控,提高了電解槽的電解效率,降低了企業(yè)的生產(chǎn)成本,增強了企業(yè)的競爭力。四川啟明星鋁業(yè)有限責任公司供電車間采用PecStar 2電力綜合自動化監(jiān)控組態(tài)軟件,同時,為了保證系統(tǒng)穩(wěn)定可靠,供電綜合自動化系統(tǒng)采用Active/standby架構(gòu)。
2.3.2 供電系統(tǒng)工作原理
PecStar 2對服務器提供完善的雙機熱備方案,在硬件層、通道層、網(wǎng)絡層提供PecStar 2多重冗余保護。每一個監(jiān)控站配置兩臺監(jiān)控機,雙機一主一備,互為熱備,網(wǎng)絡均采用雙纜冗余方式。在主機正常退出的情況下,備機立即轉(zhuǎn)為主用;而在主機異常關(guān)機或死機的情況下,備機3 s后轉(zhuǎn)為主機;主機重新啟動后,備機可于10 s后將主用權(quán)再交回原來的主機,從而保證系統(tǒng)在監(jiān)控機由于硬件或軟件發(fā)生異常時可在線切換,提高系統(tǒng)的可靠性。
兩臺主備監(jiān)控機各自有不同的通道,用于與硬件進行通信,當主用機上的通道發(fā)生故障不能正常通信時,可切換到備機上進行通信;當主用通道恢復正常后,再切換到主用通道。通道的冗余技術(shù)解決了現(xiàn)場因環(huán)境或老化等原因造成通道故障,影響正常運行的問題。
在硬件層,除采用具有雙通道口的監(jiān)控和保護設備可靠性以外,PecStar 2還支持雙網(wǎng)卡的網(wǎng)絡硬件冗余方案。PecStar 2的上位機監(jiān)控網(wǎng)絡采用TCP/IP進行通信,監(jiān)控廠站和后臺機上都可以安裝雙網(wǎng)卡,組成雙重計算機網(wǎng)絡。當計算機上的某一個網(wǎng)卡出現(xiàn)故障或網(wǎng)線某處發(fā)生故障時,監(jiān)控系統(tǒng)可自動無縫切換到另一個網(wǎng)絡進行通信。這對于供電需要高可靠或者在網(wǎng)絡環(huán)境比較惡劣時的系統(tǒng)運行非常有利。
在雙機熱備情況下,從機處于熱備狀態(tài)且自動與主機中的數(shù)據(jù)庫通信,而在本機成為主機時自動切換到與本機數(shù)據(jù)庫通信,從機客戶端與其他客戶端一樣能夠?qū)?shù)據(jù)進行操作。
供電綜合自動化雙機熱備系統(tǒng)可聯(lián)機多個客戶端。當顯示的是客戶端時,連接監(jiān)控設備的電腦就成為與控制設備通信的主機;當客戶端請求顯示數(shù)據(jù)時,系統(tǒng)就會從主機中請求數(shù)據(jù)并在本機上處理;當面臨系統(tǒng)故障問題時,用冗余備用機替代有故障的主機,客戶端要求的數(shù)據(jù)就可以通過備用機進行處理,而備用服務器只有在通信中斷時,才會對主服務器進行取代。當主服務器恢復功能后,就會從備服務器中讀取數(shù)據(jù)以自動回填,而備用服務器再次恢復到其以前的角色[5-7]。
2.3.3 生產(chǎn)中雙機熱備的優(yōu)點
生產(chǎn)中雙機熱備具有以下優(yōu)點。
①高可用性:兩臺服務器的互相切換不會干擾系統(tǒng)應用運行,無需修改應用,當系統(tǒng)出現(xiàn)故障時,系統(tǒng)能夠自動檢測應用或服務器故障,可將應用在備用服務器上快速重新啟動,并在短時間內(nèi)(如1~30 s內(nèi))恢復運行,從而有效確保生產(chǎn)過程的穩(wěn)定性和連續(xù)性。
②數(shù)據(jù)安全性:應用數(shù)據(jù)存儲在兩個服務器硬盤中,相當于對數(shù)據(jù)進行雙層保護,確保生產(chǎn)數(shù)據(jù)的準確性。
③開放的應用系統(tǒng)保護機制:這種機制便于用戶針對自己的應用提供保護,將較為重要的數(shù)據(jù)存儲于雙機熱備系統(tǒng)中。
④高性能:服務器現(xiàn)均采用高可靠性部件,同時提供了多種冗余組件,這就大大提高了單臺服務器的穩(wěn)定性和安全性。
⑤高穩(wěn)定性和安全性:控制系統(tǒng)為冗余的雙通信通道,控制系統(tǒng)間通信網(wǎng)絡采用TCP/IP協(xié)議,網(wǎng)絡均采用雙纜冗余方式,冗余的雙CPU設計,運行時一主一備。
⑥便捷安全的熱備切換方式:用戶可以手動熱備切換,也可以通過人機界面或編程器切換;在電源失效、CPU失效、I/O失效(電纜或模板)、NOM失效(只在啟動時)時將完成CPU的自動切換,確保生產(chǎn)設備連續(xù)工作[5-7]。
從四川啟明星鋁業(yè)公司運行雙機熱備系統(tǒng)的實踐證明,當一臺服務器出現(xiàn)故障時,該服務器上的工作能以最快的速度切換至備用服務器上運行,保證了數(shù)據(jù)和控制的連續(xù)性。本公司在工業(yè)控制系統(tǒng)中使用雙機熱備技術(shù)取得了很好的效果,雙機熱備系統(tǒng)的應用和存儲運行穩(wěn)定正常,完全達到了企業(yè)預期的效果,解決了企業(yè)所擔心的數(shù)據(jù)丟失問題。該系統(tǒng)安全可靠、性能優(yōu)異、實用性強,易于在各行業(yè)廣泛地推廣應用。
[1]姜堅華.雙機熱備系統(tǒng)的技術(shù)研究和具體實現(xiàn)[J].微型電腦應用,2004,20(3):7-10.
[2]李彥青.雙機熱備典型應用[EB/OL].[2006-11-01].http://www.realinfo.com.cn/tec/tech19.htm.
[3]呂輝,李進,劉曙.防空指揮自動化系統(tǒng)軟件工程[M].西安:西北大學出版社,2007.
[4]斯桃枝,李戰(zhàn)國.計算機網(wǎng)絡系統(tǒng)集成[M].北京:北京大學出版社,2006.
[5]王曜.視頻點播[M].北京:北京郵電大學出版社,2002.
[6]孫建華.網(wǎng)絡安全應用技術(shù)[M].北京:北京郵電大學出版社,2007.
[7]代海英.雙機熱備系統(tǒng)的應用[EB/OL].[2010-03-30].http://book.51cto.com/art/201003/191756.htm.