摘 要: 云計算大規(guī)模服務器涉及的資源非常豐富,數據量巨大,對其中的故障進行診斷需要大量的科學計算,當前的故障診斷平臺通過對故障信息特征的提取實現對服務器故障的診斷,效率極低。因此,設計一種新的云計算大規(guī)模服務器故障診斷平臺,給出平臺的總體結構,詳細分析了主控芯片、電源電路、復位電路、無線通信模塊和故障診斷模塊,共同實現云計算大規(guī)模服務器的故障診斷。軟件設計中,介紹了故障診斷平臺的診斷流程,給出了詳細實現過程的代碼。用戶通過系統的身份驗證后,通過平臺對服務器進行故障診斷,直至故障排除為止。實驗結果表明,采用所設計平臺對云計算大規(guī)模服務器故障進行診斷,不僅診斷成功率高,而且所需時間較短。
關鍵詞: 云計算; 大規(guī)模服務器; 故障診斷; 軟件設計
中圖分類號: TN911?34; TP302.8 文獻標識碼: A 文章編號: 1004?373X(2016)18?0052?05
Abstract: The current fault diagnosis platform has low efficiency, because its diagnosis for server failure is realized by means of the extraction of fault information characteristics. Therefore, a new fault diagnosis platform for cloud computing large?scale servers was designed. In this paper, the general structure of the platform is described, the main control chip, power supply circuit, reset circuit, wireless communication module and fault diagnosis module are analyzed in detail, the diagnosis process of the fault diagnosis platform is introduced, and the code of the implementation process is given. The users can make the fault diagnosis of their servers by means of the platform after passing through the authentication of the system. The experimental results show that the platform has high success rate and needs shorter time for fault diagnosis of cloud computing large?scale server.
Keywords: cloud computing; large?scale server; fault diagnosis; software design
隨著計算機和互聯網的逐漸發(fā)展,云計算大規(guī)模服務器作為處理大數據的有效平臺,被廣泛地應用于各個領域[1?2]。服務器所處理的業(yè)務均較為關鍵,出現數據丟失或異常停機均將造成嚴重后果,人們對服務器的安全性和可靠性提出了很高的要求[3?4]。而這些安全性要求必須通過設計故障診斷平臺實現,因此,設計一個合理的云計算大規(guī)模服務器故障診斷平臺勢在必行,已經受到專家學者的廣泛關注,并取得了一定的進展 [5?6]。
1 云計算大規(guī)模服務器故障診斷平臺的設計
1.1 故障診斷平臺總體設計
云計算大規(guī)模服務器故障診斷平臺將嵌入式處理器看作是主控單元,協同電源電路、復位電路、無線通信模塊和故障診斷模塊實現服務器的故障診斷,詳細結構如圖1所示。
1.2 主控芯片設計
綜合分析整個云計算大規(guī)模服務器故障診斷平臺的設計要求和成本等因素,將意法半導體集團生產的ARM Cortex?M3內核微處理器STM32F103VCT6作為主控芯片。STM32F103VCT6芯片為32位嵌入式微處理器,計算性能高、計算速度快,并且外設配置豐富,能實現良好的通信與控制功能,其詳細結構如圖2所示。
STM32F103VCT6芯片存在一顆運算性能高的核心,能夠提供高達64 KB的大容量SRAM 。STM32F103VCT6芯片的串行通信接口很豐富,采用130個I/O端口實現CPU與外部設備、存儲器的連接和數據交換,將得到的外部設備信息通過2個集成電路總線發(fā)送至處理中心,利用控制器局部網絡總線傳輸至控制器中進行處理,器件間的信息交換主要通過4個通用同步/異步串行接收/發(fā)送器實現。通過上述豐富的接口設計不僅能夠有效地實現故障診斷模塊信息通信的要求,還可依據實際情況與平臺中的其他模塊聯合使用,使服務性能更加優(yōu)越。
1.3 電源電路設計
針對診斷平臺的蓄電池有很多規(guī)格,本文采用最適用于故障診斷平臺的8 V蓄電池。STM32F103主控芯片的運行電壓在2.3~3.5 V范圍內,無線通信芯片的運行電壓在3.4~4.5 V范圍內,因此需將蓄電池的8 V電壓轉化成主控芯片和無線通信芯片的運行電壓。本節(jié)電源電路的設計方案是將8 V電壓分別轉換成滿足主控芯片正常運行的3 V電壓和滿足無線通信芯片正常運行的4 V電壓。首先采用LM2596電壓轉化芯片將8 V電壓轉換成4 V電壓,電路圖如圖3所示。
圖3中,B340是肖特基整流二極管,其功能是對電路進行整流,利用旁路電容和去耦電容運行的基本原理,對云計算大規(guī)模服務器輸入信號與輸出信號中的高頻噪聲產生的干擾進行過濾。在此基礎上通過穩(wěn)壓三極管進行降壓,并利用B340進行整流后,在VCC端輸出所需求的4 V電壓。然后采用AMS1117_3.3電壓轉化芯片將8 V電壓轉換成3 V電壓,為主控芯片提供工作電壓。AMS1117_3.3電壓轉化芯片為高效線性穩(wěn)壓器,能夠穩(wěn)定輸出3 V電壓。8 V電壓轉換成3 V電壓的電路圖如圖4所示。
1.4 復位電路設計
為了保證云計算大規(guī)模服務器故障診斷平臺電路的穩(wěn)定可靠,需設計一種復位電路進行上電復位。只有在VCC端輸出在正常范圍內的情況下,復位信號才會撤除,平臺開始正常工作。本節(jié)采用STM32F103VCT6芯片作為復位芯片,該芯片是低電平復位,復位電路和主控芯片NRST硬件相連,復位電路圖如圖5所示。
如圖5所示,當復位電路斷開,NRST引腳和3.3 V工作電壓相連,這時處于髙電平狀態(tài),按下復位鍵,將復位電路接通,NRST引腳將和地線連接在一起,轉換成低電平,STM32F103VCT6芯片復位。
1.5 無線通信模塊電路設計
所設計診斷平臺的通信芯片選用SIMCom公司生產的SIM900芯片,實現和主控芯片之間的通信,電路設計如圖6所示。
圖6中,SIM900芯片通過TXD,RXD引腳實現和STM32F103VCT6芯片之間的信息交換,引腳連接形式為主控芯片的 TXD 引腳連接 SIM900 芯片的RXD引腳,主控芯片的RXD引腳和通信芯片的TXD引腳相連,主控芯片和通信芯片之間共地,通過上述連接即可實現SIM900芯片與主控芯片之間的通信。
1.6 故障診斷芯片
平臺選用ELM327芯片作為云計算大規(guī)模服務器故障診斷芯片,其設計電路如圖7所示。圖7中,依據各種故障診斷通信協議的物理層需求,在ELM327芯片外圍設置通信接口電路,從而符合故障診斷通信協議。通過CAN控制器把故障診斷信息按照協議要求,轉換成CAN協議標準數據幀格式完成傳輸,故障診斷信息是通過芯片中的軟件程序獲取的,詳細情況將在第2節(jié)進行分析。而傳輸過程是通過CAN收發(fā)器實現的。
2 故障診斷平臺軟件設計
2.1 故障診斷主流程設計
云計算大規(guī)模服務器故障診斷平臺的診斷流程如圖8所示。
3 實驗結果分析
為了驗證本文設計平臺的有效性,需要進行相關的實驗分析。實驗將ANN平臺作為對比,在Matlab 7.0環(huán)境下進行。主要針對服務器中服務停止、服務暫停和進程異常三種故障進行診斷,三種故障類型的注入次數和注入成功數量如表1所示。
分別采用本文平臺和ANN平臺對上述三種云計算大規(guī)模服務器故障進行診斷,得到的診斷準確率比較結果如表2所示。
分析表2可以看出,采用本文平臺對云計算大規(guī)模服務器的三種故障進行診斷,不管是針對服務停止,服務暫停還是針對進程異常的故障,得到結果的診斷準確率一直高于ANN平臺,說明本文平臺具有很高的診斷精度。在上述實驗的基礎上,對本文平臺和ANN平臺進行一次故障診斷所需的時間進行比較,得到的結果如圖9所示。
從圖9可以看出,采用本文平臺進行故障診斷,所需的時間明顯低于ANN平臺,同時本文平臺的運行時間曲線更加平穩(wěn),說明本文平臺不僅效率高,而且穩(wěn)定性較強。
4 結 論
本文設計了一種新的云計算大規(guī)模服務器故障診斷平臺,給出了平臺的總體結構,詳細分析了主控芯片、電源電路、復位電路、無線通信模塊和故障診斷模塊,共同實現云計算大規(guī)模服務器的故障診斷。軟件設計中,介紹了故障診斷平臺的診斷流程,用戶通過系統的身份驗證后,通過平臺對服務器進行故障診斷,直至故障排除為止,給出了詳細實現過程的代碼。實驗結果表明,采用所設計平臺對云計算大規(guī)模服務器故障進行診斷,不僅診斷成功率高,而且所需時間較短。
參考文獻
[1] 趙雪琴,付媛媛.云計算環(huán)境下大規(guī)模Web服務故障診斷技術研究[J].計算機測量與控制,2014,22(9):2760?2762.
[2] 李金徽.云計算對于電力電氣設備故障診斷和檢修的作用[J].電子技術與軟件工程,2015(4):189.
[3] 邱昕,甘超,江雄心,等.基于云計算環(huán)境下Apriori算法的設備故障診斷技術研究[J].組合機床與自動化加工技術,2014(4):45?48.
[4] 安海濤.多媒體云計算下的大規(guī)模數據流調度方法研究[J].現代電子技術,2015,38(20):154?157.
[5] 張亞中,余正紅.基于Windows Azure云計算的輿情監(jiān)控系統服務器模塊設計與實現[J].軟件導刊,2014(7):69?71.
[6] 李貴兵,金煒東,蔣鵬,等.面向大規(guī)模監(jiān)測數據的高鐵故障診斷技術研究[J].系統仿真學報,2014,26(10):2458?2464.
[7] 楊艷燕.云計算中基于相似性圖的故障自動診斷方法[J].計算機測量與控制,2014,22(12):3877?3880.
[8] 傅仁軒,石安委.物聯網遠程監(jiān)控故障診斷系統的設計與應用[J].移動通信,2014(2):80?84.
[9] 張自賓,孔凡勝,王竹林.模擬電路故障診斷方法設計及虛擬維修過程[J].電子設計工程,2015(1):30?32.
[10] 張黎黎.基于云計算的高??蒲袡n案管理模式探析[J].物聯網技術,2015,5(12):75?77.