張元龍+廖曉群
摘要:隨著高校私有云平臺的建設,實現(xiàn)IT資源的大整合、統(tǒng)一管理和按需分配,云平臺的運維至關重要,大量的應用系統(tǒng)相繼上線,傳統(tǒng)的運維模式無法滿足云平臺的運維要求,如何解決云平臺運維面臨的挑戰(zhàn)。根據(jù)高校私有云平臺建設架構和云平臺運維特點,構建一個智能化、規(guī)范化、標準化的云平臺運維模式。
關鍵詞:私有云;運維管理;安全
中圖分類號:TP315 文獻標識碼:A 文章編號:1007-9416(2017)05-0252-01
隨著私有云平臺在高校的落地,各類信息化應用系統(tǒng)大量上線。各種問題接踵而至,一方面來自云平臺的運維,另一方面來自云平臺的管理。如何有效的對云平臺進行運維管理,是目前面對的巨大挑戰(zhàn),也是信息化建設快速、穩(wěn)步發(fā)展的保證。本文主要介紹了云平臺的架構以及云平臺運維的特點,構建云平臺的運維管理模式,以保證云平臺安全、穩(wěn)定的運行。
1 云平臺架構
目前,高校的私有云大都是IAAS云平臺,即基礎設施即服務。云平臺是基礎設施的集合,包括服務器、存儲設備、網(wǎng)絡設備以及其他設施,其最重要的特點是按需分配,以服務的方式交付計算、存儲和網(wǎng)絡的基礎設施服務。
云平臺技術已經(jīng)相當成熟,一般云平臺架構包括物理資源層、虛擬化層、云服務層、用戶四部分。其中物理資源層包括服務器、存儲、網(wǎng)絡設備以及其他設備。虛擬化層包括計算虛擬化、網(wǎng)絡虛擬化、存儲虛擬化。云服務層包括云管系統(tǒng)和自助服務門戶。
從云平臺的架構可以看到,云平臺囊括了除機房設施外的所有硬件設備,可見相當復雜。隨著云平臺的落地,建設初期階段結束,云平臺的大量工作重點轉(zhuǎn)移到后期運維,可見運維管理的重要性。
2 云平臺運維管理的特點
云平臺包括基本的硬件設備,操作系統(tǒng)、中間件、應用軟件軟件資源,同時具備對云平臺內(nèi)的虛擬資源和物理資源的實時監(jiān)控。由此可以看出云平臺運維的特點主要體現(xiàn)在資源按需分配、資源集中管理和資源監(jiān)控統(tǒng)計上。
2.1 資源按需分配
云平臺服務器、存儲、網(wǎng)絡設備集中且規(guī)模大、密度高、擴展靈活快速以及高可靠性。云平臺將軟硬件資源以服務的方式提供給用戶,用戶按需使用。按需分配主要體現(xiàn)著云主機的彈性擴展以及靈活的資源分配上,最主要的是計算和存儲。按需分配的優(yōu)點在于用戶不需要對IT資源的計算能力、存儲能力、網(wǎng)絡能力的大小以及后續(xù)系統(tǒng)升級帶來的升級服務進行考慮,用戶只僅需要按需申請就可以了,極大的加快應用系統(tǒng)的上線、升級。
2.2 資源集中管理
云平臺的資源集中管理體現(xiàn)在所有的軟硬件資源通過云平臺,依托校園網(wǎng)為用戶提供服務。資源包括網(wǎng)絡資源IP的分配、計算資源、存儲資源以及軟件資源,將軟硬件資源以虛擬機的形式提供給用戶使用,由云管理平臺協(xié)調(diào)完成。云管理平臺管理物理資源、虛擬資源、軟件資源以及其他高級服務功能。集中管理最重要的是確保各資源之間的協(xié)調(diào),例如,如果一臺物理服務器宕機之后,業(yè)務遷移后是否能保證其他資源能夠承擔這臺宕機的服務器應用。集中管理中需要確保資源的預留,計算資源按照一個計算節(jié)點資源的虛擬資源進行預留,存儲資源按照每個卷的百分之30進行預留,一旦資源超過了預留值,資源的擴展就需要考慮了。
2.3 資源監(jiān)控統(tǒng)計
云平臺的資源監(jiān)控包括虛擬機的各項指標的實時監(jiān)控、云平臺監(jiān)控以及服務狀態(tài)監(jiān)控,虛擬機的監(jiān)控包括CPU、內(nèi)存、存儲以及網(wǎng)絡使用率。資源監(jiān)控主要有三方面:一是云平臺中虛擬機的性能狀況,二是物理資源(計算和存儲)的使用狀況,三是各個性能指標的異常情況。資源的統(tǒng)計包含CPU、內(nèi)存、存儲、網(wǎng)絡等一段時間的平均值、最大值、最小值,軟件的使用狀況,以及其他相關統(tǒng)計。通過資源的監(jiān)控統(tǒng)計,對云平臺的后期擴容以及資源的規(guī)劃,對云平臺的潛在故障的提前發(fā)現(xiàn)以及提前修復,同時對故障進行報警都非常重要。
3 云平臺運維管理模式
云平臺是一套復雜的、規(guī)模龐大的IT資源提供中心,為保證平臺穩(wěn)定、安全、高效的運行,其運維管理應具備規(guī)范化、安全性、自動化的特點。目前的私有云運維方式的流程為:私有云的運維管理人員管理所有軟硬件資源,應用運維人員通過互聯(lián)網(wǎng)VPN撥號鏈接到校內(nèi)網(wǎng)內(nèi),通過遠程連接進行運維管理,業(yè)務管理人員在校內(nèi)同樣通過遠程連接進行應用系統(tǒng)的管理。
3.1 規(guī)范性
有序的管理如此龐大的資源,必須要有一套操作規(guī)范,包括云平臺管理人員操作規(guī)范和云平臺用戶操作規(guī)范。云平臺的運維參與者有用戶、應用維護人員、云平臺運維管理人員,如何有效的實現(xiàn)對IT資源的運維管理,規(guī)范化是必要的。云平臺上的資源大,應用程序多,云平臺一旦故障,直接會導致全校的信息化應用系統(tǒng)的癱瘓,影響正常的教學、科研、管理工作。大多數(shù)的故障都是人為操作引起的,因此云平臺的操作規(guī)范性是必須的,結合權限管理,能夠有效的避免因操作人員的操作失誤導致的業(yè)務中斷。
3.2 安全性
安全對信息化來說是非常重要的,也是一個國家戰(zhàn)略。作為信息化平臺的運維來說,安全也是至關重要的。云平臺的安全體現(xiàn)著云平臺本身,操作系統(tǒng),應用系統(tǒng)等幾個方面。云平臺本身的安全由廠家定期巡檢,操作系統(tǒng)的安全依靠漏掃平臺確保安全,應用系統(tǒng)安全依靠云殺毒軟件部署在每個云主機來保證安全。其他的包括出口防火墻以及云平臺的七層軟防火墻的設置,對特定的端口進行開放,預防網(wǎng)絡蠕蟲、DDOS攻擊等。
3.3 自動化
信息化建設的不斷深入,云平臺的資源規(guī)模的擴大,云平臺運維管理的難度、復雜度、工作了日益增加,傳統(tǒng)的人工運維管理不能滿足當前發(fā)展要求。云平臺的運維包括日常巡檢、模板維護、故障處理等工作。日常巡檢工作每天對平臺進行健康巡檢和資源的性能指標的異常巡檢,為提高工作效率,可以對日常巡檢工作編寫成腳本文件定期執(zhí)行任務,提取有效信息進行查看,提高了系統(tǒng)日常維護工作效率。如果是簡單故障,將按照提前寫入系統(tǒng)的處理流程腳本,進行處理,并將故障日志信息進行留存,以便后期進行查看,分析原因。云平臺的運維自動化是實現(xiàn)運維智能化的基礎。
4 結語
云平臺已經(jīng)成為技術主流,各種應用系統(tǒng)都遷移到云上,云平臺安全、穩(wěn)定、高效運行的保障是云平臺運維管理體系的建立,是保證信息化建設、教學、科研工作正常進行的支撐。在后續(xù)的工作中,結合實際情況,構建一套完善的運維管理體系,實現(xiàn)云平臺的運維管理智能化、規(guī)范化、標準化是必然要求。
參考文獻
[1]薛新民.云平臺機房特點及運維管理研究[J].信息技術與標準化,2015,(06)66-69.
[2]張艷輝.云平臺運維管理探析[J].信息技術與標準化,2014,(11)64-67.
[3]張四海,張萬光.高校IT運維服務面臨的挑戰(zhàn)與機遇[J].中山大學學報(自然科學版),2009,(S1):235-237.
[4]劉偉.基于Vmware虛擬化的云平臺運維研究[J].數(shù)字技術與應用,2015,(12)124.
[5]潘曉霞,周亮彪.私有云IT運維管理平臺研究[J].科技資訊,2015,(12):3.endprint