孔昭煜,齊釩宇,賈麗瓊,高學正,蘇志強,李海龍
(1.中國地質調查局發(fā)展研究中心,北京 100037;2.全國地質資料館,北京 100037)
在物聯(lián)網(wǎng)、大數(shù)據(jù)、云計算等新興信息技術不斷發(fā)展的當下,地質調查工作從傳統(tǒng)工作方式已向全業(yè)務信息化轉變。同時,在20世紀90年代后隨著信息化技術的普及和在地質調查行業(yè)中的推廣和應用,其產(chǎn)生的地質調查成果數(shù)據(jù)爆發(fā)式增長。這些地質調查成果數(shù)據(jù)不僅具有資料、檔案和科研價值,還具有重復開展、成本投入高和人力投入大等特點,同時開展這些地質調查工作的經(jīng)費,絕大多數(shù)為國家財政投入的經(jīng)費,根據(jù)要求須向國家、相關行業(yè)和社會公眾提供基礎地質調查成果數(shù)據(jù)社會化服務[1-2]。
全國地質資料館依據(jù)國務院頒布的《地質資料管理條例》中有關要求,對已接收的地質調查成果進行社會化服務。近年來隨著信息技術的發(fā)展,原有的到館服務存在著諸如服務效率低、利用率低等問題,制約了社會公眾對地質調查成果的開發(fā)和利用。因此,建設數(shù)字地質資料館是地質資料工作在新時代的轉型,也是在新時代下推動地質資料工作全面信息化轉變的契機。數(shù)字地質資料館平臺實現(xiàn)了為社會公眾提供即時、有效、專業(yè)、準確和權威的地質調查成果數(shù)據(jù)服務,同時有效地提高了地質調查成果數(shù)據(jù)的利用率和信息產(chǎn)品服務質量[3]。
全國地質資料館匯聚了多種應用平臺的核心功能,開展并完成了數(shù)字地質資料館建設。同時為保障數(shù)字地質資料館平臺高效穩(wěn)定運行,通過現(xiàn)有技術和軟件產(chǎn)品,參照ITIL國際標準,對智能運維體系進行了探索。本文通過對數(shù)字地質資料館智能運維體系研究和實踐的經(jīng)驗進行總結,以相關國內外標準為依據(jù),利用成熟的商業(yè)軟件平臺,結合實際業(yè)務需求,以最低的成本投入,構建數(shù)字地質資料館平臺智能運維體系,并提出完整有效的指導建議,切實帶動和提高地質資料信息化建設管理支撐能力[3-4]。
從數(shù)字地質資料館平臺來看,智慧運維體系是根據(jù)需求提供規(guī)范的信息系統(tǒng)服務平臺,對與數(shù)字資料館平臺相關的各項信息系統(tǒng)進行系統(tǒng)地組織、計劃、監(jiān)控、管理和維護,是綜合信息系統(tǒng)平臺運行維護管理工作的總稱。智慧運維體系是數(shù)字資料館各平臺的生命周期的最后環(huán)節(jié),是展現(xiàn)系統(tǒng)建設所取得的經(jīng)濟價值中最重要的環(huán)節(jié),也是存在時間最長的階段。在該階段智慧運維體系主要依托數(shù)字地質資料館平臺交付的基礎設施軟件、硬件環(huán)境,開展規(guī)范、科學的運維管理,保障數(shù)字地質資料館的安全、高效、穩(wěn)定的可持續(xù)服務,滿足地質資料數(shù)據(jù)通過社會化服務展現(xiàn)經(jīng)濟價值。智慧運維體系的核心目標就是規(guī)范的利用好、管理好已投入使用的數(shù)字地質資料館平臺,其建設過程中需要遵循的原則主要包括規(guī)范性、合理性、先進性和經(jīng)濟性四個方面[5]。
1) 規(guī)范性。智慧運維管理過程中須嚴格遵守相關法律、法規(guī)、國家標準、行業(yè)標準和技術規(guī)范等。在進行運維管理體系的總體架構設計與執(zhí)行過程中,須依據(jù)有關文件的要求進行架構設計,在執(zhí)行全部過程中須嚴格依據(jù)標準進行操作,同時建立規(guī)范化的操作記錄機制,通過開展智慧運維體系規(guī)范的管理體系建設,實現(xiàn)智慧運維體系達到國際一流水平。
2) 合理性。智慧運維管理的核心目標是保障數(shù)字地質資料館平臺的各功能組件的運行能力,在滿足安全、穩(wěn)定運行的基礎上,達到系統(tǒng)平臺設計的既定運行能力。在智慧運維管理過程中需精準的掌握相關系統(tǒng)平臺的功能模塊,熟悉該功能模塊的運行能力,結合其特點合理的規(guī)范設計各功能組件的性能監(jiān)控指標,主動的進行性能監(jiān)控和分析,最大程度保障數(shù)字地質資料館各平臺的安全、穩(wěn)定、高效運行。
3) 先進性。智慧運維體系需要高效便捷的對數(shù)字資料館各平臺開展運行監(jiān)控和維護工作,從技術層面需要利用最新的成熟技術開展運維管理和監(jiān)控,從管理層面需要參考國際ITIL標準和有關國家標準執(zhí)行。以先進技術和先進管理理念,建設完備的監(jiān)控、管理和服務的流程,實現(xiàn)高效、精準、便捷的運維管理工作。
4) 經(jīng)濟性。智慧運維體系作為輔助管理平臺,在其建設時期需要嚴格制定預期效果和人力、財力、物力的投入目標,同時作為數(shù)字地質資料館的建設管理的延續(xù),需要建立穩(wěn)定的運行維護工作經(jīng)費保障機制。在建設過程中所需設施選型須遵循成熟穩(wěn)定產(chǎn)品優(yōu)選選擇,避免單獨開發(fā),有效減少建設經(jīng)費的投入。同時,在規(guī)范的運維記錄數(shù)據(jù)分析下,進一步合理規(guī)劃設施增加和更新所需的經(jīng)費投入,從而更加合理的進行數(shù)字地質資料館建設與運維費用的分攤,實現(xiàn)成本與使用管理相對平衡[3]。
數(shù)字地質資料館平臺在建設過程中,投入了大量的人力和物力,同時開展并完成了大規(guī)模的IT基礎設施軟、硬件環(huán)境建設。利用這些基礎設施有效的保障了地質調查成果資料的社會化服務,切實為國家經(jīng)濟建設和科研學術研究提供了專業(yè)、權威、真實、精準的地學信息服務產(chǎn)品。通過開展智慧運維體系探索和實踐,利用現(xiàn)有的技術手段進行自動化的基礎環(huán)境運行性能、IT基礎設施運行狀態(tài)和各系統(tǒng)平臺服務的運行狀態(tài)監(jiān)控,開展監(jiān)控和運行數(shù)據(jù)自動采集,實現(xiàn)對數(shù)字地質資料館各平臺的運行進行全方位監(jiān)控,為其升級、更新和改造提供精準的基礎運行數(shù)據(jù)支撐,同時自動報警和自動修復實現(xiàn)對IT基礎設施進行全方位保障。
通過開展數(shù)字地質資料館智慧運維體系的探索和實踐,在利用成熟的監(jiān)控軟件對基礎硬件、基礎軟件、服務支撐系統(tǒng)平臺等不同層級的運維管理,所采集的數(shù)據(jù)對軟件、硬件廠商在地質資料行業(yè)研發(fā)過程中,根據(jù)其特點開展具有一定針對性的改進、完善和優(yōu)化。在運維過程中產(chǎn)生的標準和規(guī)范,有助于行業(yè)內相關單位開展類似建設工作時提供一定的參考和借鑒,同時也培養(yǎng)和帶動了地質資料信息化建設隊伍的能力建設,有效推動從業(yè)人員的實際工作經(jīng)驗積累和技術儲備[5-7]。
物理環(huán)境實時監(jiān)測是智能運維體系中對基礎物理環(huán)境進行運行監(jiān)控,主要為保障數(shù)字地質資料館各平臺所使用的全部IT基礎設施的正常運行,利用信息技術重點開展空間、電力資源、環(huán)境溫度和消防等基礎環(huán)境資源的監(jiān)控。這部分設備需要納入到智慧運維管理體系之中。由于傳統(tǒng)數(shù)運維體系主要依靠人工,進行基礎環(huán)境中的風火水電人工巡檢和監(jiān)控,因此為提升整體基礎環(huán)境運維能力,特建立智能自動巡檢、監(jiān)控架構實現(xiàn)自動化運維監(jiān)控,提高基礎設施環(huán)境整體的運維能力。物理環(huán)境實施監(jiān)控部分的主要監(jiān)控內容如下:供電系統(tǒng)運維、空調系統(tǒng)運維、安防系統(tǒng)運維和消防系統(tǒng)運維[7-8]。
IT基礎設施運行性能監(jiān)控系統(tǒng),一方面可以對基礎支撐的服務器及其應用系統(tǒng)進行實時監(jiān)控,另一方面也可以為系統(tǒng)管理人員提供完善的監(jiān)測和報警平臺。據(jù)相關要求服務器及其應用能7×24 h持續(xù)正常、穩(wěn)定的運行,根據(jù)客戶需求的不同,提供5×8 h、7×12 h的分級服務。IT基礎設施運維體系主要涵蓋兩類三方面,兩類即硬件類和軟件類;三方面即基礎底層硬件運行方面、基礎系統(tǒng)運行方面和應用系統(tǒng)運行方面[2-3]。
網(wǎng)絡環(huán)境作為數(shù)字地質資料館各平臺重要的基礎設施資源,在運維管理過程中需制定相關流程予以控制。網(wǎng)絡環(huán)境運維建設主要包括以下內容:網(wǎng)絡拓撲結構運維、網(wǎng)絡的訪問管理、網(wǎng)絡系統(tǒng)日常維護流程、維護網(wǎng)絡IP地址表和網(wǎng)絡系統(tǒng)巡檢[3]。
數(shù)字地質資料館核心的組成部分之一就是存儲系統(tǒng),核心數(shù)據(jù)和服務數(shù)據(jù)是數(shù)字地質資料館的核心內容,因此存儲子系統(tǒng)的運行壓力尤為重要。存儲系統(tǒng)和備份系統(tǒng)運維的主要對象是物理環(huán)境、供電和線路、硬件設備維護等方面。
存儲系統(tǒng)維護包括:供電巡檢、設備巡檢、定期查看存儲系統(tǒng)和存儲系統(tǒng)用戶信息維護等[8,10]。
備份系統(tǒng)運維包括:空白介質與有數(shù)據(jù)介質保存方式的規(guī)定、應制定統(tǒng)一的介質編號、建立介質管理員制度、數(shù)據(jù)介質控制、定期對帶庫設備進行除塵處理等[8-11]。
安全智能管控的運維對象是系統(tǒng)與數(shù)據(jù),系統(tǒng)主要包括操作系統(tǒng)、數(shù)據(jù)庫、中間件、應用程序等系統(tǒng)資源;數(shù)據(jù)包括核心數(shù)據(jù)、配置文件、日志等各類數(shù)據(jù)資源。這類管理對象雖然不像傳統(tǒng)管理對象那樣“看得見、摸得著”,但卻是IT服務的邏輯載體。安全智能管控運維體系主要分成2個方面進行。其中,系統(tǒng)安全管理主要由安全監(jiān)測、安全防護和安全審計組成,結合運維管理平臺實現(xiàn)將技術、流程和人三者有機結合;防病安全管理主要包括防病毒軟件運維管理和病毒資訊告知機制[11-13]。
數(shù)字地質資料館平臺智慧運維體系探索與實踐,是地質資料信息化工作者的長期面臨的運行壓力和重點工作之一,同時也是為建設國家地質資料數(shù)據(jù)中心奠定準確權威的建設規(guī)劃參考依據(jù)。在新時代下新興的信息技術不斷更新和發(fā)展,在此基礎上開發(fā)了各類的應用系統(tǒng)和平臺,實現(xiàn)即時、全面、準確、高效的為社會公眾提供準確、權威的地學信息服務產(chǎn)品。這不僅滿足了科研使用,也是重要的國家基礎數(shù)據(jù)資源。因此,地質資料信息化工作需要面臨的不僅僅是如何更高效、安全、穩(wěn)定可信的提供社會化服務所需的業(yè)務平臺,更重要的是如何通過信息技術運行和維護好已投入使用的各類服務業(yè)務系統(tǒng)平臺。既要滿足服務業(yè)務平臺安全、穩(wěn)定、高效的同時,更需要保障其性能始終達到高效、安全和穩(wěn)定,同時能夠為更新系統(tǒng)平臺提供必要的基礎運行數(shù)據(jù)支撐。通過智能運維體系的探索和實踐不斷的開展運行和完善,切實保障現(xiàn)有業(yè)務平臺運行安全穩(wěn)定可靠的基礎上,積累豐富的運行維護經(jīng)驗和系統(tǒng)架構規(guī)劃基礎理論數(shù)據(jù),為地質資料信息化長遠發(fā)展奠定必備的基礎運行數(shù)據(jù)積累,更精準的開展相關規(guī)劃和建設[13-14]。
在智慧運維體系探索與實踐的過程中,完善和規(guī)范了地質資料信息化的運行維護操作規(guī)程,對基礎環(huán)境、IT基礎設施、網(wǎng)絡環(huán)境、存儲備份體系和安全管控體系等工作積累了豐富的實際運行維護經(jīng)驗,也是對軟件、硬件廠商提供了真實準確的運行數(shù)據(jù)收集,便于精準的對現(xiàn)有系統(tǒng)和硬件設備升級和完善。智慧運維體系是數(shù)字地質資料館運行的重要基本保障工作,也是地質資料信息化工作者的核心職責之一,更是依法對全民所有的基礎地質信息數(shù)據(jù)接收、保管、服務等工作的重要技術保障[12-16]。