亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        “東數(shù)西算”趨勢下的氣象算力網絡和算力服務體系架構

        2022-10-27 14:52:40楊昕沈文海
        關鍵詞:資源服務能力

        楊昕,沈文海

        國家氣象信息中心,北京 100081

        引言

        全國一體化大數(shù)據(jù)中心體系總體布局設計的完成,對于信息系統(tǒng)的設計實現(xiàn)及其所支撐的業(yè)務都具有重要意義。通過這種體系結構,社會經濟、人力、基礎設施等資源進一步整合與集約化,為充分發(fā)揮資源利用效率奠定了理論基礎,而“東數(shù)西算”的策略,把效率提升和綠色節(jié)能有機結合,將資源利用水平推向了新的高度。[1]

        氣象業(yè)務是高度信息化和特性化的業(yè)務。在氣象業(yè)務體系中存在一部分和其他行業(yè)類似的業(yè)務模式,但也具有非常鮮明的個性化的業(yè)務特性,與其他行業(yè)相比有明顯的差異。例如處于核心地位的數(shù)值預報業(yè)務,需要極強的高性能算力支持,屬于典型的“極限計算”應用[2],在常規(guī)行業(yè)中很難找到可復用的需求和解決方案;而氣象數(shù)據(jù)在種類、使用方式的高度復雜性、應用時效等方面的個性化特征,以及其體積的巨大,使得氣象大數(shù)據(jù)與氣象高性能計算資源之間至今無法實現(xiàn)物理空間上的遠距離分離?!皷|數(shù)西算”的資源布局趨勢,對氣象業(yè)務信息系統(tǒng)在設計實現(xiàn)和發(fā)展演進中提出了巨大的挑戰(zhàn),而氣象行業(yè)及其業(yè)務自身的特殊性,使得氣象部門對其業(yè)務及科研強烈依賴的算力、存儲、通信等基礎資源及其個性化的服務有著特殊的需求。

        1 算力資源概述

        1.1 算力體系結構

        “算力體系結構”是指“算力網絡和服務”的體系結構,并簡稱為“算力架構”。而這里所說的“算力網絡和服務”也可簡稱為算力資源,它至少包含運算、存儲、網絡傳輸以及向用戶提供前三者優(yōu)質服務等四部分能力,是目前云計算、大數(shù)據(jù)時代信息系統(tǒng)的基礎資源能力。

        “算力體系結構”的核心組件包括基礎設施、管理和業(yè)務應用三個層面?;A設施層面包括數(shù)據(jù)中心(包括計算中心)、高性能寬帶網(跨城市、跨區(qū)域)等;管理層面主要是基礎設施及IT 資源控制與調度;業(yè)務應用層面包含應用研發(fā)、部署、運行、優(yōu)化改進與迭代等全生命周期管理。

        1.2 “算力體系結構”的關鍵特性

        依筆者觀點,“算力體系結構”可包含以下關鍵特性。

        1.2.1 服務驅動

        數(shù)據(jù)中心內部除硬件設施外,其它各層次組件均應以服務的形式提供和使用,包括基礎資源的使用、分配和管理。被廣泛應用的服務模型框架有“IaaS”(Infrastructure as a service)、“PaaS”(Platform as a Service)、“SaaS”(Software as a Service)等[3],然而在當今的云生態(tài)中,“Service”的層次類型眾多,它們一起構成了應用運行生存的軟件環(huán)境。充分利用這些服務應該是業(yè)務應用及管理過程中獲取并使用算力資源的主要方式。

        1.2.2 異構化

        任何數(shù)據(jù)中心節(jié)點中都會運行數(shù)量龐大且類型各異的應用服務,同構化的平臺雖然在管理上相對簡單,但面對業(yè)務應用的復雜性和差異性,其總體效率通常很難達到應有水平。因此,針對性地構建異構資源及平臺服務是數(shù)據(jù)中心建設的一個基本原則。異構化管理的核心任務是根據(jù)需求恰當匹配支撐技術、精準構建對應的資源和服務、平衡控制利用資源,促進總體效率達到最優(yōu)。

        1.2.3 自動化和流水線式機制

        新型算力架構在“服務生態(tài)”的支持下可以在更低的成本條件下實現(xiàn)高水平的自動化。無論是資源管控還是應用流程,各業(yè)務環(huán)節(jié)均可根據(jù)既定的配置策略自動編排,以流水線的方式緊密銜接,最大程度避免因不必要的人工手動處理而引起的實效延遲。

        1.2.4 控制調度智能化

        從“一體化大數(shù)據(jù)中心”到各數(shù)據(jù)中心節(jié)點,以至于深入到各資源管控或業(yè)務流程,都將是在智能化調度的控制范圍之內。智能化的控制調度是在人的掌控之下,系統(tǒng)能夠根據(jù)歷史積累狀態(tài)信息形成特定的認知,然后結合當前情況做出最新判斷,動態(tài)調整必要的策略,從而在后續(xù)控制調度中能夠達到全局最優(yōu)化的效果。

        1.2.5 全局一體化

        東部數(shù)據(jù)到西部進行計算和處理將必然涉及到數(shù)據(jù)在不同數(shù)據(jù)中心節(jié)點之間的通信傳輸以及計算和儲存資源的分配調度。從全局一體化的視角出發(fā),各節(jié)點間統(tǒng)一協(xié)調的資源調度有利于在多數(shù)據(jù)中心節(jié)點之間總體資源的優(yōu)化,避免數(shù)據(jù)中心之間的資源失衡和浪費。

        要實現(xiàn)全局一體化,必須把“控制調度”提升到各數(shù)據(jù)中心節(jié)點之上的高度。

        1.2.6 先進通信能力

        數(shù)據(jù)在不同數(shù)據(jù)中心節(jié)點間的流動,以及業(yè)務在數(shù)據(jù)中心節(jié)點間切換導致的信息遷移,都需要穩(wěn)定高效和高速的網絡支持。東數(shù)西算的運行模式對網絡,尤其是數(shù)據(jù)中心節(jié)點間的網絡通信能力提出更高的要求,包括網絡帶寬、網絡延遲等物理特性。但更為重要的是對網絡配置的動態(tài)靈活的管控能力,應能夠根據(jù)全網實際運行狀態(tài)和業(yè)務需求快速響應和變更,結合并融入“智能化控制調度”能力,從網絡層面賦能全局效率最優(yōu)。

        1.2.7 深度安全可控

        信息安全是數(shù)據(jù)中心和系統(tǒng)的正常運行的最基本保障。在傳統(tǒng)信息網絡安全防護能力的基礎上,“算力架構”需要進一步提升安全相關的監(jiān)督能力和自主的、自動化的防范能力,對潛在的安全風險主動預判和示警。

        1.2.8 動態(tài)可持續(xù)發(fā)展能力

        業(yè)務需求和IT 技術的革新、資源和設備的老舊和更替,以及它們所引發(fā)的應用層加速更新的要求,均為系統(tǒng)演進過程中的常態(tài)化現(xiàn)象。因此,項目模式下的相對靜態(tài)的建設和維護方式越來越不能適應當前相對動態(tài)變更的常態(tài)需求。“算力架構”中的系統(tǒng)必然應不斷加強自身的“動態(tài)可持續(xù)發(fā)展能力”,在人為控制范圍內,自主地或自動化地執(zhí)行資源及應用的更替。

        2 氣象行業(yè)的特殊性和“氣象算力架構”

        從上世紀70 年代至今,氣象行業(yè)應用電子計算機系統(tǒng)已有50 多年歷史,氣象業(yè)務長期應用并嚴重依賴信息技術,可以說氣象業(yè)務主體上就是信息業(yè)務。但信息系統(tǒng)體系結構對業(yè)務系統(tǒng)的主導和支持作用只是在近20 年左右的時間才逐步體現(xiàn)和發(fā)展的。

        2004 年“國家級氣象資料存儲檢索系統(tǒng)”的建立[4],初步確立了一個以數(shù)據(jù)存儲為核心的氣象數(shù)據(jù)綜合管理的業(yè)務架構,把數(shù)據(jù)的收集、存儲、服務等關鍵功能在國家級層面整合到一起。

        從2008 年至2014 年期間中國氣象局建立了“全國綜合氣象信息共享系統(tǒng)”(CIMISS)[5]。CIMISS不但在氣象行業(yè)內構建了一個相對完備的業(yè)務架構,包括數(shù)據(jù)收集分發(fā)、加工處理、存儲管理、共享服務、業(yè)務監(jiān)控等功能,涵蓋了除HPC 之外的全部核心業(yè)務流程,而且利用當時最為成熟的SOA 等理念建立了與業(yè)務匹配的多層次信息系統(tǒng)體系結構,形成了一個面向服務的大型分布式數(shù)據(jù)管理系統(tǒng),并且在全國范圍內從國家級到所有省級單位實現(xiàn)了核心業(yè)務系統(tǒng)架構的統(tǒng)一布局和業(yè)務應用的統(tǒng)一部署。目前氣象業(yè)務的算力架構在CIMISS 基礎上繼續(xù)發(fā)展,但架構范圍仍主要局限于單個數(shù)據(jù)中心內部。從發(fā)展的視角來看,全國氣象系統(tǒng)也必然會形成從國家級到各省級多數(shù)據(jù)中心一體化的格局,這與“東數(shù)西算”的全國一體化大數(shù)據(jù)中心體系的思路是一致的。

        “算力體系結構”在氣象行業(yè)的應用中具備一定的特殊性。首先,數(shù)值預報對算力資源有著特殊的需求,主要體現(xiàn)在大規(guī)模高密度浮點運算能力和計算節(jié)點間高性能緊耦合通信能力等方面,因此高性能計算支撐能力必不可少。第二,氣象數(shù)據(jù)資料類型復雜、種類多樣、數(shù)據(jù)收集、處理、存儲和應用等各個環(huán)節(jié)的數(shù)據(jù)量巨大、時效要求高,從而導致氣象數(shù)據(jù)資源與高性能計算資源之間的高速、高效、高可靠性等的個性化需求。第三,各類氣象業(yè)務應用,主體上具有高強度數(shù)據(jù)IO 密集型的特性,對存儲和通信資源及其支撐能力要求較為苛刻。

        高性能計算、常規(guī)計算和數(shù)據(jù)分析處理在資源和應用方式等層面雖然存在較大差異,但業(yè)務應用的流程是需要總體貫通的,在控制調度上必須以“一體化”的視角將三者緊密銜接。

        因此,“東數(shù)西算”背景下氣象部門的“算力體系結構”,主要包含“超級計算能力”、“常規(guī)通用計算能力”、“超級數(shù)據(jù)處理能力”、“超級通信傳輸能力”和“全局控制調度能力”這五個部分,可簡稱之為“超常算數(shù)通”。其核心思想是以“超級計算能力”支撐數(shù)值預報等核心氣象業(yè)務;以“常規(guī)通用計算能力”支撐氣象各單位常規(guī)型業(yè)務應用;以“超級數(shù)據(jù)處理能力”支撐大規(guī)模數(shù)據(jù)處理和存儲以及數(shù)值預報周邊的所有輔助型業(yè)務;以“超級通信傳輸能力”實現(xiàn)“東數(shù)西算”中數(shù)據(jù)在東西數(shù)據(jù)中心節(jié)點間以及數(shù)據(jù)中心內部穩(wěn)定高速流動傳輸;以“全局控制調度能力”驅動各類應用在一體化資源體系中高效運轉。

        這一體系結構縱向可分為3 層,如圖1 所示。“異構基礎資源”層由“計算”、“存儲”、“網絡”三類物理資源構成,各類型資源分別包括多種不同形式和特性的物理設備??刂普{度負責對它們在硬件層面進行分類分組管理。設備的新老更替等資源變更信息需要在本層體現(xiàn)和維護。

        圖1 氣象算力體系結構Fig.1 Meteorological computing power architecture

        “異構基礎資源”層之上是“資源管理分配”層,它對底層的異構基礎資源進行抽取和組合,構建形成應用可以使用的“物理資源池”或“虛擬化資源池”。當資源使用完畢,調度控制可根據(jù)策略回收閑置資源以備其他應用使用。容器類的計算資源通常生命周期相對最短,其回收再分配的頻度較高。

        最上層的“應用和服務”層涵蓋氣象行業(yè)內各類應用?!叭终{度控制”功能將根據(jù)不同應用的類型與特性在“異構基礎資源”層選擇恰當?shù)奈锢碣Y源,做到剛好滿足應用要求,然后組合封裝,形成一個完全滿足應用需求且資源最小化的“資源套件”,提供給應用。資源選擇、獲取和構建過程以自動化的調度分配方式為主。例如圖1 中的“HPC 集群-1”運行的應用為數(shù)值預報(NWP)并行模式,需要“CPU+GPU”的計算能力、Infiniband 通信網絡以及高吞吐能力的大容量存儲資源;而“數(shù)據(jù)-業(yè)務-2”的任務是快速處理大規(guī)模小文件,然后合并歸檔到磁帶庫中,需要高速網絡、高IOPS 的存儲和磁帶庫等設備共同支撐。

        在“全國一體化大數(shù)據(jù)中心體系”中,多數(shù)據(jù)中心之間的通信和調度控制都需要通過各數(shù)據(jù)中心節(jié)點內部的“全局控制調度”功能實現(xiàn)。為了做到全局一致性,還需要選擇并確定其中的一個“全局控制調度”作為總控??偪亟巧梢愿鶕?jù)運行狀態(tài)的變化而在不同數(shù)據(jù)中心之間切換。

        3 關鍵技術領域

        實現(xiàn)氣象“算力體系結構”構想既要充分利用和挖掘成熟技術,又要順應和兼顧前沿發(fā)展趨勢。在構建“超常算數(shù)通”這一架構的過程中,需要重點關注以下關鍵技術領域:

        3.1 資源分配技術

        計算、存儲和網絡是3 個相對永恒存在的核心基礎IT 資源。對于性能需求高的應用,通常為他們直接分配物理資源,以避免虛擬化產生的性能損耗;對于常規(guī)型業(yè)務,通常為其分配虛擬化之后的資源,以最大化應用系統(tǒng)效率。這都需要利用“IaaS”以及“PaaS”等云計算模型。

        資源的分配必須是精準的且靈活可控的。對于已分配資源實際狀態(tài)的誤判將導致系統(tǒng)內總體存在大量被占用的閑置的或“虛假繁忙”的資源,這將嚴重拉低系統(tǒng)資源總體利用效率。因此,系統(tǒng)必須具備對已分配資源全方位掌控,以及快速回收和再分配的能力。

        在氣象算力體系結構中,超級計算,即高性能計算(HPC)部分,由于其支撐的主體業(yè)務仍為耦合度較高的并行數(shù)值預報模式,屬于典型的高性能科學計算需求的業(yè)務,因此,這部分計算資源將仍以傳統(tǒng)物理計算節(jié)點方式為主進行管理和分配(如圖1 中“HPC 集群-1”),針對此類型業(yè)務的時效性、持續(xù)性和穩(wěn)定性等需求的特殊性,系統(tǒng)通常在較長時間內保持這一資源可用狀態(tài),不進行回收;而對于常規(guī)通用計算(如圖1 中“HPC 集群-2”)以及數(shù)據(jù)處理(如圖1 中“數(shù)據(jù)處理集群-2”)等其他業(yè)務,則可采用虛擬化資源的提供方式。但在應用對資源有特殊需求的情況下,還需要支持物理資源和虛擬資源相結合的方式提供資源供給。由于氣象業(yè)務環(huán)境需要物理資源和虛擬化資源同時存在,因此,基礎資源管理需要具備更為精細化和智能化的控制調度能力。

        資源分配技術將會把HPC 和常規(guī)計算這兩大類需求的應用模式作為一個整體統(tǒng)籌調度,采用自動化的方式,根據(jù)策略對計算、存儲和網絡等IT 資源進行動態(tài)創(chuàng)建、擴展或回收,其實現(xiàn)方式可參考“Infrastructure as Code”(IaC)等相關技術。計算資源的分配粒度應支持物理機、虛擬機(VM)和容器(Container);存儲資源支持至少應包括“Block”、“Object”和“File”等類型;而對于網絡資源,應能夠結合利用“Software Defined Networking”(SDN)等技術,根據(jù)不同應用或服務對網絡資源的具體需求,快速、靈活、動態(tài)地分配對應的實體或虛擬的網絡資源。

        對于多種氣象核心業(yè)務,存儲資源的應用配置方式是一個決定運行效率的關鍵因素。一方面,氣象數(shù)據(jù)總量巨大,無論是單位時間采集量,數(shù)據(jù)收集處理的量,還是存儲和服務量都已到達PB 至EB 量級;另一方面,由于氣象自身業(yè)務特性等原因,例如文件數(shù)量巨大、存儲形式復雜多樣等,都導致數(shù)據(jù)處理速度和數(shù)據(jù)服務質量面臨嚴峻挑戰(zhàn)。這些因素要求存儲資源具備“海量高性能存儲”和“高IO 服務能力”。存儲資源的分配除了在基本的“Infrastructure”層面提供必要支持服務外,還必須在其上的“Platform”層進一步提供“PaaS”的優(yōu)化服務,例如:數(shù)據(jù)庫、文件系統(tǒng)、中間件等,其中文件系統(tǒng)的能力尤為關鍵。對于IOPS 密集型業(yè)務,需要能實現(xiàn)為其分配的基礎物理資源和平臺服務兩方面都能達到高可用、高性能、低延遲的要求。

        原則上,各數(shù)據(jù)中心節(jié)點內外相關的物理資源和設備均在“IaaS”管控范圍內,這為資源的智能化、自動化管控和分配奠定基礎。雖然HPC 需求決定了其對資源使用的特殊性,不易實現(xiàn)完全的自動化管理,但其對物理資源的這類特有需求仍然可以借助于“IaaS”和“IaC”等技術而獲得更為優(yōu)化且高效率的滿足。

        數(shù)值預報的業(yè)務與科研的高性能計算應用對算力資源的“饑渴”狀態(tài)是一種出現(xiàn)頻率較高的常態(tài)現(xiàn)象。由于HPC 系統(tǒng)從采購到退役下線的生命周期較長(一般從5 年至10 年不等),在此周期的中期階段,算力資源不足的情況通常開始顯現(xiàn),而傳統(tǒng)的項目建設速度很難在短期內解決業(yè)務應用對資源需求的問題。但通過現(xiàn)代資源分配技術,一方面可以實現(xiàn)對現(xiàn)有系統(tǒng)的持續(xù)擴展,另一方面也可以利用數(shù)據(jù)中心其他算力資源臨時構建“準HPC”系統(tǒng),以滿足緊急業(yè)務需求。

        3.2 控制調度技術

        控制調度技術廣泛應用于HPC 以及常規(guī)業(yè)務應用環(huán)境中,其目的是充分發(fā)揮和利用有限資源,最大化提高應用效率。在當前的云計算時代,涌現(xiàn)出相當數(shù)量的細粒度控制調度技術框架,進一步提升了資源利用率以及應用效率。

        然而“東數(shù)西算”概念下算力與數(shù)據(jù)在物理空間上的分離,給氣象業(yè)務提出了新的挑戰(zhàn)。為此,需要在常規(guī)控制調度技術的基礎上進一步發(fā)展出一套有能力跨越多數(shù)據(jù)中心的“云際”(Inter-Cloud)控制調度框架,從而在東西數(shù)據(jù)中心節(jié)點間實現(xiàn)必要的協(xié)調和監(jiān)管,最終在“混合云”的一體化大數(shù)據(jù)中心體系中實現(xiàn)全局資源利用最優(yōu)的效果。

        控制調度借助于監(jiān)控技術,對各數(shù)據(jù)中心節(jié)點的物理資源、應用狀態(tài)、系統(tǒng)負載等擁有一個動態(tài)的全局視圖,能夠針對業(yè)務策略和目標智能選擇優(yōu)化算法,對資源或應用在多數(shù)據(jù)中心節(jié)點間進行編排和調度,從而達到全局最優(yōu)的目的。

        在全局統(tǒng)一視圖、服務生態(tài)和應用自身的配合之下,傳統(tǒng)的高可用、災難備份、異地切換等業(yè)務功能演變?yōu)橐惶兹碌膶崿F(xiàn)方式,且都將變得更為便捷和高效??刂普{度能夠區(qū)分出應用實例的屬性為業(yè)務或科研、主業(yè)務(Master)或是從業(yè)務(Slave),并以此為基礎按照既定的業(yè)務邏輯策略執(zhí)行調度。

        3.3 流式(Stream)技術

        “流”在云環(huán)境中普遍存在,主要包括事件流和數(shù)據(jù)流這兩種形式,流式技術目前是自動化調度和業(yè)務高效運轉的核心支撐組件?!皷|數(shù)西算”下的氣象業(yè)務,將原始數(shù)據(jù)從東部數(shù)據(jù)中心推送至西部算力中心,并將數(shù)據(jù)計算和處理結果從西部返回到東部。流式技術能以高效的方式實現(xiàn)數(shù)據(jù)信息往來傳輸,在應用層面降低組件之間銜接或相互調用產生的延遲,保障數(shù)據(jù)通信的時效性和傳輸效率。在計算中心內部,流式技術同樣可用于支持數(shù)值預報的HPC 系統(tǒng)和周邊數(shù)據(jù)處理系統(tǒng)之間的高效通信與平滑銜接。

        和流式技術相對的是“批處理”(Batch Processing),即某項任務必須等待一定條件或等待數(shù)據(jù)積累到一定程度或數(shù)量才開始對這一批數(shù)據(jù)整體集中處理。這種方式雖然通常可以獲得較高的吞吐率,但也可能會產生不同程度的延遲,從而降低時效性。多項任務往往通過隊列調度機制進行管理。

        目前氣象數(shù)值預報的高性能計算業(yè)務采用的是典型的批處理為主的工作方式,但這是其業(yè)務自身內在機制導致的結果。恰當利用流式技術的配合,可以在HPC 應用中減少數(shù)據(jù)前、后處理的延遲時間,減少或消除不必要的等待,提高業(yè)務全流程的總體運行效率。尤其對于像“精細化天氣預報”這類對時效性要求較高的業(yè)務來說,流式技術將比常規(guī)傳統(tǒng)方法更具優(yōu)勢。例如:0-4h 時效的臨近預報,需要快速融入最新觀測資料進行分鐘級滾動更新[6],通過流式數(shù)據(jù)傳輸,可實現(xiàn)幾乎完全實時的持續(xù)觀測數(shù)據(jù)供給,而不再有定時傳輸方式必然會產生的傳輸間斷。

        3.4 應用研發(fā)技術

        云時代對業(yè)務應用研發(fā)、運維、更新等全生命周期運作機制的影響是深遠的。新興技術方法對傳統(tǒng)軟件工程思想造成了直接的沖擊,但同時也把軟件工程推向了一個全新的視野,使我們可以采用“Cloud Native”[7-8]、“DevOps”[9]等新理念重新考慮應用研發(fā)及系統(tǒng)全生命周期管理的新方式?!皷|數(shù)西算”意味著應用和數(shù)據(jù)都從以往的相對靜態(tài)變得更為趨于流動,這也迫使氣象部門必須考慮轉換到新型的應用研發(fā)和部署模式,以適應在多數(shù)據(jù)中心一體化體系中業(yè)務應用的新型運作方式。

        傳統(tǒng)的應用總體相對靜態(tài),即它們的應用體量大、生命周期長、更新速度慢、依賴關系復雜、部署遷移難度大;而在“Cloud Native”技術及理念的驅動下,利用“Microservices”[10]等技術框架產出的應用其體量大幅減小、生命周期靈活、更新速度動態(tài)可調、依賴關系少而簡單、部署遷移按需而動。不僅如此,通過在云生態(tài)中存在的多層次“XaaS”[11]服務的支持,應用全生命周期的運行將是一個“流水線”的方式,從需求分析、設計、編碼、測試、集成、部署、上線運行直至退出、消亡或改進重生,都應是一個根據(jù)既定策略而被控制調度執(zhí)行的自動化過程。目前國家氣象中心、中國氣象局公共氣象服務中心等單位已先后嘗試引進這種研發(fā)模式,效果是令人振奮的。

        相對特殊的一類應用是氣象數(shù)值模式的并行優(yōu)化,這是數(shù)值預報業(yè)務特有的高性能計算類應用。由于氣象數(shù)值模式并行多任務及緊耦合的特性,對比其他類型的應用,其并行優(yōu)化改進的難度相對較大。然而并行優(yōu)化對數(shù)值預報應用來說是一項關鍵工作,對提升預報能力和質量意義重大?,F(xiàn)代“氣象算力架構”中應提供“Performance Tuning as a Service”(PTaaS)的服務,把并行應用的優(yōu)化工作融入到“Continuous Integration/Continuous Delivery”(CI/CD)流水線中,支持研發(fā)人員以更為高效的方式改進并行模式。

        3.5 監(jiān)控技術

        監(jiān)控是針對目標系統(tǒng)進行全方位的監(jiān)視,全面了解系統(tǒng)資源分配、壓力負載、健康狀態(tài)等信息,最終為維護系統(tǒng)安全穩(wěn)定運行、定位故障和解決問題、系統(tǒng)改進、決策支持等提供基礎的可量化依據(jù)。在此基礎上,還提供必要的系統(tǒng)調控接口和機制。監(jiān)控內容主要分為基礎資源和業(yè)務應用兩大類型。監(jiān)控流程及關鍵環(huán)節(jié)主要包括:目標系統(tǒng)的指標信息獲取、指標信息匯聚處理、展現(xiàn)、統(tǒng)計報表生成等。為了實現(xiàn)較好的實時性,通常會采用“事件流”技術驅動監(jiān)控信息在其全流程內傳遞。

        和以往相比,新型“氣象算力架構”中的監(jiān)控能做到粒度更細、層次維度更豐富、實時性更強、統(tǒng)計分析和決策支持更為量化和精準。

        在“東數(shù)西算”+“一體化大數(shù)據(jù)中心體系”中,全局基礎資源(含設備)的支撐能力、健康狀況和實時負載等信息變得比以往更為關鍵,它將直接決定和影響“東數(shù)西算”的調度策略和最終的業(yè)務應用效率。資源監(jiān)視的關鍵是必須能夠做到全面、細粒度(可配置)、有針對性、有指導性(智能化)。

        應用層面的監(jiān)控也會發(fā)生較大的變化,主要原因在于以云生態(tài)為主支撐的新型“算力架構”中更多的業(yè)務應用將會以“Microservices”的形態(tài)出現(xiàn),其應用個體雖然有不同程度縮減,但應用運行實例的種類和數(shù)量卻大幅增長,以至于利用傳統(tǒng)的系統(tǒng)運維方式已很難掌控。以一個擁有1 萬臺服務器節(jié)點的數(shù)據(jù)中心為例,如果平均每節(jié)點運行100 個應用實例,就意味著總體運行實例數(shù)量為100 萬,面對如此數(shù)量級的業(yè)務進程,僅靠人工手動方式進行管理是難以想象的。因此必須借助于自動化的“應用監(jiān)控能力”,才可能對應用進行基本監(jiān)視和維護。新型“算力架構”還需要實現(xiàn)應用的多版本多實例運行管理,并需要配合系統(tǒng)調度實現(xiàn)多數(shù)據(jù)中心節(jié)點中的遷移、切換、并發(fā)控制等。

        此外,監(jiān)控必須實現(xiàn)全局資源和應用的動態(tài)一致性,以及信息獲取、分析、決斷和展現(xiàn)的實時性,為控制調度和管理維護人員提供精準支持,確保資源和業(yè)務調度不出現(xiàn)偏差。

        4 實現(xiàn)“氣象算力架構”的可持續(xù)發(fā)展

        可持續(xù)性,寬泛地說,是指在相當長的時間范圍保持某種穩(wěn)定狀態(tài)的能力。而發(fā)展意味著變化,即狀態(tài)的不穩(wěn)定性,以此而言,“可持續(xù)發(fā)展”本身就是一個帶有內部矛盾性的統(tǒng)一體的概念。它存在的意義主要在于面對持續(xù)的變化如何在特定時間范圍內保持我們所需要的穩(wěn)定狀態(tài)。

        一個系統(tǒng)的可持續(xù)性主要體現(xiàn)在其內部各組成要素之間能否在較長時間共存并達到一種平衡,如果其中部分要素的異常發(fā)展打破了平衡,其結果可能導致整個系統(tǒng)的惡化或消亡。

        架構需要較好的穩(wěn)定性,變更不能過于頻繁。對于氣象業(yè)務來說,“氣象算力架構”包含并影響著業(yè)務運轉所需的全部生態(tài)環(huán)境和支撐服務,架構的變化對業(yè)務將產生直接的、全方位的和根本的影響。因此,保持架構的穩(wěn)定性對整體業(yè)務系統(tǒng)的高效穩(wěn)定運行至關重要。

        架構也需要改變,以應對外部變化和適應內部發(fā)展的需要。外部因素涉及范圍較廣,例如國家政策、技術的發(fā)展與革新等,都會直接或間接影響系統(tǒng)架構的調整?!皷|數(shù)西算”策略正是這樣一個現(xiàn)實的外部因素,促進“氣象算力架構”的發(fā)展。內部因素主要來自于業(yè)務需求的變化、算力等基礎資源的變更、業(yè)務應用發(fā)展等層面,這些都構成了架構發(fā)展的內部驅動力。

        要實現(xiàn)“氣象算力架構”的可持續(xù)發(fā)展,就是要努力做到一方面保持架構的相對穩(wěn)定,另一方面還要在必要的情況下對其改進和發(fā)展,但不能因此導致系統(tǒng)的倒退或衰亡。本文對于“氣象算力架構”的可持續(xù)發(fā)展相對側重于應對架構的變化,即“穩(wěn)中求變”。

        近年來,隨著云計算的迅猛發(fā)展,信息技術領域涌現(xiàn)出了大量新思路和新方法,它們都為建立“氣象算力架構”并實現(xiàn)其可持續(xù)發(fā)展提供了比以往更豐富的資源,在技術上給予了比以往更為強有力的支持。

        可持續(xù)發(fā)展能力的核心思想之一是系統(tǒng)能夠為將來的發(fā)展和變更預留恰當?shù)目臻g,這也是一個實現(xiàn)可持續(xù)發(fā)展的有效手段,無論是在資源層、管理服務層還是應用層面,氣象算力體系架構也是如此。

        計算、存儲和網絡等基礎信息資源是整體架構和應用系統(tǒng)的基礎,在資源層恰當?shù)仡A留足夠的發(fā)展空間意味著基礎資源具備良好的彈性,能夠較好適應上層業(yè)務負載的波動,也是系統(tǒng)擴展和變更過程中必要的緩沖區(qū)。在此基礎上的系統(tǒng)資源的發(fā)展將更為平滑,能夠最小化地影響和沖擊其所支撐的各層次服務和業(yè)務應用。

        基礎資源層之上的管理服務層,即云生態(tài)環(huán)境,對可持續(xù)發(fā)展更為關鍵。在構建各生態(tài)服務時須重點關注相關服務組件對基礎資源的兼容性、管理控制能力,同時還須關注它們對業(yè)務應用的支持協(xié)調能力。這意味著無論是底層的基礎資源還是其上層的應用出現(xiàn)了變更和發(fā)展,管理服務層都需要有足夠的應對能力去適應并給予支持。由于服務層本身也是在迭代和變更的過程中,因此,服務自身必須具有較為完備的可持續(xù)發(fā)展和不間斷運行的能力。這一能力來源于整體架構對管理服務層所賦予的邏輯預留空間及其產生的彈性和靈活性。

        架構的可持續(xù)發(fā)展能力最終體現(xiàn)在應用層。在彈性資源和云生態(tài)服務環(huán)境中,應用已具備了良好的持續(xù)發(fā)展的基礎條件,但其自身的軟件架構和技術實現(xiàn)方式才是能否可持續(xù)發(fā)展的決定性因素。

        對于常規(guī)通用型的業(yè)務應用,利用“Microservices”等技術進行改造之后,應用組件的獨立性和部署靈活性都有所增強,迭代成本逐步降低;此外,應用的總體可靠性和運行的連續(xù)性也將得到提升。

        對于氣象行業(yè)特殊類型的應用,例如并行數(shù)值預報模式,其可持續(xù)發(fā)展能力更多的是體現(xiàn)在其軟件系統(tǒng)框架的彈性以及代碼的可復用性等方面。在云計算等主流技術趨勢推動下,并行應用與云生態(tài)環(huán)境的融合有著值得期待的前景,這種融合與演進將使并行應用從批處理方式轉變?yōu)椴婚g斷運行的服務成為可能。

        5 結語

        新型“算力體系結構”比傳統(tǒng)的信息系統(tǒng)架構在覆蓋范圍、動態(tài)性、自動化水平、自我持續(xù)發(fā)展能力等諸多方面有著大幅改進,以云生態(tài)服務為主的支撐環(huán)境將成為新型架構的核心主體?!皷|數(shù)西算”戰(zhàn)略和“一體化大數(shù)據(jù)中心體系”把算力架構擴展至多數(shù)據(jù)中心的全局范圍。這些都為氣象行業(yè)的信息系統(tǒng)體系結構的改進和發(fā)展提供了引領方向。對于氣象業(yè)務中并行計算等特殊應用,在構建新一代“氣象算力架構”的過程中,我們應給予重點關注,著力建立“并行云服務”等行業(yè)專有的算力服務,為豐富云生態(tài)總體服務能力做出貢獻。

        利益沖突聲明

        所有作者聲明不存在利益沖突關系。

        猜你喜歡
        資源服務能力
        消防安全四個能力
        基礎教育資源展示
        一樣的資源,不一樣的收獲
        服務在身邊 健康每一天
        服務在身邊 健康每一天
        服務在身邊 健康每一天
        資源回收
        大興學習之風 提升履職能力
        人大建設(2018年6期)2018-08-16 07:23:10
        你的換位思考能力如何
        招行30年:從“滿意服務”到“感動服務”
        商周刊(2017年9期)2017-08-22 02:57:56
        亚洲中文无码av在线| av区无码字幕中文色| 亚洲春色在线视频| 精品丝袜人妻久久久久久| 免费大学生国产在线观看p| 国产韩国一区二区三区| 午夜免费电影| 日韩乱码人妻无码中文字幕视频| 免费一区二区三区视频狠狠| 精品人妻av区二区三区| 国产精品国产三级国产aⅴ下载| 乱人伦人妻中文字幕无码| 91精品国产91久久久无码95| 国产自产自现在线视频地址| 国产一级二级三级在线观看视频| 午夜福利啪啪片| 成人欧美在线视频| 精品少妇一区二区三区四区| 妃光莉中文字幕一区二区| 国产98在线 | 日韩| 国产91 对白在线播放九色| 亚洲一区二区三区ay| 精品无码国产一区二区三区麻豆| 欧美操逼视频| 蜜桃在线播放免费一区二区三区| 亚洲一区二区三区福利久久蜜桃 | 人妻系列影片无码专区| 成人激情视频在线手机观看| 亚洲人成无码区在线观看| 香蕉久久夜色精品国产2020| 久久久亚洲女精品aa| 青青草骚视频在线观看| 免费人成在线观看视频播放| 久久尤物av天堂日日综合| 伊人精品成人久久综合97| 国内精品久久久久伊人av| 久久久噜噜噜久久中文字幕色伊伊 | 国产精品高清视亚洲乱码| 和外国人做人爱视频| 国产精品亚洲午夜不卡| 亚洲长腿丝袜中文字幕|