王贊波,賓立
(益陽(yáng)橡膠塑料機(jī)械集團(tuán)有限公司,湖南 益陽(yáng) 413000)
益陽(yáng)橡膠塑料機(jī)械集團(tuán)有限公司(以下簡(jiǎn)稱(chēng)“益陽(yáng)橡機(jī)”)現(xiàn)隸屬于中國(guó)化工集團(tuán)有限公司旗下的中國(guó)化工裝備有限公司。企業(yè)集研發(fā)、生產(chǎn)、銷(xiāo)售、服務(wù)于一體,是國(guó)內(nèi)橡膠機(jī)械行業(yè)骨干企業(yè)。
為了破解企業(yè)自身發(fā)展所存在的瓶頸制約,打造承接德國(guó)克勞斯瑪菲轉(zhuǎn)移平臺(tái),益陽(yáng)橡機(jī)啟動(dòng)了整體搬遷技改——智能型橡膠機(jī)械數(shù)字化制造基地項(xiàng)目。
在整體搬遷這個(gè)戰(zhàn)略轉(zhuǎn)型背景下,企業(yè)對(duì)信息化建設(shè)和運(yùn)營(yíng)提出了更高的要求,IT部門(mén)越來(lái)越成為企業(yè)實(shí)現(xiàn)創(chuàng)新發(fā)展的本源,真正實(shí)現(xiàn)客戶和市場(chǎng)驅(qū)動(dòng)的運(yùn)營(yíng)模式。面對(duì)新的挑戰(zhàn),一方面需要IT服務(wù)能力能夠?qū)崿F(xiàn)快速交付;同時(shí),益陽(yáng)橡機(jī)企業(yè)內(nèi)部的IT系統(tǒng)規(guī)模不斷增大,各類(lèi)業(yè)務(wù)系統(tǒng)和數(shù)據(jù)業(yè)務(wù)數(shù)量日益龐雜,如果繼續(xù)采用傳統(tǒng)從硬件到應(yīng)用相互獨(dú)立的煙囪式運(yùn)營(yíng)發(fā)展模式,IT設(shè)備采購(gòu)和部署將面臨越來(lái)越大的壓力,各類(lèi)IT設(shè)備(網(wǎng)絡(luò)、服務(wù)器、存儲(chǔ)等)的資源將無(wú)法得到充分利用,從而在一定程度上制約了企業(yè)的快速發(fā)展。以此契機(jī),益陽(yáng)橡機(jī)實(shí)施虛擬化服務(wù)器及虛擬化桌面項(xiàng)目(以下簡(jiǎn)稱(chēng)“研發(fā)云平臺(tái)項(xiàng)目”)。
根據(jù)信息化整體規(guī)劃,益陽(yáng)橡機(jī)研發(fā)云平臺(tái)第一期項(xiàng)目,主要是為了滿足公司快速發(fā)展的研發(fā)業(yè)務(wù)需求,將現(xiàn)有的研發(fā)設(shè)計(jì)數(shù)據(jù)、應(yīng)用、管理整合到一個(gè)統(tǒng)一的云平臺(tái)。不僅解決研發(fā)設(shè)計(jì)過(guò)程的數(shù)據(jù)安全管理、基于權(quán)限的應(yīng)用使用,同時(shí)也為公司運(yùn)維管理提供了一套業(yè)界領(lǐng)先的云管理平臺(tái),幫助益陽(yáng)橡機(jī)實(shí)現(xiàn)自動(dòng)化IT運(yùn)維。這個(gè)目標(biāo)主要是分為兩個(gè)部分。
業(yè)務(wù)管理系統(tǒng)上云:建立虛擬化服務(wù)器,所有的應(yīng)用系統(tǒng)都遷移至虛擬服務(wù)器上。通過(guò)服務(wù)器整合,建立資源池,實(shí)現(xiàn)計(jì)算資源、存儲(chǔ)資源、圖形資源動(dòng)態(tài)按需分配,充分發(fā)揮硬件資源的使用效率。
研發(fā)設(shè)計(jì)上云:搭建企業(yè)研發(fā)虛擬化桌面平臺(tái),涵蓋技術(shù)中心、工藝部等部門(mén)所有應(yīng)用軟件和應(yīng)用系統(tǒng),實(shí)現(xiàn)設(shè)計(jì)、工藝工作模式切換到虛擬化桌面平臺(tái),并支持設(shè)計(jì)、工藝集中統(tǒng)一管理模式。
經(jīng)過(guò)半年多時(shí)間的技術(shù)交流和測(cè)試,我們最終選擇了Citrix桌面云和VMware的虛擬化服務(wù)器,前期經(jīng)過(guò)我們大量測(cè)試,這次項(xiàng)目采用多臺(tái)高性能圖形服務(wù)器與基礎(chǔ)架構(gòu)服務(wù)器通過(guò)萬(wàn)兆光纖互聯(lián)互通(見(jiàn)圖1),其中圖形服務(wù)器采用了Nvidia專(zhuān)用圖形顯示卡P6000,每塊顯卡承載用戶數(shù)20~25個(gè),目前我們有60位研發(fā)設(shè)計(jì)人員,實(shí)際并發(fā)量為66.7%,因此使用2臺(tái)圖形服務(wù)器即可滿足第一期業(yè)務(wù)需要,同時(shí)配置4臺(tái)高性能2U服務(wù)器,通過(guò)服務(wù)器虛擬化方式構(gòu)建業(yè)務(wù)虛擬化資源池。
圖1 研發(fā)云平臺(tái)系統(tǒng)拓?fù)鋱D
項(xiàng)目于2019年10月啟動(dòng)項(xiàng)目實(shí)施,到2020年1月份正式上線(見(jiàn)圖2)。通過(guò)項(xiàng)目的實(shí)施,解決傳統(tǒng)IT架構(gòu)中以分散設(shè)備為中心的管理難題,最終實(shí)現(xiàn)通過(guò)網(wǎng)絡(luò),動(dòng)態(tài)按需使用資源及數(shù)據(jù),集中管控硬件、軟件以及數(shù)據(jù)資源,構(gòu)建支撐企業(yè)智能制造和管理目標(biāo)的信息化體系。
圖2 研發(fā)云平臺(tái)桌面
項(xiàng)目上線之后,在2020年疫情發(fā)生后,實(shí)施效果馬上體現(xiàn)了出來(lái)。疫情期間,特別是互聯(lián)網(wǎng)企業(yè),都引入了遠(yuǎn)程辦公工具,一度造成系統(tǒng)崩潰,比如百度、網(wǎng)易,在員工大面積登陸企業(yè)內(nèi)網(wǎng)時(shí),導(dǎo)致VPN癱瘓。但是對(duì)制造業(yè)而言,遠(yuǎn)程辦公是最簡(jiǎn)單的場(chǎng)景,更重要的是,如何實(shí)現(xiàn)異地研發(fā)、生產(chǎn)協(xié)同等的在線業(yè)務(wù)協(xié)作平臺(tái),從而保證企業(yè)在線不停產(chǎn),最大限度的減少現(xiàn)場(chǎng)人員聚集[2]。
相對(duì)于我們公司來(lái)說(shuō),2020年要實(shí)現(xiàn)整體搬遷,項(xiàng)目各條線正在有條不紊的進(jìn)行,其中技術(shù)中心三維模型設(shè)計(jì)和工藝部門(mén)的三維工藝規(guī)劃壓力巨大,加之疫情的突然到來(lái),導(dǎo)致工作暫時(shí)中斷。為了加大項(xiàng)目的整體進(jìn)度,保證技術(shù)工藝人員的工作不受影響,益陽(yáng)橡機(jī)利用研發(fā)云平臺(tái),開(kāi)通了VPN賬號(hào),技術(shù)和工藝人員可以在家通過(guò)VPN登錄到設(shè)計(jì)云平臺(tái)上面,進(jìn)行正常的工作,所設(shè)計(jì)的內(nèi)容都集中存儲(chǔ)在企業(yè)的云平臺(tái)服務(wù)器上面,前端只有終端連接顯示,數(shù)據(jù)不能下載到前端,同時(shí)網(wǎng)絡(luò)不傳輸實(shí)際數(shù)據(jù),多重?cái)?shù)據(jù)保護(hù)措施,實(shí)現(xiàn)了數(shù)據(jù)可以用,但是拿不走,通過(guò)訪問(wèn)控制、數(shù)據(jù)管控和外設(shè)管控等一系列策略,確保滿足安全、合規(guī)要求,保障業(yè)務(wù)數(shù)據(jù)的信息安全。
由于出差或者疫情等情況導(dǎo)致地域跨度大,工程師之間的協(xié)同工作就變得很困難,最多只能是基于數(shù)據(jù)共享方式的協(xié)同。如果模型數(shù)據(jù)巨大的話,有異地協(xié)同的需求時(shí),數(shù)據(jù)傳輸也會(huì)受到網(wǎng)絡(luò)鏈路帶寬和穩(wěn)定性的影響。而且這種協(xié)同方式只能是結(jié)果數(shù)據(jù)的共享,在數(shù)據(jù)產(chǎn)生過(guò)程中的協(xié)同難以實(shí)現(xiàn)。這種數(shù)據(jù)共享的協(xié)同工作方式效率不高,且存在著數(shù)據(jù)安全隱患。因此我們這次重點(diǎn)運(yùn)用了在線實(shí)時(shí)協(xié)同:通過(guò)內(nèi)存數(shù)據(jù)與屏幕信息共享,多人同時(shí)觀看同一模型數(shù)據(jù)與其操作過(guò)程。對(duì)客戶端設(shè)備沒(méi)有要求,只要登陸到云端即可進(jìn)行;任何數(shù)據(jù)并不發(fā)生傳輸,因此協(xié)同參與人員無(wú)需準(zhǔn)備任何環(huán)境與數(shù)據(jù),隨時(shí)隨地可以開(kāi)始協(xié)同工作。協(xié)同發(fā)起人還能夠隨時(shí)授權(quán)其他用戶的鍵盤(pán)/鼠標(biāo)輸入來(lái)操作模型。
此次項(xiàng)目采購(gòu)4臺(tái)服務(wù)器,通過(guò)以太網(wǎng)絡(luò)組建分布式存儲(chǔ),在4臺(tái)服務(wù)器裸機(jī)上分別安裝VMware vSphere虛擬機(jī)軟件,利用服務(wù)器強(qiáng)大的處理能力,生成多個(gè)虛擬服務(wù)器,而每一個(gè)虛擬服務(wù)器,從功能、性能和操作方式上,等同于傳統(tǒng)的單臺(tái)物理服務(wù)器。然后采用一臺(tái)虛擬機(jī)部署vCenter虛擬機(jī),安裝虛擬化管理軟件,對(duì)所有虛擬機(jī)服務(wù)器及虛擬機(jī)進(jìn)行管理。4臺(tái)服務(wù)器之間通過(guò)兩個(gè)萬(wàn)兆光纖網(wǎng)卡與萬(wàn)兆光纖以太網(wǎng)交換機(jī)進(jìn)行互聯(lián),通過(guò)分布式交換機(jī)實(shí)現(xiàn)分布式存儲(chǔ)數(shù)據(jù)以及業(yè)務(wù)數(shù)據(jù)的傳輸,兩個(gè)千兆網(wǎng)絡(luò)互備,通過(guò)標(biāo)準(zhǔn)交換機(jī),滿足超融合系統(tǒng)管理以及遷移的需求。所有網(wǎng)絡(luò)采用雙鏈路冗余,避免單點(diǎn)故障。目前公司所有的應(yīng)用系統(tǒng)都已經(jīng)遷移到云平臺(tái)上面,并且為以后的MES、SAP等系統(tǒng)的實(shí)施提供了服務(wù)器平臺(tái)。虛擬化服務(wù)器管理平臺(tái)如圖3所示。
通過(guò)項(xiàng)目實(shí)施,建立了益陽(yáng)橡機(jī)云管理平臺(tái),實(shí)現(xiàn)資源的動(dòng)態(tài)調(diào)配,以及應(yīng)用軟件集中更新、統(tǒng)一發(fā)布,只需維護(hù)管理服務(wù)器端的軟件和數(shù)據(jù),個(gè)人電腦無(wú)需安裝應(yīng)用程序和擁有數(shù)據(jù),實(shí)現(xiàn)個(gè)人電腦免維護(hù),在降低IT運(yùn)維管理工作強(qiáng)度的同時(shí),向用戶提供統(tǒng)一版本的應(yīng)用軟件,規(guī)范數(shù)據(jù)格式標(biāo)準(zhǔn)。
圖3 虛擬化服務(wù)器管理平臺(tái)
益陽(yáng)橡機(jī)此次是產(chǎn)業(yè)轉(zhuǎn)型升級(jí),所以全部采購(gòu)了高端的數(shù)控設(shè)備,對(duì)研發(fā)設(shè)計(jì)要求提高,需要全部三維設(shè)計(jì),傳統(tǒng)的桌面云主要用于辦公,對(duì)于資源消耗比較大的三維設(shè)計(jì)、動(dòng)畫(huà)仿真、結(jié)構(gòu)力學(xué)等應(yīng)用,桌面云就無(wú)法滿足要求,出現(xiàn)卡頓、延時(shí)的效果,所以我們這次選擇研發(fā)云,重點(diǎn)是解決研發(fā)設(shè)計(jì)過(guò)程中對(duì)于資源消耗的情況。
研發(fā)云與普通辦公桌面云的最大的差異在于GPU的使用,GPU是圖形處理器的簡(jiǎn)稱(chēng),這個(gè)概念是由NVIDIA公司在發(fā)布GeForce256繪圖處理芯片時(shí)首先提出。GPU使顯卡減少了對(duì)CPU的依賴,并分擔(dān)了部分原本是由CPU所擔(dān)當(dāng)?shù)墓ぷ?,尤其是在進(jìn)行3D圖形處理時(shí),功效更加明顯[3]。
經(jīng)過(guò)長(zhǎng)期市場(chǎng)調(diào)研以及與多家供應(yīng)商進(jìn)行多次技術(shù)交流,對(duì)于CPU、內(nèi)存、存儲(chǔ)等基礎(chǔ)架構(gòu)的虛擬化技術(shù)已經(jīng)非常成熟,主流技術(shù)有:VMware、Citrix、微軟、開(kāi)源軟件,如OpenStack、基于開(kāi)源軟件進(jìn)行二次開(kāi)發(fā),如zStack。
研發(fā)虛擬化對(duì)于GPU的使用主流方式分別為:GPU虛擬化、GPU共享。
GPU虛擬化,也就通常據(jù)說(shuō)的切片方式,將一塊高性能圖形卡按預(yù)先設(shè)定好的配置分成若干小圖形卡,每塊虛擬出來(lái)的圖形卡分配到用戶的虛擬桌面中,每個(gè)用戶只能使用所分配到的GPU和顯存資源。如果資源不足,重新調(diào)整時(shí),必須要重新啟動(dòng)虛擬機(jī)。
GPU共享是利用多用戶、多進(jìn)程操作系統(tǒng)進(jìn)行資源調(diào)度。但在圖形卡驅(qū)動(dòng)與操作系統(tǒng)之間進(jìn)行了優(yōu)化,當(dāng)多位用戶并發(fā)操作時(shí),所有用戶的資源調(diào)用都是串型的,GPU在同一個(gè)時(shí)鐘周期中只處理1個(gè)任務(wù),對(duì)于每位用戶而言,他們的資源調(diào)度始終都在使用GPU最大處理能力進(jìn)行工作,資源利用率非常高,圖形效果最佳。目前主流的VMware和Citrix就是采用的這個(gè)方法。
桌面虛擬化的一個(gè)重要的技術(shù)就是協(xié)議,因?yàn)閰f(xié)議效率決定了虛擬桌面使用的用戶體驗(yàn)[4]。目前提供虛擬化解決方案的主要國(guó)外廠商都有自己的協(xié)議,目前主流的有PCoIP、ICA、RDP和SPICE這四類(lèi)桌面云傳輸協(xié)議,Microsoft使用RDP協(xié)議,Citrix用的是ICA協(xié)議,Vmware的是PCoIP協(xié)議,Redhat發(fā)布了SPICE協(xié)議。
研發(fā)云應(yīng)用場(chǎng)景,在確保數(shù)據(jù)安全的前提下,客戶端通過(guò)網(wǎng)絡(luò)將后臺(tái)應(yīng)用鏡像通過(guò)專(zhuān)屬協(xié)議傳輸至前端用戶界面,研發(fā)人員在獲得良好三維操作體驗(yàn)性上需要以下重點(diǎn)指標(biāo):低帶寬占用、高圖像顯示效果、低延時(shí)。而這三個(gè)特點(diǎn)是ICA協(xié)議所具備的,這是我們此次選型的重點(diǎn)參考依據(jù)。
研發(fā)云平臺(tái)助力益陽(yáng)橡機(jī)解決傳統(tǒng)IT架構(gòu)的沉疴,集中資源創(chuàng)新,建立新的生態(tài)環(huán)境,真正實(shí)現(xiàn)企業(yè)IT建設(shè)的集約化可持續(xù)發(fā)展的模式。預(yù)計(jì)在三至五年內(nèi),益陽(yáng)橡機(jī)工業(yè)互聯(lián)云平臺(tái)的建設(shè)能夠幫助公司初步構(gòu)建完成企業(yè)智能制造系統(tǒng)架構(gòu)體系,承載智能設(shè)計(jì)、智能制造、智能服務(wù)、工業(yè)軟件和大數(shù)據(jù)工業(yè)互聯(lián)網(wǎng)等方面的應(yīng)用;構(gòu)建支撐企業(yè)智能制造和管理目標(biāo)的信息化體系,助推企業(yè)設(shè)計(jì)、制造、服務(wù)、管理達(dá)到國(guó)內(nèi)先進(jìn)水平,成為機(jī)械裝備行業(yè)數(shù)字化、智能化示范企業(yè),樹(shù)立機(jī)械裝備行業(yè)數(shù)字化、智能化標(biāo)桿。