如今,信息技術(shù)已經(jīng)滲透到各個(gè)學(xué)科領(lǐng)域。高校在努力建設(shè)“雙一流”大學(xué)的同時(shí),也在加快科研信息化工作的步伐。近日,新華三集團(tuán)推出“公共科學(xué)計(jì)算平臺(tái)解決方案”。該公司技術(shù)戰(zhàn)略部專家徐心平在接受本刊采訪時(shí)表示,公共科學(xué)計(jì)算平臺(tái)就是為了支持具有復(fù)雜數(shù)學(xué)運(yùn)算和高速并行計(jì)算的科研和應(yīng)用,提供一個(gè)共享的高性能基礎(chǔ)設(shè)施資源池,并支持多租戶靈活實(shí)用的開發(fā)和運(yùn)行高性能軟件應(yīng)用的PaaS平臺(tái)。在高校領(lǐng)域,可以驅(qū)動(dòng)實(shí)現(xiàn)科研信息化服務(wù)。
《中國教育網(wǎng)絡(luò)》:公共科學(xué)計(jì)算平臺(tái)的核心價(jià)值和關(guān)鍵技術(shù)問題是什么?
徐心平:公共科學(xué)計(jì)算平臺(tái)針對的應(yīng)用有關(guān)鍵的兩個(gè)特征:一是需要復(fù)雜的數(shù)學(xué)運(yùn)算;二是需要高速并行計(jì)算技術(shù)。目前涉及具有這兩個(gè)關(guān)鍵特征的技術(shù)和應(yīng)用領(lǐng)域就是HPC和AI。這兩個(gè)關(guān)鍵特征在底層的芯片/服務(wù)器/存儲(chǔ)/網(wǎng)絡(luò)層面有專業(yè)的技術(shù)實(shí)現(xiàn),有共享統(tǒng)一的基礎(chǔ), 但是在平臺(tái)層的runtime和programming model層面,以及解決具體問題的應(yīng)用層面卻各不相同。高性能的IT資源由于業(yè)務(wù)開發(fā)和應(yīng)用的需要,一般來說規(guī)模較大、投資也大,孤島式建設(shè)和利用模式造成很大的資源浪費(fèi),很多高性能的IT資源在單一業(yè)務(wù)開發(fā)和應(yīng)用的空閑時(shí)間無法及時(shí)給另外的項(xiàng)目組使用。這需要一個(gè)私有的專業(yè)PaaS平臺(tái),公共科學(xué)計(jì)算就是要解決這個(gè)需求,對于高性能業(yè)務(wù)研發(fā)和應(yīng)用,要能夠?qū)崿F(xiàn)多租戶資源共享,各業(yè)務(wù)科研組同時(shí)共同使用一個(gè)支撐平臺(tái),讓科研人員更關(guān)注業(yè)務(wù)科研而不是復(fù)雜的IT環(huán)境搭建,這是公共科學(xué)計(jì)算平臺(tái)的核心價(jià)值。
需要強(qiáng)調(diào)的是,針對高性能業(yè)務(wù)研發(fā)和應(yīng)用的公共科學(xué)計(jì)算平臺(tái),必須首先保證IT資源在科研和應(yīng)用的時(shí)候保持高性能,高可靠,高容錯(cuò)。而以虛擬機(jī)技術(shù)為基礎(chǔ)的openstack架構(gòu)更適合通用IT計(jì)算應(yīng)用的云化,更適合公有云模式,其提供的HPC/AI服務(wù)更多是針對普通的開發(fā)學(xué)習(xí)者,沒有規(guī)?;锢砑河?jì)算的必要,可以省略一些高性能技術(shù)的匹配。但針對規(guī)?;?、專業(yè)化的高速網(wǎng)絡(luò),大規(guī)模物理集群的自動(dòng)化部署,高可用高i/O的分布式存儲(chǔ),不同業(yè)務(wù)的runtime和programming 容器化封裝,底層各高性能硬件的驅(qū)動(dòng)支持等,實(shí)際是難以實(shí)現(xiàn)的,這些是針對專業(yè)開發(fā)和應(yīng)用必須的。
《中國教育網(wǎng)絡(luò)》:如何在高性能業(yè)務(wù)的研發(fā)和應(yīng)用的領(lǐng)域?qū)崿F(xiàn)這種專業(yè)私有云的平臺(tái)?新華三的公共科學(xué)計(jì)算平臺(tái)是如何做的?
徐心平:新華三把公共科學(xué)計(jì)算作為重點(diǎn)研究和開發(fā)的技術(shù)領(lǐng)域,研究相關(guān)融合技術(shù),打造公共科學(xué)計(jì)算生態(tài),提供公共科學(xué)計(jì)算整體解決方案,為客戶建設(shè)公共科學(xué)計(jì)算平臺(tái),為客戶的人工智能高性能業(yè)務(wù)的研發(fā)和應(yīng)用賦能。
新華三在提供針對專業(yè)HPC/AI開發(fā)者的公共科學(xué)計(jì)算平臺(tái)方案的同時(shí),也研究開發(fā)針對普通HPC/AI開發(fā)者的云平臺(tái)方案。在提供通用IT資源云服務(wù)時(shí),提供小規(guī)模需求的HPC/AI云服務(wù),并基于統(tǒng)一的云服務(wù)portal可以VDC的服務(wù)模式使得支持大規(guī)模需求的公共科學(xué)計(jì)算平臺(tái)和高校云平臺(tái)對接,從而實(shí)現(xiàn)一個(gè)統(tǒng)一的高校云服務(wù),實(shí)現(xiàn)高校管理、教學(xué)和科研信息化的融合。
《中國教育網(wǎng)絡(luò)》:高校公共科學(xué)計(jì)算平臺(tái)的訴求有哪些?面臨哪些問題?
徐心平: 高校很多涉及基于HPC/AI技術(shù)搞自己行業(yè)領(lǐng)域科研的院系,以往對于高性能的IT基礎(chǔ)設(shè)施大多都是課題組自購自用,獨(dú)享資源。不同業(yè)務(wù)科研的IT環(huán)境所需要的runtime和programming model部署和參數(shù)配置太復(fù)雜,無法靈活安裝和卸載,從而造成高性能的IT資源無法共享,沒有資源隔離的手段,沒有統(tǒng)一的服務(wù)目錄入口,也無法快速的給學(xué)生提供自動(dòng)化的一站式服務(wù)的高性能IT環(huán)境進(jìn)行實(shí)踐。從全校的角度來看,大量高性能的IT資源設(shè)備的采購成本很高,而又難以共享,院系之間,課題組之間的研究數(shù)據(jù)和成果也無法靈活的流轉(zhuǎn)和分享,這是實(shí)現(xiàn)科研信息化的最大問題和障礙。所以,高??蒲行畔⒒囊粋€(gè)核心訴求就是能否建設(shè)一個(gè)高性能基礎(chǔ)設(shè)施資源池,并提供一個(gè)PaaS平臺(tái),為各院系各課題組,以及學(xué)生提供支持多種涉及復(fù)雜數(shù)學(xué)運(yùn)算的高性能業(yè)務(wù),如基于HPC、AI技術(shù)的科研和教學(xué)實(shí)踐,并且平臺(tái)支持各業(yè)務(wù)組的研究和計(jì)算數(shù)據(jù),在平臺(tái)中方便的保存和流轉(zhuǎn),實(shí)現(xiàn)科研成果的分享。因此,建設(shè)公共科學(xué)計(jì)算平臺(tái)項(xiàng)目可以驅(qū)動(dòng)實(shí)現(xiàn)科研信息化。