張帥
云計(jì)算行業(yè)的競(jìng)爭(zhēng)以算力為先,無論上層應(yīng)用如何演化,算力的基礎(chǔ)底座屬性不變,頭部云廠商往往更加重視平衡算力層的效率與成本,當(dāng)規(guī)模足夠大,萬分之一的優(yōu)化也能帶來巨大的效益,云計(jì)算做的恰恰是規(guī)模生意。
2020騰訊全球數(shù)字生態(tài)大會(huì)期間,騰訊云計(jì)算力產(chǎn)品能力矩陣首次集中亮相。與此同時(shí),騰訊自研星星海系列服務(wù)器產(chǎn)品路線愈發(fā)清晰,左手AMD,右手英特爾,騰訊云正在給自己的算力做加法。
《計(jì)算機(jī)世界》了解到,騰訊云可以說是擁抱AMD最“激進(jìn)”的云廠商,不過這種情況正在改變。
騰訊云云服務(wù)器副總經(jīng)理李力表示,其他云廠商逐漸發(fā)現(xiàn)“激進(jìn)”是一個(gè)明智的選擇,業(yè)界開始更多采用AMD處理器。騰訊云于2017年與AMD深度合作,當(dāng)時(shí)AMD還是Naples架構(gòu)。
隨著客戶需求趨向于多樣化,騰訊云希望對(duì)外售賣的服務(wù)器在標(biāo)準(zhǔn)化的情況下,給客戶更多的選擇,彼時(shí)AMD重返服務(wù)器市場(chǎng),騰訊云在技術(shù)和產(chǎn)品層面對(duì)其進(jìn)行評(píng)估,AMD本身在設(shè)計(jì)上也有一些為云計(jì)算場(chǎng)景的專門優(yōu)化,至少在設(shè)計(jì)及需求功能的匹配上,AMD還是合格的。
于是騰訊云引入AMD處理器作為產(chǎn)品的補(bǔ)充,畢竟AMD不是數(shù)據(jù)中心的主流玩家,在初期,AMD的市場(chǎng)推廣出現(xiàn)了一些困難,比如來自用戶的質(zhì)疑,騰訊云選擇中小型用戶或者對(duì)成本敏感的用戶入手,來推動(dòng)AMD云服務(wù)器的采用,由于性價(jià)比優(yōu)勢(shì)突出,因此基于AMD的云服務(wù)器上量較快。
到了AMD的Rome架構(gòu)時(shí)代,騰訊云在星星海自研服務(wù)器深度與AMD的Rome平臺(tái)綁定,并且和AMD一起定義了騰訊云自己的AMD芯片。
“此時(shí)我們已經(jīng)從激進(jìn)變成了明智,因?yàn)槠渌茝S商在我們之后也開展了這個(gè)工作,但騰訊云是最早最積極擁抱AMD的。星星海服務(wù)器并不是僅僅為了AMD,為了Rome平臺(tái)做的自研服務(wù)器,它的定位是騰訊自研服務(wù)器?!崩盍Ρ硎?。
騰訊云之前并沒有自研服務(wù)器的歷史,從零開始往往意味著波折重重,但用李力的話來說,“以我個(gè)人做技術(shù)和做云這么多年的經(jīng)驗(yàn)來看,星星海在云上上量的過程簡(jiǎn)直是個(gè)奇跡?!?/p>
奇跡的點(diǎn)在于——新的自研服務(wù)器上線一定不可避免帶來螺旋上升,坎坷和回退都很正常,騰訊云已經(jīng)做好了準(zhǔn)備,而實(shí)際在過去一整年的推廣當(dāng)中,自研服務(wù)器極少發(fā)生故障。
“有句話叫云計(jì)算沒有奇跡,其實(shí)是騰訊云過去多年的經(jīng)驗(yàn)教訓(xùn)和海量業(yè)務(wù)服務(wù)的積累,我們?cè)谶x擇做自研服務(wù)器時(shí)非常地敬畏,并且花費(fèi)了大量的精力在其他人并不重視的點(diǎn)上?!崩盍Ω锌馈?h3>右手英特爾,最穩(wěn)定的選擇
英特爾仍然是數(shù)據(jù)中心領(lǐng)域的絕對(duì)主導(dǎo),騰訊云自研星星海服務(wù)器當(dāng)然少不了英特爾。
由英特爾和騰訊合作定制,搭載四顆第三代英特爾至強(qiáng)可擴(kuò)展處理器和第二代英特爾傲騰持久內(nèi)存的騰訊云星星海四路服務(wù)器,是業(yè)界首家大規(guī)模落地RAS技術(shù),能夠滿足通用計(jì)算、異構(gòu)計(jì)算、裸金屬、高性能計(jì)算等全業(yè)務(wù)場(chǎng)景的產(chǎn)品,該款服務(wù)器在本次大會(huì)上正式發(fā)布。
英特爾至強(qiáng)Cedar Island四路平臺(tái)性能優(yōu)勢(shì)在星星海上有很好的體現(xiàn),比如單節(jié)點(diǎn)下最高內(nèi)存帶寬以及IO數(shù)量、單機(jī)柜的處理器核數(shù)以及云主機(jī)的虛擬機(jī)密度,相比兩路服務(wù)器也有不少提升,性價(jià)比更高的同時(shí)運(yùn)維成本更低。
英特爾針對(duì)Cedar Island四路平臺(tái)做了一些特殊技術(shù)開發(fā)。比如UPI(超路徑互連),UPI作為CPU和CPU之間的高速互連,在Sky Lake和Cascade Lake上面,英特爾做的都是三根UPI,而在四路服務(wù)器上,每個(gè)CPU配備六根UPI,保證四路服務(wù)器CPU和CPU都有兩根UPI的全網(wǎng)狀連接,能夠有效優(yōu)化四路平臺(tái)的性能以及支持NUMA節(jié)點(diǎn),類似的設(shè)計(jì)都在星星海服務(wù)器上得到使用。
據(jù)悉,英特爾已經(jīng)投入了數(shù)百名工程師,從硬件設(shè)計(jì)到軟件升級(jí),來幫助騰訊設(shè)計(jì)開發(fā)和優(yōu)化整套基礎(chǔ)架構(gòu)。
騰訊云服務(wù)器與供應(yīng)鏈管理部總經(jīng)理劉裕勛表示,星星海四路服務(wù)器,作為英特爾與騰訊合作的重要成果,性能優(yōu)異,不僅可提升騰訊云云服務(wù)器、容器服務(wù)、云開發(fā)等計(jì)算矩陣的戰(zhàn)略能力,更可讓部署更加彈性,讓應(yīng)用與開發(fā)更加簡(jiǎn)潔、可信、靈活,并可有效降低云服務(wù)總體成本。預(yù)計(jì)10月份,星星海四路服務(wù)器將正式在騰訊云計(jì)算矩陣中投入使用。
值得一提的是,英特爾亦與騰訊持續(xù)推動(dòng)AI聯(lián)合創(chuàng)新。雙方不僅在硬件層面合作,以內(nèi)置AI加速的英特爾至強(qiáng)可擴(kuò)展處理器為基礎(chǔ),通過一系列硬件指令加速,為開發(fā)者提供更多選擇,提高性能;同時(shí),騰訊云依托英特爾的AI軟件棧優(yōu)化,成功上線Open Vino推理加速引擎,成為業(yè)內(nèi)第一個(gè)支持Analytics Zoo的公有云廠商,從數(shù)據(jù)管理到資源利用,形成了完整的端到端全棧解決方案。
騰訊云認(rèn)為,未來的智能計(jì)算,就是基于5G網(wǎng)絡(luò)下,云計(jì)算、大數(shù)據(jù)、AI、物聯(lián)網(wǎng)為一體的智能化計(jì)算。面對(duì)越來越復(fù)雜的數(shù)據(jù)和不斷擴(kuò)大的業(yè)務(wù)規(guī)模,不同客戶的多重需求,騰訊云通過自研戰(zhàn)略推進(jìn)軟硬件協(xié)同,豐富計(jì)算能力產(chǎn)品并對(duì)外輸出。
基于騰訊云自研星星海服務(wù)器上的云服務(wù)器實(shí)例,在性能、成本、穩(wěn)定性上已經(jīng)處于行業(yè)領(lǐng)先地位。據(jù)了解,星星海服務(wù)器針對(duì)云計(jì)算場(chǎng)景做了重點(diǎn)優(yōu)化,能夠有效地滿足騰訊云98%的應(yīng)用場(chǎng)景需求,其外觀用料精簡(jiǎn)超過20%,負(fù)載能效提高50%。此外,基于可信鏈傳遞的硬件防篡改能力,使星星海服務(wù)器具備了符合大規(guī)模云應(yīng)用的硬件安全能力。星星海服務(wù)器支持通過專有云TCE在客戶的數(shù)據(jù)中心進(jìn)行本地化部署。
騰訊云還推出了面向中小企業(yè)、個(gè)人用戶的易于使用和管理的輕量級(jí)云服務(wù)器Lighthouse,從云能力、云UI、云計(jì)費(fèi)3個(gè)方向全新設(shè)計(jì),簡(jiǎn)單易用,實(shí)現(xiàn)20秒建站,提升30%運(yùn)維效率,優(yōu)化80%的設(shè)備成本,能夠幫助中小企業(yè)及開發(fā)者在云端快速構(gòu)建博客、論壇等各類應(yīng)用。
除了星星海自研服務(wù)器之外,在AI方面,騰訊云支持多種深度學(xué)習(xí)的GPU,并提供了多種使用方式,可滿足不同層次需求。騰訊云還提供了智能鈦機(jī)器學(xué)習(xí)平臺(tái)、TBP智能對(duì)話平臺(tái)等專注于AI場(chǎng)景的解決方案。在大數(shù)據(jù)方面,騰訊云有豐富的大數(shù)據(jù)機(jī)型,可滿足業(yè)務(wù)不同的使用場(chǎng)景,同時(shí)騰訊云PaaS服務(wù)EMR,可以幫助業(yè)務(wù)降低使用門檻。
邊緣計(jì)算方面,騰訊云布局了上千個(gè)邊緣節(jié)點(diǎn),結(jié)合5G網(wǎng)絡(luò),提供更低延時(shí)的計(jì)算能力。目前騰訊云正在將公有云延展到邊緣節(jié)點(diǎn)及客戶機(jī)房,以便給企業(yè)提供本地部署的云環(huán)境,將云上產(chǎn)品和技術(shù)持續(xù)延展。
數(shù)據(jù)中心以及服務(wù)器硬件是算力的底層承載,騰訊云推出了獨(dú)創(chuàng)的T-block數(shù)據(jù)中心解決方案。騰訊自研創(chuàng)新的T-block技術(shù),涵蓋中壓、低壓、IT、辦公等功能模塊,可以根據(jù)用戶需求靈活配置,以標(biāo)準(zhǔn)化、產(chǎn)品化形式幫助數(shù)據(jù)中心實(shí)現(xiàn)快速建設(shè)和交付。其綠色節(jié)能的特性將運(yùn)營(yíng)成本降低了20%以上。通過騰訊智維平臺(tái)實(shí)現(xiàn)自動(dòng)化的高效運(yùn)營(yíng),T-block將運(yùn)維效率提升了20%以上。
云廠商之間的競(jìng)爭(zhēng)產(chǎn)業(yè)鏈逐步下移,尤其體現(xiàn)在硬件設(shè)備上,軟件是互聯(lián)網(wǎng)云廠商的優(yōu)勢(shì)所在,硬件是IT云廠商的強(qiáng)項(xiàng),兩者有一致趨同的勢(shì)頭——軟硬件結(jié)合。
騰訊云星星海自研服務(wù)器仍在進(jìn)化,未來還會(huì)有自研網(wǎng)卡以及ASIC生態(tài)的探索,這些底層技術(shù)的迭代都會(huì)應(yīng)用到AI、大數(shù)據(jù)以及邊緣計(jì)算的場(chǎng)景,軟硬結(jié)合的騰訊云將會(huì)繼續(xù)給算力做加法。