“不是任何一朵云都能撐住像‘雙11’這樣的流量?!卑⒗锇桶图瘓FCTO、阿里云智能總裁張建鋒表示。
2019年天貓“雙11”再次刷新世界紀錄:總成交額2684億元,訂單峰值54.4萬筆/秒,單日數(shù)據(jù)處理量970PB。這是在阿里巴巴核心系統(tǒng)今年已100%上云的情況完成的創(chuàng)紀錄之舉。阿里巴巴這朵云經(jīng)受住了“雙11”這一世界級流量洪峰。
用公共云承載一個萬億規(guī)模的核心系統(tǒng),阿里云做到了。可以肯定的是,未來阿里的全部系統(tǒng)都將運行在阿里云上。
其實,從去年開始,阿里已經(jīng)決定將整個阿里巴巴的核心系統(tǒng)全部遷移到云上。阿里為什么敢為天下先?首先,阿里云是阿里自己從頭研發(fā)的一朵云,每一行代碼都是自己的,累積、驗證、迭代了十年,這就是大家今天看到的“飛天操作系統(tǒng)”;阿里云將原來專用的技術(shù)變成公共云,所有核心系統(tǒng)都在公共云上,讓所有人都可以來享受普惠的服務(wù)。
今年的“雙11”已經(jīng)證明,阿里云100%核心系統(tǒng)上云是成功的。這背后不僅僅是簡單的替換,上云之后,系統(tǒng)整體性能有了非常大的提升。在交易開始的前十分鐘,消費者基本沒有感受到任何抖動,購物非常順暢。這主要得益于阿里云在以下幾方面的優(yōu)化:
首先,在核心虛擬機層面,阿里自研的神龍架構(gòu)基于自研的服務(wù)器實現(xiàn)虛擬化,其性能的輸出是穩(wěn)定的、線性的;其次,阿里自研的OceanBase 金融級分布式數(shù)據(jù)庫與PolarDB 數(shù)據(jù)庫同樣表現(xiàn)優(yōu)異,其每秒峰值遠超原來采用的Oracle 傳統(tǒng)數(shù)據(jù)庫;再次,實現(xiàn)計算與存儲的分離,阿里巴巴有一個專門的存儲池,所有數(shù)據(jù)都是從遠端存取,存儲的擴展非常方便;最后,大規(guī)模采用RDMA 網(wǎng)絡(luò),保證訪問性能。
今年的“雙11“總共處理了970P 的數(shù)據(jù)。在每個一個時間點,所處理的工作負載又各不相同,同時還要實現(xiàn)實時處理,難度就更大。阿里采用了分而治之的措施,在零點時,將大部分計算機資源分配給交易等應(yīng)用,在一點之后,則把數(shù)據(jù)分配給數(shù)據(jù)處理系統(tǒng)。
今年“雙11”除了數(shù)據(jù)的批處理以外,還有大量的流處理,即實時處理所有數(shù)據(jù),每生成一筆訂單,系統(tǒng)就會自動將數(shù)據(jù)逐層匯集上來。阿里采用的這一流式處理系統(tǒng),每秒能處理25 億筆記錄。
飛天操作系統(tǒng)能夠在10萬臺級別以上的服務(wù)器中做調(diào)度。管理如此龐大的服務(wù)器,除了飛天操作系統(tǒng)之外,還需要管理所有的消息流轉(zhuǎn)。因此,阿里自研了MQ 消息系統(tǒng),這是目前全球最大的一個消息系統(tǒng)。從飛天操作系統(tǒng)、大數(shù)據(jù)處理平臺到智能化應(yīng)用,這些技術(shù)疊加起來,構(gòu)成了一個強大的分布式的云平臺,才掌起了阿里整個經(jīng)濟體的所有核心應(yīng)用。
特別值得一提的是,阿里今年發(fā)布了自研的芯片含光800。明年的“雙11”,阿里大量的人工智能應(yīng)用都會跑在自研的芯片之上。
硬件、數(shù)據(jù)庫、云計算操作系統(tǒng),再加上核心應(yīng)用平臺,阿里以自研為起點,始終保持快速創(chuàng)新、快速迭代,才能在“雙11”這樣的硬仗面前,游刃有余,從容不迫。