劉駿
Habana Labs近日宣布,該公司正式退出隱身模式,將面向精選客戶推出首個人工智能處理器樣品。基于其Goya HL-1000處理器的PCIe卡可基于ResNet-50推理基準實現(xiàn)每秒15 000張圖片的吞吐量,延遲時間為1.3 ms,功耗僅為100 w。與如今數(shù)據(jù)中心部署的一般解決方案相比,Habana Labs人工智能處理器的性能要高出1~3個數(shù)量級。
旨在處理各種人工智能推理工作負載,如圖像識別、神經(jīng)機器翻譯、情感分析、推薦系統(tǒng)以及許多其他應(yīng)用,Habana Labs的Goya平臺從頭設(shè)計,目標實現(xiàn)深度學習推理。該平臺集完全可編程的Tensor Processing Core、開發(fā)工具、圖書室和編譯程序于一體,共同打造一個高性能且節(jié)能的全方位平臺。
Habana Labs首席商務(wù)官艾坦·麥地那表示:“Habana Labs擁有一個一流的團隊,目標改變云端、數(shù)據(jù)中心以及其他新興應(yīng)用的人工智能處理方式。2016年公司才成立,現(xiàn)在就取得這樣的產(chǎn)品里程碑,非常了不起。我們將繼續(xù)專注于打造成功、長久的人工智能處理器公司,長期為快速成長的高性能人工智能領(lǐng)域提供服務(wù)?!?/p>
Habana Labs董事長兼主要投資人阿維格多·威倫茲說:“30年來,我參與過一些提供最先進VLSI設(shè)備的團隊,但幾乎沒見過哪個團隊有這樣高水平的執(zhí)行力。從概念到經(jīng)過嚴格測試并準備好投產(chǎn),我們的Goya硅片僅僅用了不到一年的時間。這項振奮人心的成就以及Habana Labs將于未來幾個季度提供的平臺將使我們的客戶能夠引領(lǐng)人工智能革命?!?/p>
Habana Labs的SynapseAI軟件棧對訓練模型輸入進行分析和優(yōu)化,以通過Goya處理器實現(xiàn)高效推理。這款軟件包括一個豐富的內(nèi)核庫,其工具鏈是開放的,供客戶添加專有內(nèi)核。這款軟件可與TensorFlow和ONNX等頗受歡迎的深度學習神經(jīng)網(wǎng)絡(luò)框架無縫交互。
Habana Labs將于2018年9月18日~19日在加州山景城舉辦的人工智能硬件峰會(AI Hardware Summit)上通過一個一般服務(wù)器展示Goya推理處理器,運行多個神經(jīng)網(wǎng)絡(luò)拓撲技術(shù)。
Habana Labs計劃于2019年第二季度推出首個Gaudi訓練處理器樣品。每個設(shè)備,Gaudi擁有2T bps的吞吐量,其訓練性能線性擴展至數(shù)千個處理器。