【
中國(guó)智能制造網(wǎng) 新品速遞】9月12日,阿里云宣布推出全新一代異構(gòu)加速平臺(tái),這是阿里云發(fā)布一整套異構(gòu)計(jì)算家族,涵蓋GPU、FPGA在內(nèi)等7款異構(gòu)實(shí)例;還有基于阿里云異構(gòu)平臺(tái)的全新高性能計(jì)算實(shí)例E-HPC,可一鍵部署大型超算集群環(huán)境。
近一年來(lái),人工智能迎來(lái)了史上第三次熱潮。移動(dòng)互聯(lián)網(wǎng)時(shí)代沉淀下來(lái)的大量數(shù)據(jù)和GPU近幾年的快速發(fā)展,讓學(xué)界和業(yè)界相信,這人工智能時(shí)代真的要來(lái)了?,F(xiàn)在,公有云廠商要在上面加一點(diǎn)火。
由于人工智能模型訓(xùn)練對(duì)算力的要求,原有的通用型CPU架構(gòu)無(wú)法滿(mǎn)足,不少企業(yè)或科研機(jī)構(gòu)在訓(xùn)練模型的時(shí)候會(huì)通過(guò)采用和主處理器(CPU)不同架構(gòu)的加速器件(也就是所謂“異構(gòu)”),如GPU、FPGA、ASIC等器件,提供高密度并行計(jì)算的運(yùn)算能力,非常適合當(dāng)下的人工智能應(yīng)用體系。
算力推動(dòng)了人工智能發(fā)展,產(chǎn)業(yè)發(fā)展也催生了對(duì)計(jì)算能力的需求,業(yè)界專(zhuān)家預(yù)測(cè),到2020年,與人工智能相關(guān)的計(jì)算力需求將會(huì)增長(zhǎng)12倍。瞄準(zhǔn)了這個(gè)巨大的需求,公有云廠商開(kāi)始提供相關(guān)產(chǎn)品。
9月12日,阿里云宣布推出全新一代異構(gòu)加速平臺(tái),這是阿里云發(fā)布一整套異構(gòu)計(jì)算家族,涵蓋GPU、FPGA在內(nèi)等7款異構(gòu)實(shí)例;還有基于阿里云異構(gòu)平臺(tái)的全新高性能計(jì)算實(shí)例E-HPC,可一鍵部署大型超算集群環(huán)境。
針對(duì)不同業(yè)務(wù)場(chǎng)景開(kāi)不同的“車(chē)”
之前,企業(yè)如果需要類(lèi)似的架構(gòu)來(lái)訓(xùn)練深度學(xué)習(xí)模型,從服務(wù)器和GPU的采購(gòu)、架構(gòu)的搭建,到軟件的授權(quán)付費(fèi),都要自己完成。據(jù)阿里云方面表示,利用阿里云的服務(wù)可將深度學(xué)習(xí)成本縮減一半,降低人工智能計(jì)算門(mén)檻。
阿里云這次推出的人工智能解決方案,囊括了云服務(wù)的各層級(jí)(詳見(jiàn)下圖)。
先說(shuō)IaaS層提供的服務(wù)器層面,跟此前阿里云發(fā)布企業(yè)級(jí)云服務(wù)器產(chǎn)品線的總思路類(lèi)似,便是為不同的計(jì)算需求和人工智能業(yè)務(wù)場(chǎng)景推出不同的實(shí)例。
新一代GPU實(shí)例GN5i可以將類(lèi)似場(chǎng)景需求進(jìn)一步細(xì)致化。據(jù)阿里云技術(shù)專(zhuān)家龍欣接受36氪專(zhuān)訪時(shí)介紹,深度學(xué)習(xí)模型一般有兩個(gè)階段,訓(xùn)練階段和在線推理階段,兩個(gè)階段對(duì)計(jì)算力的要求不同,訓(xùn)練階段處理大量數(shù)據(jù),需要服務(wù)器有高吞吐量,推理階段則更需要快速響應(yīng)用戶(hù)要求。這就有點(diǎn)像送貨,追求大容量可以用卡車(chē),量小但是要求快可以用跑車(chē)。
因此,在原有的GPU實(shí)例GN5的基礎(chǔ)上,阿里云推出了適用于深度學(xué)習(xí)在線推理階段的新一代GPU實(shí)例GN5i。龍欣介紹,后者采用了專(zhuān)有推理型GPU,英偉達(dá) Pascal架構(gòu)P4圖形處理器,時(shí)延低可達(dá)微秒級(jí);另外,GN5i可一鍵部署TensorFlow、Caffe等主流深度學(xué)習(xí)框架,提供智能調(diào)度、自動(dòng)運(yùn)維、實(shí)時(shí)擴(kuò)容等服務(wù),降低人工智能在線服務(wù)成本50%以上。
除了GPU這類(lèi)主流的加速器之外,F(xiàn)PGA成了異構(gòu)計(jì)算近些年的新寵。阿里云異構(gòu)計(jì)算負(fù)責(zé)人張獻(xiàn)濤解釋?zhuān)珿PU、FPGA和AISC是不同類(lèi)型的加速器,適用于不同場(chǎng)景,擁有不同的開(kāi)發(fā)難度和市場(chǎng)。
其中,GPU是目前比較主流的通用并行加速器;FPGA是一種可編程的加速器,讓自定義加速算法,提供靈活場(chǎng)景化并行計(jì)算能力,阿里云技術(shù)專(zhuān)家游亮介紹,F(xiàn)PGA在低位寬場(chǎng)景有明顯優(yōu)勢(shì)。相比基于GPU的異構(gòu)計(jì)算產(chǎn)品,F(xiàn)PGA更適合金融分析、基因匹配、深度學(xué)習(xí)和物聯(lián)網(wǎng)等對(duì)業(yè)務(wù)有快速迭代計(jì)算需求的領(lǐng)域。
阿里云2017年初推出了基于英特爾Arria 10芯片的FPGA計(jì)算實(shí)例,此次發(fā)布的F2實(shí)例基于賽靈思Xilinx KU115器件。
版的淘寶:IP市場(chǎng)
有趣的是,阿里云針對(duì)FPGA特性,推出了一個(gè)FPGA鏡像市場(chǎng),這有點(diǎn)像一個(gè)FPGA版的應(yīng)用市場(chǎng)。
由于FPGA的靈活性,在編好一套加速算法之后,其實(shí)可以將這套算法輸出。傳統(tǒng)的售賣(mài)方式是,為了避免自己的算法泄漏,需要從上游購(gòu)買(mǎi)芯片,然后將芯片電路板燒好,后賣(mài)給終端用戶(hù)。
阿里云的PFGA鏡像市場(chǎng)推出后,可以將自己的加速方案算法(IP)放到這個(gè)市場(chǎng)上,終端用戶(hù)如果需要用可以直接從市場(chǎng)購(gòu)買(mǎi)算法使用權(quán),然后從阿里云購(gòu)買(mǎi)FPGA芯片。
除了提供一個(gè)FPGA版的淘寶之外,阿里云還提供一個(gè)彈性的FPGA開(kāi)發(fā)平臺(tái)。FPGA加速算法的門(mén)檻高,技術(shù)因素之外,還與其相關(guān)開(kāi)發(fā)套件和測(cè)試環(huán)境的授權(quán)費(fèi)高昂有關(guān),后者費(fèi)用一年可能達(dá)到數(shù)十萬(wàn)美金,但實(shí)際上閑置的時(shí)候可能很多,如果阿里云從國(guó)外廠商購(gòu)買(mǎi)版權(quán)之后,推出少量使用免費(fèi),超量按需求付費(fèi)模式,降低FPGA IP的開(kāi)發(fā)門(mén)檻。
此前,阿里云就推出了類(lèi)似的鏡像市場(chǎng),當(dāng)時(shí)推出的是Docker鏡像市場(chǎng)??傮w而言,這套思路很阿里:開(kāi)個(gè)平臺(tái),搭好基礎(chǔ)設(shè)施讓你在上面交易,同時(shí)平臺(tái)提供一堆解決方案。聽(tīng)起來(lái)是不是很像一套版的淘寶,況且還依靠公有云本身龐大的客戶(hù)數(shù)和生態(tài),似乎是巨頭的生意。
不過(guò),據(jù)阿里云的幾位專(zhuān)家介紹,國(guó)內(nèi)FPGA的生態(tài)尚未完善,雖然懂開(kāi)發(fā)的人不少,但目前跟他們合作到PFGA平臺(tái)上準(zhǔn)備上線產(chǎn)品的企業(yè)也不到三位數(shù)。這個(gè)市場(chǎng)還屬于一個(gè)搶占未來(lái)的產(chǎn)品。盡管GPU還是主流,但是包括AWS、微軟和谷歌等公有云廠商,都非??春肍PGA的前景。
云人工智能布局進(jìn)入生態(tài)之爭(zhēng)
針對(duì)傳統(tǒng)對(duì)高性能計(jì)算有強(qiáng)烈需求的高??蒲袡C(jī)構(gòu)和企業(yè)用戶(hù),阿里云異構(gòu)計(jì)算家族還包含了彈性高性能計(jì)算實(shí)例E-HPC。
高性能計(jì)算又稱(chēng)為又稱(chēng)為并行計(jì)算和超級(jí)計(jì)算,常應(yīng)用于解決大規(guī)模的科學(xué)、工程和商業(yè)問(wèn)題,比如氣象預(yù)報(bào)、工程計(jì)算、基因分析、油藏探測(cè)、量子化學(xué)等領(lǐng)域,可以利用該技術(shù)模擬核爆炸、分子運(yùn)動(dòng)、汽車(chē)撞擊等場(chǎng)景。據(jù)游亮介紹,異構(gòu)計(jì)算其實(shí)開(kāi)始是用在高性能計(jì)算場(chǎng)景中。
從前,如果企業(yè)或者科研機(jī)構(gòu)有使用高性能計(jì)算的需求,需要到國(guó)家超算中心申請(qǐng)、排隊(duì)。如今隨著高性能計(jì)算的需求爆發(fā),制藥和汽車(chē)企業(yè)對(duì)此需求增長(zhǎng),但并非所有企業(yè)都有能力建設(shè)一座超算中心。因此,在云上“建立超算中心”的實(shí)踐在國(guó)外已經(jīng)相對(duì)普遍。
E-HPC屬于PaaS層的服務(wù),基于異構(gòu)計(jì)算云平臺(tái)在高性能虛擬化、并行計(jì)算和低延遲網(wǎng)絡(luò)等方面的特性,提供的是高性能計(jì)算集群計(jì)算能力、調(diào)度能力和軟件能力,客戶(hù)可以按需組建自己的“云上超算中心”,并可實(shí)現(xiàn)一鍵部署和彈性伸縮。阿里云稱(chēng)其為中國(guó)公共云上的HPC as a Service產(chǎn)品,同時(shí)提供混合云解決方案。
目前,阿里巴巴集團(tuán)內(nèi)部很多業(yè)務(wù)使用異構(gòu)計(jì)算,比如拍立淘、以圖搜圖、商品分類(lèi)等,使用阿里云異構(gòu)計(jì)算的企業(yè)客戶(hù)有數(shù)千家,其中包含微博、陌陌、華大基因、中國(guó)工程院等。
從阿里云這次發(fā)布全套異構(gòu)計(jì)算家族的動(dòng)作來(lái)看,顯然他們想傳遞給的并不是我有不同的ECS這么簡(jiǎn)單。說(shuō)到底,異構(gòu)計(jì)算云服務(wù)器實(shí)例總歸是花錢(qián)就能買(mǎi)到的東西,趨于同質(zhì),公有云廠商能做的是盡量推出新高性能的產(chǎn)品,面向不同的場(chǎng)景提供垂直化的方案也是差異化競(jìng)爭(zhēng)的需要。
除此之外,阿里云還有相應(yīng)的PaaS層服務(wù),提供相應(yīng)加速器場(chǎng)景下一鍵部署、快速研發(fā)和彈性伸縮等能力,同時(shí)針對(duì)人工智能、高性能計(jì)算和大數(shù)據(jù)等業(yè)務(wù)場(chǎng)景推出了專(zhuān)門(mén)的調(diào)度平臺(tái),以降低企業(yè)的使用門(mén)檻和運(yùn)維壓力。
同時(shí),阿里云也推出相應(yīng)的IP交易市場(chǎng),對(duì)接和終端用戶(hù)。從底層的IaaS到SaaS層的具體解決方案,阿里嘗試顯然提供一個(gè)生態(tài)。36氪此前報(bào)道就指出,云服務(wù)市場(chǎng)將是垂直之爭(zhēng)與生態(tài)建設(shè),企業(yè)對(duì)云的需求也更加的垂直化和場(chǎng)景化;同時(shí),未來(lái)公有云廠商技術(shù)上與其他廠商的差距會(huì)逐漸縮小,提供的產(chǎn)品隨著市場(chǎng)的成熟也會(huì)趨同,因此,要留著客戶(hù),也許更重要的是要提供更好的生態(tài)和打造自身品牌。
隨著產(chǎn)業(yè)往人工智能時(shí)代越走越深,對(duì)相關(guān)解決方案的需求也會(huì)越來(lái)越大,誰(shuí)在時(shí)代初期就搶占“未來(lái)”的市場(chǎng),誰(shuí)將是贏家。
(原標(biāo)題:阿里云發(fā)布異構(gòu)計(jì)算產(chǎn)品家族,要為人工智能加一把火)