現(xiàn)在位置:主頁(yè) > 國(guó)內(nèi) > 專(zhuān)訪(fǎng)丨為萬(wàn)物互聯(lián)時(shí)代布局,阿里云飛天2.0做了哪些升級(jí)?

專(zhuān)訪(fǎng)丨為萬(wàn)物互聯(lián)時(shí)代布局,阿里云飛天2.0做了哪些升級(jí)?

作者:編輯 ? 時(shí)間:2018-09-21 ? 瀏覽:人次

從2009年2月飛天寫(xiě)下第一行代碼,如今這套阿里云的核心操作系統(tǒng)已經(jīng)走過(guò)9年的發(fā)展歷程。在9月19日舉行的云棲大會(huì)開(kāi)幕會(huì)上,身穿飛天第一行代碼文化衫的阿里云產(chǎn)品總監(jiān)何云飛信步上臺(tái),向外界宣布阿里云有史以來(lái)最大規(guī)模的技術(shù)升級(jí)——飛天系統(tǒng)2.0上線(xiàn)。

飛天2.0是一套面向未來(lái)萬(wàn)物智能時(shí)代的云操作系統(tǒng),不僅可滿(mǎn)足百億級(jí)設(shè)備的計(jì)算需求,而且可實(shí)現(xiàn)1EB數(shù)據(jù)存儲(chǔ)以及支持IPv6等重大更新,更大的變革來(lái)源于飛天2.0是對(duì)未來(lái)物理世界與數(shù)字世界必將融合的判斷,從而推出的分布式云管端融合的解決方案。

何云飛提到“飛天1.0”和“2.0版本”最大的區(qū)別,是飛天1.0擁有大規(guī)模數(shù)據(jù)中心調(diào)度能力,但是今天2.0的發(fā)展來(lái)自于業(yè)務(wù)更多的需求,更強(qiáng)調(diào)面向物聯(lián)網(wǎng)時(shí)代的分布式計(jì)算?!?strong>飛天2.0支撐了阿里云遍布全球的基礎(chǔ)設(shè)施,針對(duì)億萬(wàn)個(gè)端進(jìn)行廣泛適配,可覆蓋最后一公里的計(jì)算。計(jì)算是心臟,AI是大腦,IoT是神經(jīng)網(wǎng)絡(luò),這是我們對(duì)萬(wàn)物智能時(shí)代的構(gòu)想,也是飛天2.0的設(shè)計(jì)理念?!?/strong>

在發(fā)布會(huì)上,阿里巴巴集團(tuán)副總裁周明提到今天的阿里云已經(jīng)能夠提供18個(gè)區(qū)域、49個(gè)可用區(qū)、200個(gè)以上的數(shù)據(jù)中心服務(wù)客戶(hù)。并建設(shè)了全球骨干網(wǎng)連接全球的數(shù)據(jù)中心,它還接入了上百個(gè)海外的POP以及1500多家運(yùn)營(yíng)商。龐大的規(guī)模也在督促阿里云保持創(chuàng)新進(jìn)步,以更好得滿(mǎn)足客戶(hù)需求。

這次飛天2.0系統(tǒng)就是阿里云多年創(chuàng)新的一次集中亮相,阿里云創(chuàng)始員工、阿里云技術(shù)研發(fā)總經(jīng)理蔣江偉向大家介紹了阿里云新版本在計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、安全四大方面的進(jìn)步,并介紹了阿里云在物聯(lián)網(wǎng)、AI、專(zhuān)有云等層面的發(fā)展:

百億級(jí)計(jì)算解決方案:

在計(jì)算層面已經(jīng)實(shí)現(xiàn)秒級(jí)啟動(dòng)ECI、彈性計(jì)算(ESC)、異構(gòu)計(jì)算(FPGA )、高性能計(jì)算(E-HPC)等多種計(jì)算方式,同時(shí)實(shí)現(xiàn)了更彈性的部署方案,能夠在10分鐘內(nèi)啟動(dòng)10000臺(tái)服務(wù)器。神龍?jiān)品?wù)器架構(gòu)實(shí)現(xiàn)了虛擬機(jī)和物理機(jī)的融合。“計(jì)算進(jìn)入可隨意配置的時(shí)代,一行代碼即可啟動(dòng)?!?/p>

10倍性能存儲(chǔ)產(chǎn)品:

存儲(chǔ)方面阿里巴巴自研了SSD——AliFlash,目前AliFlash已經(jīng)發(fā)布三個(gè)版本。阿里云為此定制了一款SSD控制芯片,這個(gè)芯片支持了阿里巴巴Open Channel協(xié)議,這個(gè)協(xié)議可以讓本地軟件存儲(chǔ)引擎對(duì)SSD直接進(jìn)行讀寫(xiě)等操作,可將整個(gè)傳輸延遲降低10倍,并且讀寫(xiě)速度放大5倍。

加上阿里云另一款本地的存儲(chǔ)引擎——Fusionengie引擎,再配上低延時(shí)的RDMA網(wǎng)絡(luò),阿里云形成了從底層芯片到部件、到本地的規(guī)模分布式傳輸?shù)牡脱訒r(shí)能力,促進(jìn)上層整個(gè)性能放大。比如說(shuō)本地盤(pán)通過(guò)這樣的結(jié)合,能力提高了50%;對(duì)于上層的云產(chǎn)品比如ESSD,可以放大到5倍的性能提升。

規(guī)?;脱訒r(shí)網(wǎng)絡(luò):

目前已經(jīng)在阿里巴巴規(guī)模部署了雙25G、雙100G到服務(wù)器的網(wǎng)絡(luò),同時(shí)也在研發(fā)400G的網(wǎng)絡(luò)。在低延時(shí)方面,阿里通過(guò)對(duì)RDMA協(xié)議的支持,通過(guò)對(duì)運(yùn)維管理的研發(fā)、流量控制、運(yùn)算算法的研發(fā),成功部署了規(guī)模化的低延時(shí)網(wǎng)絡(luò)。

另外發(fā)布新一代的vswitch虛擬網(wǎng)絡(luò),性能提升58倍。同時(shí)飛天2.0支持IPv6,海量地址幫助企業(yè)解決邊緣設(shè)備接入難題。

AI推動(dòng)阿里云智能化

阿里云正在推動(dòng)AI芯片AliNPU的研發(fā)。除此以外,阿里云還根據(jù)FPGA非常靈活的特點(diǎn)進(jìn)行了研發(fā)。阿里云通過(guò)軟硬件結(jié)合,設(shè)計(jì)了全棧的系統(tǒng);針對(duì)神經(jīng)網(wǎng)絡(luò)CNN inference吞吐能力與GPU相比不足,阿里云的硬件架構(gòu)師和算法工程師進(jìn)行了一體化設(shè)計(jì),尤其是針對(duì)具體的架構(gòu)進(jìn)行了針對(duì)性的算法設(shè)計(jì),然后再加上低精度、稀疏化,讓整個(gè)性能得到顯著提升。

DC大腦的智能運(yùn)營(yíng)化系統(tǒng)也在云棲大會(huì)亮相。這套系統(tǒng)通過(guò)阿里云的數(shù)據(jù)、算法、模型,可以在供應(yīng)鏈領(lǐng)域、服務(wù)器、網(wǎng)絡(luò)、數(shù)據(jù)中心及應(yīng)用運(yùn)維領(lǐng)域、故障排查領(lǐng)域應(yīng)用,不斷地進(jìn)行優(yōu)化提升運(yùn)營(yíng)水平。

全面布局邊緣計(jì)算和物聯(lián)網(wǎng):

為布局物聯(lián)網(wǎng)時(shí)代,阿里云在芯片、聯(lián)網(wǎng)、管理平臺(tái)三個(gè)層面進(jìn)行了布局。發(fā)布的低功耗LoRa芯片,具有小尺寸、低功耗、超低啟動(dòng)電流的特點(diǎn)。阿里云對(duì)發(fā)布的另一款聯(lián)網(wǎng)產(chǎn)品——天空物聯(lián)網(wǎng)寄予厚望,“現(xiàn)在每個(gè)人都通過(guò)WiFi上網(wǎng),未來(lái)每個(gè)企業(yè)都通過(guò)天空物聯(lián)網(wǎng)聯(lián)網(wǎng)”。LoRa與飛艇和無(wú)人機(jī)結(jié)合可布設(shè)高機(jī)動(dòng)性大網(wǎng),物聯(lián)網(wǎng)絡(luò)管理平臺(tái)管理百萬(wàn)臺(tái)以上的網(wǎng)關(guān)、億級(jí)以上的終端。阿里云希望推動(dòng)物聯(lián)網(wǎng)時(shí)代盡快來(lái)臨。

邊緣計(jì)算也是促進(jìn)物聯(lián)網(wǎng)時(shí)代來(lái)臨的重要推動(dòng)力,這方面阿里云發(fā)布了邊緣節(jié)點(diǎn)服務(wù)ENS,可實(shí)現(xiàn)分鐘級(jí)創(chuàng)建,節(jié)省30%帶寬。Link IoT Edge在智能設(shè)備上部署邊緣計(jì)算,使得萬(wàn)物智聯(lián)。

把公有云“抱回家”的阿里專(zhuān)有云:

阿里云專(zhuān)有云是阿里云一種部署模式,它和阿里云公有云是一樣的架構(gòu)。很多大企業(yè)希望把公有云的能力完整部署在自己的數(shù)據(jù)中心,這便是阿里專(zhuān)有云的模式。

這次云棲大會(huì)上,阿里專(zhuān)有云帶來(lái)一種新的收費(fèi)模式。過(guò)去阿里專(zhuān)有云是購(gòu)買(mǎi)服務(wù)模式,現(xiàn)在可以通過(guò)License模式使用阿里專(zhuān)有云,新的模式可以通過(guò)訂閱使用,這樣做可以更加靈活,初期的投資更低,整體擁有成本也會(huì)降低。

會(huì)后阿里云技術(shù)研發(fā)總經(jīng)理蔣江偉、阿里云產(chǎn)品總監(jiān)何云飛、阿里云專(zhuān)有云事業(yè)部總經(jīng)理三位接受了包括在內(nèi)的多家媒體專(zhuān)訪(fǎng):

Q:飛天2.0相比飛天1.0有哪些跨越,飛天2.0賦予阿里云過(guò)去沒(méi)有的哪些能力?

何云飛:飛天1.0和2.0最大的區(qū)別,是飛天1.0擁有面向全球的大規(guī)模調(diào)度能力,能夠?qū)⑷驍?shù)據(jù)中心都調(diào)動(dòng)起來(lái)。但是飛天2.0更多需求發(fā)展來(lái)自于業(yè)務(wù)。我們看到原來(lái)的計(jì)算都要集中計(jì)算,未來(lái)的計(jì)算是分布式計(jì)算,我們不希望把數(shù)據(jù)拖來(lái)拖去計(jì)算,我們希望計(jì)算就直接發(fā)生在更靠近數(shù)據(jù)產(chǎn)生的地方,這樣數(shù)據(jù)計(jì)算效率更高,實(shí)施性更高,體驗(yàn)更好。所以飛天系統(tǒng)在往客戶(hù)端推進(jìn),面向未來(lái)海量的互聯(lián)網(wǎng)設(shè)備,飛天可以延伸到每一個(gè)計(jì)算的地方,這是飛天2.0最本質(zhì)的區(qū)別。

我舉一個(gè)例子,比如說(shuō)現(xiàn)在視頻數(shù)據(jù)計(jì)算要傳到云端計(jì)算完,然后再回到客戶(hù)那邊觀看,造成延時(shí)非常大的。那我能不能在靠近數(shù)據(jù)視頻產(chǎn)生那一端,直接把這個(gè)數(shù)據(jù)計(jì)算上傳。未來(lái)廣電行業(yè)的視頻數(shù)據(jù)處理量非常大,利用分布式的云端處理成本將更低,這是一個(gè)非常好的可能。

蔣江偉:我從產(chǎn)品層面介紹下,飛天是一個(gè)持續(xù)迭代的產(chǎn)品,就像安卓迭代產(chǎn)品一樣。包括神龍?zhí)幚砥黢R上推出1.5版本,神龍是一個(gè)底層架構(gòu),會(huì)外化出來(lái)很多產(chǎn)品,比如說(shuō)發(fā)布會(huì)上提到的超算。其他的儲(chǔ)如洛神2.0版本、盤(pán)古2.0版本等產(chǎn)品的各方面指標(biāo)都會(huì)更好,性?xún)r(jià)比更高。所以這里面需要我們工程師越來(lái)越多去掌控整個(gè)軟硬件。飛天1.0時(shí)代基本上以軟件為主,到2.0軟硬件都要結(jié)合起來(lái)深度定制,這也是飛天2.0版本的重要變化。

Q:飛天從9年前發(fā)展到現(xiàn)在的規(guī)模,什么原因促成阿里云的成功?

蔣江偉:第一個(gè)關(guān)鍵點(diǎn),還是馬云、王堅(jiān)博士這樣有理想、有堅(jiān)持的人,他們始終認(rèn)為這個(gè)方向是正確的。像我是因?yàn)榭匆?jiàn)了就相信了,剛開(kāi)始我也不相信的。包括阿里巴巴眾多技術(shù)、產(chǎn)品人才,也跟阿里云原來(lái)那批一起“看見(jiàn)的人”,一起沉淀出了飛天的整個(gè)技術(shù)。

第二個(gè)是由于阿里巴巴集團(tuán)本身的業(yè)務(wù)非常廣,很多業(yè)務(wù)線(xiàn)都能夠幫助試錯(cuò)。阿里云現(xiàn)在的總裁胡曉明就是阿里云第一個(gè)客戶(hù),胡總當(dāng)時(shí)是阿里金融CEO,經(jīng)常把我們飛天工程師抓到他們的辦公室,給他們修bug,改不好就別想回去,飛天就是這么一個(gè)過(guò)程走過(guò)來(lái)的。

另外規(guī)模效應(yīng)也造就了阿里云產(chǎn)品的技術(shù)紅利。因?yàn)榘⒗镌频拿恳恍写a都是細(xì)細(xì)推敲的,它的代碼都是金子、都是鉆石。我們用最好的工程師去摳每一行代碼,由于阿里云平臺(tái)的放大器作用,使得寫(xiě)的每一行代碼被放大到幾百萬(wàn)客戶(hù)的使用,這就是價(jià)值。

Q:今天看到阿里云公布了很多前沿布局產(chǎn)品,比如超算、深度學(xué)習(xí)平臺(tái)、物聯(lián)網(wǎng)等,另一方面也看到阿里云正在深入工業(yè)、農(nóng)業(yè)等傳統(tǒng)產(chǎn)業(yè)。阿里云如何獲得市場(chǎng)需求?以及如何平衡技術(shù)與市場(chǎng)驅(qū)動(dòng)產(chǎn)品發(fā)展?

何云飛:做云計(jì)算平臺(tái)是一個(gè)技術(shù)活,但是你會(huì)發(fā)現(xiàn),我們寫(xiě)算法的工程師,高級(jí)科學(xué)家,工作在客戶(hù)的廠(chǎng)房里,需求就是在那里產(chǎn)生,需求是同時(shí)被挖掘出來(lái)的。今天阿里發(fā)布了很多智能時(shí)代產(chǎn)品,但正如AI產(chǎn)品負(fù)責(zé)人在臺(tái)上提到,我們的AI不一樣的地方在于比較“冷”,阿里云將AI通用的能力,通過(guò)API低成本、低門(mén)檻的分享給客戶(hù);面向產(chǎn)業(yè)的AI是真正走進(jìn)行業(yè),幫助企業(yè)走出去看到業(yè)務(wù)的機(jī)會(huì),這是非常關(guān)鍵的。

Q:邊緣計(jì)算正在實(shí)現(xiàn)云和端的融合,阿里云如何定義未來(lái)的計(jì)算服務(wù)形態(tài)?

何云飛:未來(lái)的計(jì)算一定是從端開(kāi)始,一部分計(jì)算到端上,另一部分是數(shù)據(jù)上來(lái)之后到邊緣網(wǎng)關(guān)發(fā)生計(jì)算,然后再到云端發(fā)生計(jì)算。這里根據(jù)不同業(yè)務(wù)場(chǎng)景的需要,每個(gè)點(diǎn)完成計(jì)算的量是不一樣的。但是它一定是一個(gè)大網(wǎng),把云、端以及端跟大數(shù)據(jù)中心中間還會(huì)有一個(gè)類(lèi)似于中心點(diǎn)的這三個(gè)點(diǎn),通過(guò)網(wǎng)絡(luò)傳輸連成一張大網(wǎng),來(lái)滿(mǎn)足企業(yè)不同的業(yè)務(wù)需求。所以計(jì)算這個(gè)概念是什么?就像互聯(lián)網(wǎng)是什么,很難梳理出一個(gè)邊界。但是在這里看,它的每一次拓展都是在離客戶(hù)的需求更近。

Q:阿里專(zhuān)有云新版本升級(jí)以后,針對(duì)客戶(hù)的需求做了哪些部署?

馬勁:阿里專(zhuān)有云的能力是來(lái)自阿里云的公有云,同樣的架構(gòu)但是部署的模式不同。其實(shí)對(duì)于升級(jí)這件事情,客戶(hù)的需求很簡(jiǎn)單:一個(gè)是升級(jí)過(guò)程當(dāng)中業(yè)務(wù)不要中斷,第二個(gè)是升級(jí)了之后版本之間要兼容。阿里專(zhuān)有云是從V3這個(gè)版本開(kāi)始支持熱升級(jí)(V3的熱升級(jí)我們叫柔性升級(jí)),所有的升級(jí)都是不中斷業(yè)務(wù)的。因?yàn)槲覀儸F(xiàn)在專(zhuān)有云已經(jīng)有多達(dá)60個(gè)產(chǎn)品,所有的產(chǎn)品升級(jí),他有很多的依賴(lài)關(guān)系,包括和專(zhuān)有云的底座。我們可以做到某一個(gè)模塊升級(jí),然后對(duì)其他的所有的應(yīng)用都不影響,我們可以單獨(dú)的時(shí)間升單獨(dú)的模塊。

轉(zhuǎn)載請(qǐng)保留原文鏈接:http://parkingblocks4less.com/a/guona/20180921/13064.html上一篇:上一篇:井賢棟:未來(lái)螞蟻金服將聚焦于“BASIC”
下一篇:下一篇:沒(méi)有了