2020年一開(kāi)局,新冠病毒就給全球一個(gè)“暴擊”,所有人都不得不面對(duì)這場(chǎng)危機(jī)。
但危機(jī)也意味“危中有機(jī)”。
在線會(huì)議迎來(lái)了爆發(fā),僅釘釘一個(gè)平臺(tái),全國(guó)超過(guò)2億人實(shí)現(xiàn)了在線辦公,1.2億學(xué)生在線上課。
互聯(lián)網(wǎng)技術(shù)二十年的發(fā)展,讓這些數(shù)字不足為奇。
但是恐怕不會(huì)有太多人注意到, 疫情的爆發(fā)也讓AI技術(shù)浮出水面,乃至悄然滲透到我們?nèi)粘I畹慕锹洌?/p>
AI醫(yī)療用于核酸檢測(cè)、肺部CT檢查;機(jī)器人技術(shù)保證疫情期間的生產(chǎn)得以繼續(xù)進(jìn)行;人臉檢測(cè)用于跟蹤和防控病毒傳播。
在這一切看得見(jiàn)的技術(shù)之下,還有更多看不見(jiàn)的基建設(shè)施在背后提供。僅AI醫(yī)療影像每天要處理上萬(wàn)張CT圖像,需要服務(wù)器進(jìn)行大量的訓(xùn)練和推理運(yùn)算。
如果沒(méi)有強(qiáng)大的算力資源作后盾,AI技術(shù)也只是“巧婦難為無(wú)米之炊”。
因此,國(guó)家在3月提出了新基建:加快5G網(wǎng)絡(luò)、數(shù)據(jù)中心等新型基礎(chǔ)設(shè)施建設(shè)進(jìn)度。
誰(shuí)來(lái)提供巨大的算力需求?
在4月9日浪潮2020年云數(shù)據(jù)中心合作伙伴大會(huì)(IPF2020)上,浪潮發(fā)表了對(duì)于未來(lái)數(shù)據(jù)中心演進(jìn)趨勢(shì)的獨(dú)到見(jiàn)解
智算中心,為AI時(shí)代“發(fā)電”
大會(huì)一開(kāi)始,浪潮集團(tuán)執(zhí)行總裁、首席科學(xué)家王恩東便以電力為比喻,告訴我們算力在AI時(shí)代的基礎(chǔ)地位。
工業(yè)時(shí)代,電力是推動(dòng)社會(huì)進(jìn)步的基礎(chǔ),而算力則是我們這個(gè)AI時(shí)代的電力。
擁有業(yè)內(nèi)最強(qiáng)最全面的AI計(jì)算產(chǎn)品系列的浪潮自然沖在提升算力的第一線。
增加發(fā)電量可以堆砌燃料,但提升算力可不僅僅靠堆砌硬件。
在王恩東看來(lái),圍繞算力要在四個(gè)關(guān)鍵作業(yè)環(huán)節(jié)做出創(chuàng)新:生產(chǎn)算力、聚合算力、調(diào)度算力、釋放算力。
生產(chǎn)算力就是要以硬件為基礎(chǔ),不能僅僅靠硬件,但沒(méi)有強(qiáng)大的硬件卻萬(wàn)萬(wàn)不可能。
近年來(lái),浪潮推出了多款強(qiáng)大的AI算力機(jī)組:AGX-5是目前全球最高性能的AI計(jì)算主機(jī)之一,AGX-2是目前單位空間內(nèi)GPU計(jì)算密度最高的服務(wù)器,MX1是全球首個(gè)可支持多家不同型號(hào)AI芯片的AI開(kāi)放加速系統(tǒng)。
有了強(qiáng)大的硬件設(shè)備,就能訓(xùn)練更強(qiáng)的AI模型。
借助浪潮的超大規(guī)模AI計(jì)算框架LMS,浪潮首先實(shí)現(xiàn)了70億參數(shù)自然語(yǔ)言處理模型的訓(xùn)練,相比主流的BERT模型參數(shù)量提升了20倍。
在提升單機(jī)的計(jì)算能力后,浪潮依托數(shù)據(jù)中心來(lái)聚合算力。
比如,浪潮NX20智能網(wǎng)絡(luò)加速產(chǎn)品可以打造更高效率更低延遲的云中心,而針對(duì)高并發(fā)推理集群,浪潮通過(guò)構(gòu)建高性能存儲(chǔ)池和深度優(yōu)化軟件棧,吞吐能力提升3.5倍以上。
全面升級(jí)的浪潮AI軟件
如果說(shuō)這生產(chǎn)算力和聚合算力相當(dāng)于制造發(fā)電機(jī)和并網(wǎng)發(fā)電,那么調(diào)度算力和釋放算力就是把電力以最高效的方式輸送到最需要的地方,更需要在軟件上優(yōu)化。
正因如此,硬件廠商的浪潮近年來(lái)在AI軟件方面也有大量投入,甚至軟件開(kāi)發(fā)人員數(shù)量已經(jīng)超過(guò)硬件。
對(duì)客戶而言,要在有限的硬件成本上充分利用算力,唯有在軟件上的提升,才能實(shí)現(xiàn)AI算力的釋放。
浪潮AI&HPC總經(jīng)理劉軍認(rèn)為:
要生產(chǎn)算力,光有非常好的硬件實(shí)際上還是不夠的,如何把更大規(guī)模的計(jì)算挑戰(zhàn)在當(dāng)前的硬件平臺(tái)上實(shí)現(xiàn),我們還需要有非常強(qiáng)大的軟件優(yōu)化產(chǎn)品和技術(shù),使得我們充分釋放AI計(jì)算的算力。
所以,浪潮早在2017年就推出了深度學(xué)習(xí)訓(xùn)練平臺(tái)AIStation。
AIStation支持多種深度學(xué)習(xí)框架,可以快速部署深度學(xué)習(xí)訓(xùn)練環(huán)境,管理深度學(xué)習(xí)訓(xùn)練任務(wù),實(shí)現(xiàn)對(duì)硬件算力的管理和調(diào)配。提高計(jì)算資源的利用率和生產(chǎn)率,為深度學(xué)習(xí)用戶提供高效易用的平臺(tái)。
今年的IPF上,浪潮又重磅發(fā)布了AIStation推理平臺(tái),全面支持訓(xùn)練與推理兩大環(huán)節(jié),將AI計(jì)算的另一塊拼圖補(bǔ)上,成為業(yè)界功能最全的AI管理平臺(tái)。
這一次的全新升級(jí)AIStation資源平臺(tái)全面支持訓(xùn)練與推理兩大環(huán)節(jié),實(shí)現(xiàn)從模型開(kāi)發(fā)、訓(xùn)練、部署、測(cè)試、發(fā)布、服務(wù)的全流程一站式高效交付,為企業(yè)用戶提供更全面的服務(wù)。
平臺(tái)已經(jīng)搭建完成。萬(wàn)事俱備,只欠東風(fēng)。開(kāi)發(fā)技術(shù)可能又是橫在企業(yè)面前的一道難題。
為了解決傳統(tǒng)企業(yè)在AI落地上面臨的技術(shù)能力不足、人員匱乏的情況。
浪潮發(fā)現(xiàn)在面對(duì)AI客戶時(shí),這些企業(yè)最大的問(wèn)題是缺乏專(zhuān)家,很難花費(fèi)大量的人力物力去開(kāi)發(fā)AI應(yīng)用,
而AutoML是現(xiàn)在AI民主化的一個(gè)極有前景的研究方向。不需要太多AI專(zhuān)業(yè)知識(shí),即可根據(jù)需求自動(dòng)開(kāi)發(fā)模型。
浪潮將這一些列軟件打包為AutoML套件(AutoML Suite),能夠從海量的數(shù)據(jù)里面,自動(dòng)產(chǎn)生跟AI相關(guān)的高技術(shù)模型,降低了企業(yè)使用AI的門(mén)檻。
AutoML Suite中包含自動(dòng)搜索網(wǎng)絡(luò)的AutoNAS、自動(dòng)調(diào)參的AutoTune和自動(dòng)壓縮剪枝的AutoPrune,解決了從開(kāi)發(fā)設(shè)計(jì)到訓(xùn)練再到部署過(guò)程中的每個(gè)難點(diǎn)。
同時(shí)AutoML Suite還能保證在用戶開(kāi)發(fā)時(shí)數(shù)據(jù)的隱私保密性,又解決了企業(yè)在考慮上云時(shí)存在的擔(dān)憂。
而有了浪潮的這兩件工具,過(guò)去需要幾個(gè)專(zhuān)家開(kāi)發(fā)數(shù)月的模型,現(xiàn)在可能只需一兩人在幾天內(nèi)完成開(kāi)發(fā),過(guò)去需要數(shù)天才能部署到設(shè)備的模型,現(xiàn)在只需幾分鐘。
在AI算力四大作業(yè)環(huán)節(jié)的加持下,智算中心已可以對(duì)外提供一站式AI算力高效供應(yīng)。
浪潮認(rèn)為,智算中心將成為新基建,為AI產(chǎn)業(yè)提供動(dòng)力,它需要滿足開(kāi)放標(biāo)準(zhǔn)、集約高效和普適普惠三個(gè)必要條件。
開(kāi)放標(biāo)準(zhǔn),要求智算中心從硬件到軟件、從芯片到架構(gòu)、從建設(shè)模式到應(yīng)用服務(wù)都應(yīng)該是開(kāi)放的、標(biāo)準(zhǔn)的;集約高效,要求智算中心的建設(shè)要有超大規(guī)模,要采用領(lǐng)先的技術(shù),保證自身的先進(jìn)性;普適普惠,則要求智算中心發(fā)揮基礎(chǔ)設(shè)施的社會(huì)價(jià)值,服務(wù)大眾。
在王恩東看來(lái),雖然對(duì)于普通人來(lái)說(shuō),智算中心看不見(jiàn)摸不著,但它就在那里,源源不斷產(chǎn)生智慧時(shí)代的動(dòng)力。智算中心,就是我們這個(gè)時(shí)代的動(dòng)力源。
評(píng)論