據(jù)該企業(yè)CEO黃仁勛詳細(xì)介紹,A100 選用tsmc那時(shí)候最優(yōu)秀的7 納米技術(shù)加工工藝打造出,有著 540 億次晶體三極管,總面積達(dá)到 826mm2,GPU 的至大功率也做到了 400W。又由于另外配用了三星 HBM2 顯卡內(nèi)存、第三代 Tensor Core和網(wǎng)絡(luò)帶寬達(dá)到600GB/s 的新版本 NVlink,英偉達(dá)顯卡的A100在好幾個(gè)主要用途也展示出強(qiáng)大的特性。
從英偉達(dá)顯卡出示的數(shù)據(jù)信息能夠見到,假如用 PyTorch 架構(gòu)跑 AI 實(shí)體模型,對(duì)比上一代 V100 處理芯片,A100 在 BERT 實(shí)體模型的訓(xùn)煉上特性提高 6 倍,BERT 推論時(shí)特性提高 7 倍。而依據(jù)MLPerf機(jī)構(gòu)在十月底公布的全新邏輯推理標(biāo)準(zhǔn)檢測(cè)(Benchmark)MLPerf Inference v0.7結(jié)果,英偉達(dá)顯卡A100 Tensor Core GPU云端邏輯推理的標(biāo)準(zhǔn)檢測(cè)特性是最優(yōu)秀intelCPU的237倍。
但英偉達(dá)顯卡不停步在此。在昨天,她們公布了朝向AI非常測(cè)算的全世界最強(qiáng)GPU——A100 80GB;此外,她們還產(chǎn)生了一體式AI大數(shù)據(jù)中心NVIDIA DGX Station A100及其NVIDIA Mellanox 400G InfiniBand商品。
全世界最強(qiáng)的AI超算GPU
據(jù)英偉達(dá)顯卡層面詳細(xì)介紹,企業(yè)全新升級(jí)的 A100 80GB GPU的較大 特性取決于選用了HBM2E內(nèi)存技術(shù),能將A100 40GB GPU的帶寬測(cè)試運(yùn)行內(nèi)存增加一倍至80GB,那樣的設(shè)計(jì)方案也讓英偉達(dá)顯卡變成業(yè)界第一個(gè)完成了2TB/s之上的內(nèi)存帶寬的
公司。
“若要得到 HPC和AI的全新科研成果,則必須搭建較大 的實(shí)體模型,而這必須比過去更高的內(nèi)存空間和高些的網(wǎng)絡(luò)帶寬。A100 80GB GPU所出示的運(yùn)行內(nèi)存是六個(gè)月前發(fā)布的上代商品的二倍,提升了每秒鐘2TB的限定,使科學(xué)研究工作人員能夠解決全世界科學(xué)研究及互聯(lián)網(wǎng)大數(shù)據(jù)層面最不容樂觀的挑戰(zhàn)。”NVIDIA運(yùn)用深度神經(jīng)網(wǎng)絡(luò)科學(xué)研究高級(jí)副總裁Bryan Catanzaro表明。
除此之外,第三代Tensor Core關(guān)鍵、MIG技術(shù)性、結(jié)構(gòu)型稀少及其第三代NVlink和NVSwitch,也是全新升級(jí)GPU可以得到 銷售市場(chǎng)認(rèn)同的確保。
從英偉達(dá)顯卡出示的材料我們可以見到,該企業(yè)的第三代Tensor Core關(guān)鍵根據(jù)全新升級(jí)TF32,能將上一代Volta構(gòu)架的AI貨運(yùn)量提升 高達(dá)20倍;根據(jù)FP64,新關(guān)鍵也是能將HPC特性提升 高達(dá)2.5倍;而根據(jù) INT8,新關(guān)鍵還可以將AI邏輯推理特性提升 高達(dá)20倍,而且適用BF16數(shù)據(jù)類型。
MIG技術(shù)性則能將單獨(dú)單獨(dú)案例的運(yùn)行內(nèi)存增加一倍,并可數(shù)最多出示七個(gè)MIG,讓每一個(gè)案例具有10GB運(yùn)行內(nèi)存。英偉達(dá)顯卡層面表明,該技術(shù)性是一種安全性的硬件配置隔離方法,在解決各種較小的工作中負(fù)荷時(shí),可完成GPU最好使用率。比如在如RNN-T等全自動(dòng)語言識(shí)別實(shí)體模型的AI邏輯推理上,單獨(dú)A100 80GB MIG案例可解決更規(guī)模性的大批量數(shù)據(jù)信息,將生產(chǎn)制造中的邏輯推理貨運(yùn)量提升 1.25倍。
對(duì)于結(jié)構(gòu)型稀少,則能夠?qū)⑦壿嬐评硐∩賹?shí)體模型的速率提升 2倍;包含第三代NVl
ink和NVSwitch以內(nèi)的新一代互聯(lián)技術(shù)性,則可使GPU中間的網(wǎng)絡(luò)帶寬提升至原先的二倍,將數(shù)據(jù)信息密集式工作中負(fù)荷的GPU數(shù)據(jù)信息傳輸速率提升 至每秒鐘600 gigabytes。
除開特性提高之外,根據(jù)A100 40GB的多元化功能分析的A100 80GB GPU也變成必須很多數(shù)據(jù)信息儲(chǔ)存空間的各種運(yùn)用的理想化挑選。
以DLRM等推薦算法實(shí)體模型為例子,她們?yōu)锳I訓(xùn)煉出示了包含數(shù)十億客戶和商品信息的大量表格。但A100 80GB可完成達(dá)到3倍加快,使
公司能夠再次迅速訓(xùn)煉這種實(shí)體模型,進(jìn)而出示更為精準(zhǔn)的強(qiáng)烈推薦;在TB級(jí)零售數(shù)據(jù)分析標(biāo)準(zhǔn)上,A100 80GB將其特性提升 了2倍,使其變成可對(duì)最規(guī)模性數(shù)據(jù)開展迅速剖析的理想化服務(wù)平臺(tái);針對(duì)科學(xué)研究運(yùn)用,A100 80GB能為天氣預(yù)告和密度泛函理論等行業(yè)出示極大的加快。
“做為NVIDIA HGX AI非常測(cè)算服務(wù)平臺(tái)的重要部件,A100 80GB還可訓(xùn)煉如GPT-2那樣的、具備大量主要參數(shù)的較大 實(shí)體模型?!庇ミ_(dá)顯卡層面注重。
下一代400G InfiniBand
在公布A100 80GB的另外,英偉達(dá)顯卡還帶了下一代的400G InfiniBand商品。在敘述英偉達(dá)顯卡的新產(chǎn)品以前,大家必須先了解一下什么叫InfiniBand。
說白了InfiniBand,是一種通信網(wǎng)絡(luò)協(xié)議書,它出示了一種根據(jù)互換的構(gòu)架,由CPU連接點(diǎn)中間、CPU連接點(diǎn)和鍵入/輸出連接點(diǎn)(如硬盤或儲(chǔ)存)中間的點(diǎn)到點(diǎn)雙重串行通信鏈接組成。每一個(gè)鏈接都是有一個(gè)聯(lián)接到鏈接兩邊的機(jī)器設(shè)備,那樣在每一個(gè)鏈接兩邊控制傳輸(推送和接受)的特點(diǎn)就被非常好地界定和操縱。而早期被英偉達(dá)顯卡回收的Mellanox則是這一行業(yè)的權(quán)威專家。
材料顯示信息,Mellanox為網(wǎng)絡(luò)服務(wù)器,儲(chǔ)存和超融合基礎(chǔ)設(shè)施建設(shè)出示包含以太網(wǎng)交換機(jī),處理芯片和InfiniBand智能化互聯(lián)解決方法以內(nèi)的很多的大數(shù)據(jù)中心商品,在其中,更以InfiniBand互聯(lián),是這種商品中頭等大事。
據(jù)英偉達(dá)顯卡詳細(xì)介紹,企業(yè)發(fā)布的第七代Mellanox InfiniBand NDR 400Gb/s上產(chǎn)生了更低的延遲時(shí)間,與上一代商品對(duì)比,新的商品也是完成了數(shù)據(jù)信息貨運(yùn)量的翻番。又由于英偉達(dá)顯卡為這一新產(chǎn)品產(chǎn)生了互聯(lián)網(wǎng)測(cè)算模塊,這就要其可以得到 附加的加快。
英偉達(dá)顯卡進(jìn)一步強(qiáng)調(diào),做為一個(gè)朝向AI非常測(cè)算的業(yè)內(nèi)最強(qiáng)勁的互聯(lián)網(wǎng)解決方法,Mellanox NDR 400G InfiniBand網(wǎng)絡(luò)交換機(jī),可出示3倍的端口號(hào)相對(duì)密度和32倍的AI加快工作能力。除此之外,它還將條式網(wǎng)絡(luò)交換機(jī)系統(tǒng)軟件的匯聚雙重貨運(yùn)量提升 了5倍,做到1.64 petabits/s,進(jìn)而使客戶可以以越來越少的網(wǎng)絡(luò)交換機(jī),運(yùn)作更高的工作中負(fù)荷。
“根據(jù)Mellanox InfiniBand構(gòu)架的邊沿網(wǎng)絡(luò)交換機(jī)的雙重總貨運(yùn)量達(dá)到51.2Tb/s,完成了具備里程碑式實(shí)際意義的每秒鐘超出665億數(shù)據(jù)文件的解決工作能力。”英偉達(dá)顯卡層面注重。而根據(jù)出示全世界唯一的徹底硬件配置卸載掉和互聯(lián)網(wǎng)測(cè)算服務(wù)平臺(tái),NVIDIA Mellanox 400G InfiniBand完成了大幅度的特性飛越,可加速有關(guān)科學(xué)研究工作中的進(jìn)度。
“大家的AI顧客的最重要的工作中便是解決日漸繁雜的應(yīng)用軟件,這必須更迅速、更智能化、更具有擴(kuò)展性的互聯(lián)網(wǎng)。NVIDIA Mellanox 400G InfiniBand的大量貨運(yùn)量和智能加速模塊使HPC、AI和集成電路工藝云基礎(chǔ)設(shè)施建設(shè)可以以更低的成本費(fèi)和多元性,完成無以倫比的特性。” NVIDIA互聯(lián)網(wǎng)副總裁Gilad Shainer表明。
從她們出示的數(shù)據(jù)信息我們可以見到,包含Atos、Dell高新科技、富士通、的浪潮、想到和SuperMicro等企業(yè)以內(nèi)的全世界領(lǐng)跑的基礎(chǔ)設(shè)施建設(shè)生產(chǎn)商,方案將Mellanox 400G InfiniBand解決方法集成化到她們的
公司級(jí)商品中去。除此之外,包含DDN、IBM Storage及其其他儲(chǔ)存生產(chǎn)商以內(nèi)的領(lǐng)跑的儲(chǔ)存基礎(chǔ)設(shè)施建設(shè)合作方也將適用NDR。
全世界唯一的千兆網(wǎng)卡級(jí)工作組服務(wù)器
為了更好地解決不一樣開發(fā)人員對(duì)AI系統(tǒng)軟件的要求,在發(fā)布處理芯片和聯(lián)接解決方法的另外,英偉達(dá)顯卡在17年還發(fā)布一體式的AI大數(shù)據(jù)中心NVIDIA DGX Station。做為全世界第一款朝向 AI 開發(fā)設(shè)計(jì)最前沿的本人高性能計(jì)算機(jī),開發(fā)人員只必須對(duì)其實(shí)行簡(jiǎn)易的設(shè)定,就可以用Caffe、TensorFlow等去做深度神經(jīng)網(wǎng)絡(luò)訓(xùn)煉、高精密圖象3D渲染和計(jì)算機(jī)的應(yīng)用等傳統(tǒng)式HPC運(yùn)用,防止了裝驅(qū)動(dòng)器和配備自然環(huán)境等不便,這很合適高等院校、研究室、及其IT能量相對(duì)性欠缺的
公司。
昨天,英偉達(dá)顯卡今天公布了全世界唯一的千兆網(wǎng)卡級(jí)工作組服務(wù)器NVIDIA DGX StationA100 。做為開拓性的第二代人工智能技術(shù)系統(tǒng)軟件,DGX Station A100加快考慮坐落于全世界全國(guó)各地的企業(yè)辦公室、科學(xué)研究組織、試驗(yàn)室或家裝小戶型中企業(yè)辦公的精英團(tuán)隊(duì)針對(duì)深度學(xué)習(xí)和計(jì)算機(jī)科學(xué)工作中負(fù)荷的明顯要求。而為了更好地適用例如BERT Large邏輯推理等繁雜的會(huì)話式AI實(shí)體模型,DGX Station A100比上一代D
GX Station加速4倍之上。針對(duì)BERT Large AI訓(xùn)煉,其特性也是提升 近3倍。
從特性看來,英偉達(dá)顯卡層面表明,DGX Station A100的AI特性達(dá)到2.5 petaflops,是唯一一臺(tái)配置四個(gè)根據(jù)NVIDIA NVl
ink徹底互聯(lián)的全新升級(jí)NVIDIA A100 Tensor Core GPU的工作組服務(wù)器,可出示達(dá)到320GB的GPU運(yùn)行內(nèi)存,可以助推
公司級(jí)計(jì)算機(jī)科學(xué)和AI行業(yè)以最速率獲得提升。
做為唯一適用NVIDIA多案例GPU(MIG)技術(shù)性的工作組服務(wù)器,單一的DGX Station A100數(shù)最多可出示28個(gè)單獨(dú)GPU案例以運(yùn)作并行任務(wù),并可不在危害系統(tǒng)軟件特性的前提條件下適用多客戶。
為了更好地適用更規(guī)模性的大數(shù)據(jù)中心工作中負(fù)荷,DGX A100系統(tǒng)軟件還將配置全新升級(jí)NVIDIA A100 80GB GPU使每一個(gè)DGX A100系統(tǒng)軟件的GPU內(nèi)存空間增加一倍(最大達(dá)到640GB),進(jìn)而保證 AI精英團(tuán)隊(duì)可以應(yīng)用更規(guī)模性的數(shù)據(jù)和實(shí)體模型來提升 精確性。
“全新升級(jí)DGX A100 640GB系統(tǒng)軟件也將集成化到商業(yè)版NVIDIA DGX SuperPODTM 解決方法,使組織能根據(jù)以20 個(gè)DGX A100系統(tǒng)軟件為企業(yè)的一站式AI高性能計(jì)算機(jī),完成規(guī)模性AI實(shí)體模型的搭建、訓(xùn)煉和布署。”英偉達(dá)顯卡層面注重。
該企業(yè)副首席戰(zhàn)略官 DGX系統(tǒng)軟件經(jīng)理Charlie Boyle則表明:“DGX Station A100將AI從大數(shù)據(jù)中心導(dǎo)入能夠在任何地方連接的網(wǎng)絡(luò)服務(wù)器級(jí)系統(tǒng)軟件。計(jì)算機(jī)科學(xué)和AI科學(xué)研究精英團(tuán)隊(duì)能夠應(yīng)用與NVIDIA DGX A100系統(tǒng)軟件同樣的
手機(jī)軟件局部變量加快她們的工作中,使其可以輕輕松松地從開發(fā)設(shè)計(jì)邁向布署?!?
從英偉達(dá)顯卡出示的材料我們可以見到,配置A100 80GB GPU的NVIDIA DGX SuperPOD系統(tǒng)軟件將首先安裝于美國(guó)的Cambridge-1高性能計(jì)算機(jī),以加快推動(dòng)保健
醫(yī)療行業(yè)科學(xué)研究,及其佛羅里
達(dá)州高校的全新升級(jí)HiPerGator AI高性能計(jì)算機(jī),該高性能計(jì)算機(jī)將賦力這一“太陽之州”進(jìn)行AI賦能的科學(xué)新發(fā)現(xiàn)。
在2020年公布的第二季財(cái)報(bào)上,英偉達(dá)顯卡大數(shù)據(jù)中心業(yè)務(wù)流程首超
手機(jī)游戲,變成企業(yè)營(yíng)業(yè)收入較大 的業(yè)務(wù)流程版塊。從營(yíng)業(yè)收入提高上看,與上年同比增加,英偉達(dá)顯卡大數(shù)據(jù)中心業(yè)務(wù)流程業(yè)務(wù)流程大幅度提高167%,從而能夠見到英偉達(dá)顯卡在這個(gè)銷售市場(chǎng)知名度的提高及其企業(yè)對(duì)這一銷售市場(chǎng)的自信心。