
2018年11月6日,AMD公司(NASDAQ: AMD)發(fā)布AMD Radeon Instinct MI60和 MI50加速器,作為世界首款7nm數(shù)據(jù)中心GPU,它旨在提供下一代深度學(xué)習(xí)、HPC、云計(jì)算和渲染應(yīng)用程序所需的計(jì)算性能。研究人員、科學(xué)家和開(kāi)發(fā)者利用 AMD Radeon Instinct?加速器解決困難問(wèn)題和趣味性的挑戰(zhàn),比如大規(guī)模模擬、氣候變化、計(jì)算生物學(xué)、疾病預(yù)防等。
AMDRadeon 技術(shù)事業(yè)部研發(fā)高級(jí)副總裁王啟尚(DavidWang)表示:“傳統(tǒng)的GPU架構(gòu)限制了IT管理者處理不斷變化需求和分析現(xiàn)代云數(shù)據(jù)中心工作負(fù)載數(shù)據(jù)集的效率,將頂級(jí)的性能和靈活的架構(gòu)與強(qiáng)大的軟件平臺(tái)和業(yè)界領(lǐng)先的ROCm開(kāi)放式軟件生態(tài)系統(tǒng)相結(jié)合,全新的AMD Radeon Instinct?加速器不管在今天還是未來(lái),都成為解決云端計(jì)算挑戰(zhàn)的重要組件。”
AMD Radeon Instinct? MI60 和MI50加速器具有靈活的混合精度能力,搭載高性能計(jì)算單元,能夠處理多種類(lèi)型的工作負(fù)載,包括一系列的HPC和深度學(xué)習(xí)應(yīng)用程序。全新的AMD Radeon Instinct? MI60 和MI50加速器,旨在高效地處理工作流,比如快速訓(xùn)練復(fù)雜的神經(jīng)網(wǎng)絡(luò),為數(shù)據(jù)中心和部門(mén)部署提供更高級(jí)別的浮點(diǎn)性能,功能和高效性。
AMD Radeon Instinct? MI60 和MI50加速器提供高速的浮點(diǎn)性能,并擁有HBM2(第二代高帶寬顯存),顯存帶寬速度高達(dá)1TB/s。同時(shí),它們也是第一個(gè)能夠支持下一代PCIe? 4.02互聯(lián)的GPU,比較其他的x86 CPU和GPU互聯(lián)技術(shù)3快2倍,另外它們還支持AMD Infinity Fabric? Link GPU互聯(lián)技術(shù),允許GPU和GPU 之間通信,比傳統(tǒng)的PCIe? Gen 3互聯(lián)速度快6倍。
AMD另外還發(fā)布了用于加速計(jì)算的全新ROCm開(kāi)放式軟件平臺(tái),該平臺(tái)支持新加速器的架構(gòu)特性,包括具有優(yōu)化性的深度學(xué)習(xí)操作(DLOPS)和AMD Infinity Fabric? Link GPU互聯(lián)技術(shù)。ROCm 為規(guī)模化而設(shè)計(jì),允許客戶(hù)在開(kāi)放式的環(huán)境中部署高性能、高能效的異構(gòu)計(jì)算系統(tǒng)。
谷歌TensorFlow項(xiàng)目的工程總監(jiān),Rajat Monga表示:“谷歌相信開(kāi)源對(duì)每個(gè)人都有利,我們已經(jīng)看到開(kāi)源機(jī)器學(xué)習(xí)技術(shù)是多么有幫助,我們很高興看到AMD接受它。通過(guò)ROCm開(kāi)放式軟件平臺(tái),TensorFlow用戶(hù)將在GPU加速和強(qiáng)大的開(kāi)源機(jī)器學(xué)習(xí)生態(tài)系統(tǒng)中受益。”
AMD Radeon Instinct? MI60和MI50加速器,包括以下主要功能:
●優(yōu)化深度學(xué)習(xí)操作:支持靈活的混合精度FP16,F(xiàn)P32性能和INT4/INT8,來(lái)滿(mǎn)足動(dòng)態(tài)和不斷變化的工作負(fù)載需求,包括訓(xùn)練復(fù)雜的神經(jīng)網(wǎng)絡(luò)到對(duì)訓(xùn)練過(guò)的網(wǎng)絡(luò)進(jìn)行推理。
●超高速的雙精度PCIe?2加速器5:AMD Radeon Instinct? MI60 加速器是世界上最快的雙精度PCIe? 加速器,擁有高達(dá)7.4 TFLOPS 峰值 FP64性能,使科學(xué)家和研究人員高效地處理各種工業(yè)化的HPC應(yīng)用程序,包括生命科學(xué)、能源、金融、汽車(chē)、航空航天、學(xué)術(shù)、政府、國(guó)防等。AMD Radeon Instinct? MI50,擁有6.7 TFLOPS FP64 的峰值性能,能夠在各種深度學(xué)習(xí)工作負(fù)載下,提供高效的解決方案,同時(shí)在虛擬桌面基礎(chǔ)架構(gòu)(VDI)、桌面即服務(wù)(DaaS)和云環(huán)境下高度重用。
●高達(dá)6倍速數(shù)據(jù)傳輸:通過(guò)兩個(gè)Infinity Fabric? Link之間互聯(lián),每個(gè)GPU的對(duì)等帶寬速度到達(dá)200GB/s,比單獨(dú)的PCIe 3.0 快6倍,同時(shí)在hive配置里支持4個(gè)GPU連接(8個(gè)GPU的服務(wù)器裝載2個(gè)hive)
●高速的HBM2顯存:AMD Radeon Instinct? MI60的HBM2糾錯(cuò)碼(ECC)顯存容量達(dá)到32 GB,而Radeon Instinct? MI50的HBM2 ECC顯存容量達(dá)到16 GB。兩款顯卡都支持全芯片ECC和可靠性、可用性、可維修性(RAS)技術(shù),這對(duì)于大規(guī)模的HPC部署和計(jì)算結(jié)果的準(zhǔn)確性非常重要。
●安全虛擬化工作負(fù)載支持:AMD MxGPU技術(shù),業(yè)界唯一基于硬件的GPU虛擬化解決方案,基于行業(yè)標(biāo)準(zhǔn)的SR-IOV(單根I/O虛擬化)技術(shù),使黑客難以入侵到硬件級(jí)別,更有助于為虛擬化云端部署提供更好的安全性。
全新的ROCm開(kāi)放式軟件平臺(tái)
AMD今天還發(fā)布了全新版本的ROCm開(kāi)放式軟件平臺(tái),旨在加速高性能和高效的異構(gòu)計(jì)算系統(tǒng)的發(fā)展。另外還支持全新的Radeon Instinct?加速器,ROCm軟件版本2.0為新的DLOPS更新了數(shù)學(xué)庫(kù);支持64為L(zhǎng)inux操作系統(tǒng),包括CentOS、RHEL和Ubuntu;優(yōu)化了現(xiàn)有的組件;支持最新版本的深度學(xué)習(xí)框架,包括TensorFlow 1.11、PyTorch (Caffe2)和其他。