來源:中國電商物流網(wǎng) 發(fā)布時(shí)間:2019-10-9 9:3
近日,在荷蘭阿姆斯特丹舉行的OCP Regional Summit 2019大會(huì)上,百度與浪潮聯(lián)合發(fā)布了全球首款基于OCP OAI標(biāo)準(zhǔn)(開放加速器基礎(chǔ)設(shè)施)和液冷的AI計(jì)算新品X-MAN 4.0。
X-MAN 4.0是百度超級(jí)AI計(jì)算平臺(tái)X-MAN系列產(chǎn)品的第四代,浪潮作為百度的重要合作伙伴之一,一直參與X-MAN系列產(chǎn)品的研發(fā)和生產(chǎn),并X-MAN 4.0作為其目前在超級(jí)AI計(jì)平臺(tái)上的最強(qiáng)有力產(chǎn)品推出。
X-MAN系列,從1.0到4.0
X-MAN系列是百度用于超大規(guī)模AI訓(xùn)練的專用平臺(tái),已在百度的數(shù)據(jù)中心大規(guī)模應(yīng)用。其中,第一代X-MAN 1.0首次實(shí)現(xiàn)了AI計(jì)算硬件解耦架構(gòu);第二代X-MAN 2.0首次將冷板式液冷散熱技術(shù)應(yīng)用到AI計(jì)算產(chǎn)品里;第三代X-MAN 3.0則首次提出了模塊化標(biāo)準(zhǔn)化設(shè)計(jì)的理念。
第四代X-MAN 4.0作為全球首款基于OCPOAI標(biāo)準(zhǔn)(開放加速器基礎(chǔ)設(shè)施)和液冷的AI計(jì)算新品,平臺(tái)的單節(jié)點(diǎn)能夠支持8個(gè)AI加速器。這些加速器之間采用了8port HCM(Hybrid Cube Mesh)的互聯(lián)架構(gòu),雙向通信帶寬高達(dá)56GBps,充分保證AI加速器的性能。
而在單個(gè)機(jī)柜層面,X-MAN 4.0最大可支持32個(gè)AI加速器構(gòu)建互聯(lián)集群,很好的增強(qiáng)了平臺(tái)可擴(kuò)展性。
X-MAN 4.0符合ODCC 3.0整機(jī)柜規(guī)范,高度為4SU(182.5mm),寬21英寸(536.0mm),長度850mm,支持風(fēng)冷、液冷散熱方式,并采用了更高效的48V供電方式。
百度超級(jí)AI計(jì)算平臺(tái)X-MAN 4.0
OCP社區(qū)與OAI標(biāo)準(zhǔn)
OCP(Open Compute Project)即開放計(jì)算項(xiàng)目,它是由Facebook攜英特爾、Rackspace等公司于2011年成立的一個(gè)非營利組織,目的是與普通的IT產(chǎn)業(yè)共享更高效的服務(wù)器和數(shù)據(jù)中心設(shè)計(jì)。同時(shí),它也是全球云計(jì)算基礎(chǔ)硬件技術(shù)領(lǐng)域覆蓋面最廣、最有影響力的開源組織。
而OAI(Open Archives Initiative)標(biāo)準(zhǔn)是OCP社區(qū)里由百度主導(dǎo)并聯(lián)合Facebook、Microsoft等針對(duì)AI硬件加速模塊和系統(tǒng)設(shè)計(jì)所制定的標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)用于指導(dǎo)AI硬件加速模塊和系統(tǒng)設(shè)計(jì),它集合定義了AI硬件加速模塊本身、主板、互聯(lián)拓?fù)、機(jī)箱、供電、散熱以及系統(tǒng)管理等一系列設(shè)計(jì)規(guī)范。
目前,OAI標(biāo)準(zhǔn)也得到了眾多社區(qū)成員的支持,包括:Facebook、Microsoft、Google等互聯(lián)網(wǎng)企業(yè),Intel、AMD、高通等AI芯片企業(yè),及浪潮、IBM、聯(lián)想等系統(tǒng)供應(yīng)商。
獲得眾多企業(yè)成員支持的 OAI標(biāo)準(zhǔn)
打造全球標(biāo)準(zhǔn),加速AI進(jìn)程
可以看到,由百度主導(dǎo)的OAI標(biāo)準(zhǔn)定義,在一定程度上推動(dòng)了AI新硬件技術(shù)全球范圍內(nèi)的創(chuàng)新與進(jìn)步。
OAI標(biāo)準(zhǔn)的推行,不僅能夠直接使得相關(guān)廠商統(tǒng)一AI硬件加速模塊和系統(tǒng)設(shè)計(jì),提高多元化AI加速芯片兼容性;而且還有利于促進(jìn)不同AI加速器技術(shù)的開放融合,從而讓AI計(jì)算平臺(tái)設(shè)計(jì)更加敏捷,產(chǎn)業(yè)配套更為簡化。
百度副總裁侯震宇曾表示:“OAI標(biāo)準(zhǔn)將極大提高不同AI硬件加速模塊和系統(tǒng)的互操作性,加速新AI硬件加速模塊的大規(guī)模落地應(yīng)用,全球AI硬件生態(tài)系統(tǒng)都會(huì)從中受益。”這也代表了百度將自身在AI領(lǐng)域的最佳實(shí)踐共享至國際AI社區(qū)的初心。