來源:中國電子報(bào) 發(fā)布時(shí)間:2022-4-25 9:33
當(dāng)今社會(huì),新興技術(shù)和應(yīng)用不斷涌現(xiàn),無論是以數(shù)據(jù)中心和云計(jì)算為代表的高性能計(jì)算應(yīng)用,還是以手機(jī)為代表的消費(fèi)類應(yīng)用,對處理器算力的需求都越來越高,且要處理的信息也越來越復(fù)雜,單一類型的架構(gòu)和處理器已經(jīng)無法勝任。既要保證算力和性能,又要具備多類型任務(wù)的處理能力,還要控制好功耗和成本,滿足以上要求的異構(gòu)計(jì)算已然成為解決算力瓶頸的重要方式,為計(jì)算帶來全新可能性。近日,英特爾研究院副總裁、英特爾中國研究院院長宋繼強(qiáng)接受了《中國電子報(bào)》記者獨(dú)家專訪,發(fā)表了對異構(gòu)計(jì)算未來發(fā)展方向的看法。
異構(gòu)計(jì)算面臨三大瓶頸
記者:異構(gòu)計(jì)算當(dāng)前的市場發(fā)展情況是怎樣的?有哪些亟待突破的技術(shù)難點(diǎn)?
宋繼強(qiáng):異構(gòu)計(jì)算目前面臨幾個(gè)瓶頸。一是技術(shù)設(shè)計(jì)流程的協(xié)同問題。如果做一個(gè)不帶Chiplet(芯粒)先進(jìn)封裝的芯片,如SoC,所有的設(shè)計(jì)都可以在前端設(shè)計(jì)軟件里完成,再到后端工藝流片。但如果未來這個(gè)芯片要與其他不同廠商的芯;ヂ(lián)互通、協(xié)同工作,為了保證傳輸通路不出現(xiàn)問題,在開始協(xié)同工作前,可能就需要TSV(硅通孔)工藝。這就需要提前知道這個(gè)芯片是否要打孔?怎么打?留多少空間?這些問題都會(huì)影響到包括后端設(shè)計(jì)軟件和前端設(shè)計(jì)的整個(gè)流程,和現(xiàn)在的設(shè)計(jì)流程不太一樣。
二是需要統(tǒng)一各個(gè)廠商芯粒之間的互連標(biāo)準(zhǔn)。未來全球各大芯片制造商、科技巨頭的芯粒可能會(huì)集成在一個(gè)芯片上,目前它們相互之間的互連標(biāo)準(zhǔn)并不統(tǒng)一,不同的廠商有不同的設(shè)計(jì)標(biāo)準(zhǔn),所能支持的速率、間距、功耗等都不一致,各個(gè)廠商之間并沒有做好互聯(lián)互通的準(zhǔn)備。最近英特爾攜手其他企業(yè),推出了UCIe標(biāo)準(zhǔn),未來就可以把不同廠商的芯粒連到一起,形成一個(gè)符合要求的、大的、封裝級的集成芯片。
三是軟件層面要過關(guān)。有的芯片需要編程才能更好地使用,這就是英特爾跨平臺(tái)、開放的編程模型oneAPI帶來的好處,不同廠商的計(jì)算芯片怎么樣做出最好的I/O、內(nèi)存通道,這些在英特爾oneAPI的底層庫都能體現(xiàn)。
綜合來說,我認(rèn)為異構(gòu)計(jì)算在技術(shù)方面、互連方面和軟件方面都面臨瓶頸,仍然不能滿足未來的要求,所以英特爾oneAPI仍將繼續(xù)演進(jìn)。
記者:異構(gòu)計(jì)算是否會(huì)成為下一個(gè)全球競爭點(diǎn)?未來英特爾在異構(gòu)計(jì)算方面會(huì)有怎樣的布局呢?
宋繼強(qiáng):異構(gòu)已經(jīng)成為新的全球競爭熱點(diǎn)。現(xiàn)在主流的芯片供應(yīng)商都想把異構(gòu)的布局變得更加完整。想要在異構(gòu)競爭中脫穎而出,一是要有不同架構(gòu)的積累。二是在不同的工藝節(jié)點(diǎn)上有不同的資源可以利用。三是提前布局和規(guī)劃封裝級別的技術(shù)。異構(gòu)需要布局架構(gòu)、生產(chǎn)工藝以及封裝技術(shù),這都是為了建立未來更加完整的異構(gòu)生態(tài)。因?yàn)樯鷳B(tài)里會(huì)包含不同架構(gòu)的IP模塊或芯粒模塊,在不同的制程工藝上,能以最好的性價(jià)比生產(chǎn)這些模塊,還要能夠用最標(biāo)準(zhǔn)的方法把它們串連起來。四是需要有一套方便且好用的軟件,只需上層應(yīng)用者指定功能需求,下層就可以隨著異構(gòu)變化自動(dòng)遷移。
異構(gòu)是“東數(shù)西算”的底層支撐
記者:您覺得“東數(shù)西算”工程會(huì)為芯片產(chǎn)業(yè)帶來什么樣的作用?您對“東數(shù)西算”工程有怎樣的建議呢?
宋繼強(qiáng):“東數(shù)西算”是非常棒的工程。首先,這個(gè)工程非常精準(zhǔn)地看到了未來在數(shù)字化轉(zhuǎn)型之后,所需要的大量算力,而算力本身又分成很多種,并不是建一個(gè)大的計(jì)算中心就能解決所有問題。所以要先將算力網(wǎng)搭建起來,按照數(shù)據(jù)的產(chǎn)生和算力的使用情況,基本上就形成了一個(gè)比較完美的布局。
“東數(shù)西算”希望能節(jié)省電力,因?yàn)闁|部應(yīng)用較多,產(chǎn)生的數(shù)據(jù)就會(huì)很多,但東部的電力、土地等開銷較大,建數(shù)據(jù)中心的成本高。西部用電、用地相對便宜,更適合建大的數(shù)據(jù)中心。把數(shù)據(jù)從東部送到西部,算好了之后再送回來,這個(gè)概念非常好,但中間也會(huì)遇到一些問題。因?yàn)閼?yīng)用是多樣化的,有一些應(yīng)用可以支撐傳輸?shù)难訒r(shí),而有一些應(yīng)用則無法支撐。
所以在建設(shè)前需要考慮幾個(gè)前提:一是要把算力網(wǎng)絡(luò)的綜合延遲降低,面對多種不同的算力,如何將它連好,連好之后如何快速、靈活地遷移負(fù)載;二是為了滿足實(shí)時(shí)性的要求,比如做需要支持實(shí)時(shí)支付、支持智能駕駛的業(yè)務(wù),就不能“東數(shù)西算”,所有還得在數(shù)據(jù)最發(fā)達(dá)的地方建立數(shù)據(jù)中心,尤其像長三角地區(qū)等數(shù)據(jù)應(yīng)用量大的地區(qū)。這與英特爾此前提出的邊緣計(jì)算是一個(gè)概念,不可能什么計(jì)算都依賴遠(yuǎn)處的算力支持,有一些還是需要在本地區(qū)做運(yùn)算。
“東數(shù)西算”是一個(gè)非常好的構(gòu)思和非常大的概念,在具體實(shí)施的時(shí)候,要考慮區(qū)分不同的工作負(fù)載、網(wǎng)絡(luò)延遲以及如何在未來開發(fā)應(yīng)用時(shí)更加透明。比如這個(gè)應(yīng)用需要什么樣的加速,需要多長時(shí)間的延遲,它能否進(jìn)行自動(dòng)分配等。如果未來編程人員還要去想“我需要保證QOS(服務(wù)質(zhì)量)到什么地步?如果保證不了應(yīng)該怎么辦?”這些問題時(shí),就會(huì)給編程人員帶來很大的負(fù)擔(dān)。假設(shè)編程人員把需求提出來,系統(tǒng)就能自動(dòng)滿足,這對軟硬件系統(tǒng)有很強(qiáng)的QOS要求。
在異構(gòu)計(jì)算方面,這種大型的計(jì)算中心內(nèi)部,CPU、GPU、FPGA、DPU、專用加速器等,對處理不同種類的工作數(shù)據(jù)各有優(yōu)勢與劣勢,也有運(yùn)營成本高低之分,所以未來一定要綜合部署,多種架構(gòu)可能都需要涵蓋,而且要有機(jī)聯(lián)合起來。
算力是指標(biāo),但性能更重要
記者:英特爾在異構(gòu)計(jì)算領(lǐng)域是否有了新的研發(fā)進(jìn)展?突破了哪些技術(shù)瓶頸?會(huì)對算力帶來怎樣的提升?
宋繼強(qiáng):首先,在架構(gòu)方面,英特爾已經(jīng)擁有了非常多的種類,比如通用計(jì)算有使用x86架構(gòu)的性能核、能效核這種不同種類的核。英特爾在通用處理器方面,還會(huì)適度增加專用加速器,比如有專門針對AI加速的,也有專門針對安全特性等加速的,提供可選的、具有獨(dú)特性的加速硬件配置。
其次,英特爾在圖形(Graphics)大規(guī)模并行處理的架構(gòu)方面,可以很靈活地組合小的芯片形成集群,再由多集群組成大的計(jì)算芯片,并且根據(jù)要求去分級。
最后,IPU現(xiàn)在已經(jīng)逐漸向主流方向發(fā)展,做法也變得多種多樣,比如想要偏向卸載計(jì)算,就可以將網(wǎng)絡(luò)管理、虛擬化、存儲(chǔ)管理相關(guān)的計(jì)算分別卸載。
所以在異構(gòu)計(jì)算領(lǐng)域,會(huì)越來越精細(xì)地拆分那些特性不同、要求不同的工作負(fù)載,然后逐漸統(tǒng)一化、標(biāo)準(zhǔn)化。未來的異構(gòu)要根據(jù)不同的場景、數(shù)據(jù)種類和處理的延時(shí)、帶寬要求進(jìn)行設(shè)計(jì),在這個(gè)新的發(fā)展趨勢下,可以看到在CPU和GPU之外,會(huì)有更多種類的“PU”出現(xiàn)。
算力是一個(gè)指標(biāo),它可以將一個(gè)比較復(fù)雜的事情簡單化,可如果只去看芯片上足電運(yùn)行時(shí),能提供多少算力,客戶是不會(huì)僅憑這個(gè)算力購買的,他們還是更看重性能。并且,單單只提算力也對現(xiàn)在提倡的“綠色計(jì)算”不是一件好事。
英特爾的優(yōu)勢在于,首先,技術(shù)基礎(chǔ)穩(wěn)固且強(qiáng)大。英特爾在架構(gòu)、制程工藝上都積累了很強(qiáng)的基礎(chǔ)。在全新IDM2.0戰(zhàn)略領(lǐng)導(dǎo)下,可以看到英特爾在架構(gòu)和制程工藝兩方面迭代演進(jìn)的速度都得到了明顯提升,被稱為“打了激素的摩爾定律”。
其次,英特爾有多種架構(gòu)和不同加速器去處理合適的應(yīng)用負(fù)載。英特爾現(xiàn)在非常明確地支持開放IP,和客戶聯(lián)合定制芯片。
最后,英特爾秉持的“軟件優(yōu)先”理念。這對開發(fā)者來說尤為重要。例如英特爾的oneAPI,就是讓開發(fā)者知道未來可以信賴這套API,不會(huì)因?yàn)閷碛布鼡Q了又要重新選。
現(xiàn)在行業(yè)正在轉(zhuǎn)向以異構(gòu)為基礎(chǔ)的技術(shù)新生態(tài),雖然短期會(huì)有一些曲折,但大家一起堅(jiān)持下來,未來還是能把這件事情做好的。
記者:英特爾發(fā)布了代號為Falcon Shores的新架構(gòu)設(shè)計(jì)。您能否介紹一下,該產(chǎn)品具備怎樣的特點(diǎn)和差異化優(yōu)勢?
宋繼強(qiáng):Falcon Shores架構(gòu)運(yùn)用了更新的做法。可以把x86與Xe顯卡集成在同一插槽,對于原本只能加載至強(qiáng)高性能CPU的處理器主板來講,可以在不改變主板設(shè)計(jì)的前提下,直接插入芯粒,封裝之后用做CPU運(yùn)算的內(nèi)核,比如性能核、能效核以及Xe架構(gòu)的圖形內(nèi)核。Xe的內(nèi)核分兩種架構(gòu):一種是專門針對圖形進(jìn)行了優(yōu)化,稱為HPG(High-Performance Graphics);另外一種是專門針對高性能計(jì)算進(jìn)行了優(yōu)化,稱為HPC。
Falcon Shores架構(gòu)最獨(dú)特的點(diǎn)是可以根據(jù)客戶的需求,在不增加主板上額外面積、空間以及布線要求的情況下,在x86芯片的插槽中自由配比Xe顯卡,將x86的主芯片與GPU的性能整合在一起,這是一個(gè)創(chuàng)新。
此外,F(xiàn)alcon Shores架構(gòu)可以集成更多的高帶寬內(nèi)存。Falcon Shores架構(gòu)將提供超過5倍的每瓦性能、計(jì)算密度以及內(nèi)存容量和帶寬提升。