您好,登錄后才能下訂單哦!
半導(dǎo)體芯片行業(yè),突然就,刷屏了……
川普舉全美國之力給華為抬咖,這波騷操作著實令人目瞪狗呆。
不過,在雙方吵著“抱走我家芯片不約”“專注自家、獨自美麗”的時候,或許我們可以將目光放在技術(shù)本身,來聊聊那些必需而重要的芯片產(chǎn)業(yè)布局。
首當(dāng)其沖的,當(dāng)屬同樣“備胎轉(zhuǎn)正”的異構(gòu)計算了。
我們知道,長久以來半導(dǎo)體產(chǎn)業(yè)一般會專注在幾種芯片上。無論X86、ARM、RISC,一個CPU里面的計算單元都是同樣的架構(gòu)。而所謂異構(gòu),就是將CPU、DSP、GPU、ASIC、FPGA等不同制程架構(gòu)、不同指令集、不同功能的計算單元,組合起來形成一個混合的計算系統(tǒng)。
異構(gòu)計算技術(shù)在上世紀80年代就已經(jīng)誕生的,但這兩年才開始在產(chǎn)業(yè)中顯露鋒芒,并快速取代通用CPU,站上了行業(yè)“C位”。
比如英特爾最新推出的AI平臺,就包含了CPU、GPU、DSP、NNP、FPGA等一系列不同的處理核心。英偉達的機器人平臺Jetson Xavier也包含了6種處理器,GPU/CPU/NPU/NVDLA等/一個都不能少。
眾多云計算服務(wù)廠商也相繼升級了異構(gòu)計算解決方案。比如上周華為剛剛發(fā)布的數(shù)據(jù)庫GaussDB產(chǎn)品,就運用了X86、ARM、GPU、NPU等多樣算力來執(zhí)行計算。
智能手機SoC也開始在傳統(tǒng)的CPU/GPU/ISP/基帶芯片之外,加入了加速DSP、圖形處理單元NPU等。
那么問題來了,在超級計算領(lǐng)域取代了同構(gòu)計算,成為芯片大廠們爭奪的對象,異構(gòu)計算到底憑什么?半導(dǎo)體行業(yè)集體擁抱異構(gòu)計算的背后,又埋藏著那些老問題和新機遇呢?
WHY:異構(gòu)計算上位史
先來解答一個問題,為什么CPU用的好好的,大家突然集體打起了異構(gòu)計算的主意?
最直接的原因,是計算密集型領(lǐng)域的快速崛起,面對計算需求的爆炸式增長,讓單一芯片越來越力不從心了。
近幾年,半導(dǎo)體技術(shù)在縱向提速上已經(jīng)達到了物理極限,處理器性能再也無法按照摩爾定律(每18個月就能翻倍)再創(chuàng)輝煌。
英特爾在2016年將研發(fā)周期從兩年延長到了三年。而受到CPU并行計算能力的限制,超級計算機常常要并聯(lián)上萬顆處理器來進行工作。
另一個關(guān)鍵影響是,人工智能在計算場景中越來越受到重視。尤其是移動終端設(shè)備中,AI正在以多種模式出現(xiàn)在應(yīng)用中。除了打電話發(fā)短信等基礎(chǔ)通訊通能之外,還需要處理圖片、娛樂游戲、高清攝像頭等各種各樣的信息,提供個性化智能推送、預(yù)測等服務(wù),這些計算的需求已經(jīng)遠遠超過了傳統(tǒng)CPU處理器的能力所及。
對此,GPU芯片廠商NVIDIA直接在2017年提出了半導(dǎo)體產(chǎn)業(yè)的新口號“摩爾定律已死,人工智能萬歲!”(Moore’s Law is dead, long live AI.)。
當(dāng)單一芯片無法滿足高性能計算的算力需求,于是,異構(gòu)計算被時代選中了……
簡單總結(jié)一下異構(gòu)計算“多兵種協(xié)同”的核心優(yōu)勢:
首先最重要的,就是提高了處理效率。
異構(gòu)計算能夠充分發(fā)揮CPU/GPU在通用計算上的靈活性,及時響應(yīng)數(shù)據(jù)處理需求,搭配上FPGA/ASIC等特殊能力,來充分發(fā)揮協(xié)處理器的效能,根據(jù)特定需求合理地分配計算資源。
這樣做的好處顯而易見,在處理速度和功耗之間找到平衡,達到高效又省電的效果。
舉個例子,在智能手機AI芯片“兩強”高通和麒麟,前者的SoC里面就包括了加速3D的GPU、處理照片的ISP、處理通信的基帶芯片、加速向量計算的DSP等。麒麟980最新的異構(gòu)計算架構(gòu),也基于CPU、GPU、NPU、ISP、DDR進行了全系統(tǒng)融合優(yōu)化,尋求更強的性能和續(xù)航。
異構(gòu)計算的另一個優(yōu)勢,則是成本利好。
由于目前神經(jīng)網(wǎng)絡(luò)算法和與之對應(yīng)的計算架構(gòu)層出不窮,如果每逢“上新必剁手”,采用不斷更新ASIC架構(gòu)的方式,最終下沉到用戶和企業(yè)身上,就會導(dǎo)致使用成本和替換成本過高。
因此,最好的解決辦法就是將多種計算架構(gòu)融合在一起,大家集體做功,生命周期就長的多了,在產(chǎn)業(yè)落地上具有更大的優(yōu)勢。
除了對硬件性能和產(chǎn)業(yè)應(yīng)用的強勢提升,異構(gòu)計算還有一個更深層次的價值,就是在單個國產(chǎn)同構(gòu)芯片水平暫時落后于國際水平的情況下,極有可能成為中國芯片彎道超車的歷史機遇。
HOW:異構(gòu)到底怎么構(gòu)?
既然異構(gòu)計算無論是從國家戰(zhàn)略層面還是個人應(yīng)用上都無比重要,那么,將不同類型的芯片放在一起,到底該怎么構(gòu)呢?
體現(xiàn)在硬件上,目前主要集中發(fā)展兩種模式:一種是芯片級(SoC)異構(gòu)計算,比如英特爾的KabyLake-G平臺,就是將英特爾處理器與AMD Radeon RX Vega M GPU進行異構(gòu)。華為去年推出的Kirin 970,就是在CPU和GPU的的基礎(chǔ)上,集成了專門為深度學(xué)習(xí)定制的NPU,來進行推理等高密度計算。
另一種則是英特爾提出的超異構(gòu)計算。通過EMIB、Foveros等封裝技術(shù),將經(jīng)過性能驗證的小芯片裝配到一個封裝模塊之中。
去年,英特爾就公布了一塊集成了英特爾10nm IceLake CPU和22nm Atom小核心的異構(gòu)主板芯片LakeField。 將高負載和低負載兩種處理核心集成在一起,在尺寸上又比簡單粗暴的板卡式集成小很多。
從硬件解決方案上看,異構(gòu)計算就是各個處理核心之間的排列組合嘛,好像和搭積木的技術(shù)難度差不多。不過,想要搭建一個理想的協(xié)處理器,里面還是有不少竅門的。
作為前提,就要要了解各個處理器的具體能力,然后根據(jù)為性能、功耗、價格、效能等, 做出獨家 產(chǎn)品 。
通常情況下,異構(gòu)計算會選擇CPU、GPU、FPGA、ASIC來進行排列組合。他們分別有什么優(yōu)勢呢?
穩(wěn)定多能便宜大碗的CPU,就是計算一塊磚,哪有需要往哪搬,是所有異構(gòu)方案中都不能舍棄的。
那么,選誰跟它組cp就成了差異化的關(guān)鍵。
其中,GPU能夠執(zhí)行高度線程化的多進程并發(fā)任務(wù),在需要復(fù)雜控制的大規(guī)模任務(wù)中,可以助CPU一臂之力。比如性能強勁的個人電腦,GPU就是不可或缺的存在。
FPGA中文名叫做“現(xiàn)場可編程門級列陣”,顧名思義,就是可以重新編程布線資源,因此,可以用來實現(xiàn)一些自定義的特殊硬件功能。而且,它的計算效率要比前兩個同伴都高,很適合處理AI算法,很快成為CPU的左膀右臂。
還有一個性能強勁但不太愛拋頭露面的選手,那就是“特殊訂制集成電路”ASIC。它的編程方式是直接在物理硬件(門電路)上搭建電路,由于不需要取指令和譯碼,每個時間單位都能專注于數(shù)據(jù)處理和傳輸,因此是所有協(xié)處理器中性能最高的一個, 功耗卻是最小的。不過,由于需要底層硬件編程,它的定制也昂貴而漫長,屬于江湖傳說型的存在。
目前,異構(gòu)計算的江湖主要有三個分支,分別是CPU+GPU,適用于大多數(shù)通用計算,是目前異構(gòu)計算使用最多的組合陣容;
CPU+FPGA,價格較高,大多是企業(yè)用戶(如華為、百度、IBM等)用來進行深度學(xué)習(xí)加速;
CPU+ASIC,應(yīng)用較少,適合一些市場大、投資回報清晰、有一定開發(fā)周期的領(lǐng)域,比如消費電子。
隨著技術(shù)的迭代,未來我們還很有可能看到CPU+GPU+FPGA之類的多芯片協(xié)同場景。比如華為剛剛發(fā)布的Atlas平臺,就能針對多個GPU/FPGA之間的拓撲結(jié)構(gòu)進行動態(tài)編排,進一步提升系統(tǒng)的整體性能。
不得不說,異構(gòu)計算打開這扇新世界的大門,正在為超級計算帶來充沛的想象力,整個計算行業(yè)生態(tài)無不積極地參與其中。
不過,想要將異構(gòu)計算下沉到龐大的產(chǎn)業(yè)體系里,事情并沒有我們想象的那么容易。
WHEN:異構(gòu)計算的崛起,不只靠技術(shù)
前面我們介紹了異構(gòu)計算的前世今生。但如果問一句,何時能看到異構(gòu)計算帶來的實際效果,答案可能不會讓人驚喜。原因也很簡單,異構(gòu)計算的崛起,靠的不只是技術(shù),更重要的是來自應(yīng)用端的積極準備。
但是,在“計算之光”的盛譽之下,異構(gòu)計算無論是采購、部署、使用門檻都很高。這就導(dǎo)致其應(yīng)用中面臨不少挑戰(zhàn):
比如在成本上,如果不能實現(xiàn)規(guī)?;少?,異構(gòu)計算芯片的采購成本都很高。智能手機廠商還可以憑借規(guī)?;瘍?yōu)勢進行議價,而一般的企業(yè)用戶和個人開發(fā)者,單量小的話采購價格特別高,尤其是FPGA、AISC等定制類板卡,距離大范圍應(yīng)用還很遙遠。
另外,異構(gòu)計算的芯片交付周期也很長。作為人工智能的大腦,全球GPU一直處于供應(yīng)短缺的狀態(tài),英偉達對每家公司每天購買的芯片數(shù)量進行了限購措施。而FPGA 和 ASIC這樣可編程的芯片,由于編程標(biāo)準未確立、定制時間等原因, 企業(yè)從硬件架構(gòu)設(shè)計、下單、交付往往需要幾個月的時間。
這樣導(dǎo)致的結(jié)果就是,數(shù)量和產(chǎn)品都是固定的,一方面可能造成算力資源與實際應(yīng)用之間的不匹配,還可能由于新的GPU/FPGA架構(gòu)上線,而不得不持續(xù)追加預(yù)算。導(dǎo)致企業(yè)的升級成本居高不下,自然心存疑慮。
即使上述所有問題都搞定了,一把手爽快打錢,芯片順利到貨,硬件成功部署,也很有可能出現(xiàn)另一種情況,就是線下的GPU/FPGA和線上的服務(wù)無法打通,造成資源浪費和數(shù)據(jù)孤島問題。
好氣哦,不自己搞了行不行,直接將云服務(wù)商的異構(gòu)計算拿過來用就好?
悲傷地告訴你,坑也很多。因為GPU、FPGA這些超高性能的器件在經(jīng)過云端虛擬化之后,性能損失非常嚴重,都會出現(xiàn)相應(yīng)的下降。而不同廠商的硬件優(yōu)化能力和解決方案千差萬別,如何選擇合適的平臺又成了問題。
如此看來,異構(gòu)計算的出現(xiàn)和下沉,簡直就是一個“掃雷”游戲?;蛟S等到有實力的廠商們將這些暗處的障礙一一掃除,異構(gòu)計算帶給數(shù)字世界的真正價值才會浮現(xiàn)出來。
而中國芯片企業(yè)直接用異構(gòu)計算向老牌巨頭發(fā)起挑戰(zhàn)的時候,產(chǎn)業(yè)迭變過程中的種種變數(shù)與可能性,將比技術(shù)本身還要精彩。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。