在計(jì)算機(jī)發(fā)展的歷史上,計(jì)算機(jī)性能的提升主要依托于其搭載的處理器的進(jìn)步,就如從奔騰(Pentium)到酷睿(Core),從推土機(jī)(AMD FX)到Zen,而芯片性能的提升則依靠芯片技術(shù)的進(jìn)步,如芯片產(chǎn)業(yè)采用的主流方式是提升芯片的先進(jìn)制程來(lái)提升其性能,使芯片制程從14nm到5nm不斷縮小,同樣大小的芯片中裝入更多晶體管來(lái)提升其運(yùn)算能力。
蘋(píng)果、英偉達(dá)也始終是先進(jìn)制程的追逐者,兩家廠(chǎng)商的算力產(chǎn)品都是委托晶圓代工廠(chǎng)臺(tái)積電代工,并爭(zhēng)取其先進(jìn)制程的產(chǎn)能、緊跟芯片業(yè)界最新工藝,可以說(shuō)兩家最新發(fā)布的產(chǎn)品匯聚了芯片產(chǎn)業(yè)界目前的工藝水平和技術(shù)能力,從近期蘋(píng)果及英偉達(dá)發(fā)布會(huì)上透露的產(chǎn)品信息可以發(fā)現(xiàn)一項(xiàng)驚人的事實(shí)——地表最強(qiáng)性能的處理器芯片都采用了“拼裝”工藝。
顛覆行業(yè)的“拼裝”芯片
第一個(gè)重磅炸彈是蘋(píng)果砸下來(lái)的。
在市場(chǎng)預(yù)期已習(xí)慣于同一芯片制程,處理器性能提升在10%到20%之間時(shí),同樣采用臺(tái)積電代工的5nm芯片制程的蘋(píng)果自研電腦芯片M1 Ultra,硬件性能指標(biāo)卻遠(yuǎn)遠(yuǎn)超出僅在半年前發(fā)布的M1 Max。彼時(shí),市場(chǎng)還震驚于M1 Max的芯片面積有432平方毫米,是將近4個(gè)M1芯片大小,M1 Ultra則在此基礎(chǔ)上讓芯片的體積再度翻倍。
芯片體積的增大意味著其擁有了更多的晶體管,M1 Ultra 共有1140億晶體管,而半年前發(fā)布的M1 Max的晶體管數(shù)量為570億,隨之而來(lái)的是CPU核心、GPU核心、神經(jīng)網(wǎng)絡(luò)引擎數(shù)量的翻倍。M1 Ultra支持20個(gè)CPU核心、64個(gè)GPU核心和32核神經(jīng)網(wǎng)絡(luò)引擎,其支持的帶寬達(dá)到128GB,每秒運(yùn)算高達(dá)22萬(wàn)億次。
仔細(xì)看不難發(fā)現(xiàn),M1 Ultra的各項(xiàng)核心數(shù)據(jù)基本是上一代產(chǎn)品M1 Max的翻倍,M1 Ultra似乎是將兩塊M1 Max“粘合”在一起,事實(shí)也確實(shí)如此,M1 Ultra是通過(guò)一種名為UltraFusion的封裝技術(shù),將兩塊M1 Max合二為一,通過(guò)這種封裝技術(shù),蘋(píng)果實(shí)現(xiàn)了兩塊芯片之間2.5TB/s的數(shù)據(jù)傳輸速度。
蘋(píng)果硬件技術(shù)高級(jí)副總裁 Johny Srouji 表示:“通過(guò)將兩個(gè)M1 Max與我們的UltraFusion封裝架構(gòu)連接起來(lái),我們能夠?qū)⑻O(píng)果芯片材料擴(kuò)展到前所未有的新高度。”“憑借其強(qiáng)大的CPU、龐大的GPU、令人難以置信的神經(jīng)引擎、ProRes硬件加速和大量的統(tǒng)一內(nèi)存,M1 Ultra使M1家族成為世界上功能最強(qiáng)大的個(gè)人電腦芯片。”
緊接著,英偉達(dá)在兩周后扔下另一枚“核彈”。
在3月22日英偉達(dá)年度GTC大會(huì)上,黃仁勛發(fā)布了其稱(chēng)作“AI工廠(chǎng)的理想CPU”的數(shù)據(jù)中心專(zhuān)屬CPU——Grace CPU Superchip。Grace CPU Superchip基于A(yíng)rmv9架構(gòu),擁有144個(gè)Arm CPU核心,其內(nèi)存帶寬達(dá)到了1TB/s,據(jù)SPECrate®2017_int_base基準(zhǔn)測(cè)試數(shù)據(jù),Grace CPU Superchip的模擬性能得分達(dá)到740,是DGX A100的1.5倍(460分)。
讓人驚異的是,這款超級(jí)芯片同樣由兩塊芯片“粘合”在一起,Grace CPU Superchip由兩塊Grace CPU組成,通過(guò)芯片互連技術(shù)NVIDIA NVLink-C2C將兩塊Grace CPU連在一起,其實(shí)早在去年英偉達(dá)發(fā)布的Grace Hopper Superchip就采用了這一技術(shù)來(lái)連接芯片。
不難發(fā)現(xiàn),從蘋(píng)果M1 Ultra到英偉達(dá)Grace CPU Superchip,都是將兩塊相同的小芯片“拼裝”在一起達(dá)到性能的機(jī)制提升,這是否意味著未來(lái)話(huà)大代價(jià)緩慢開(kāi)發(fā)2nm、1nm的先進(jìn)制程得不償失,只需要不斷推芯片就能達(dá)到性能的翻倍?那在更早之前這種芯片“拼裝”技術(shù)為何沒(méi)能成為業(yè)界的主流呢?
這其實(shí)涉及到近年來(lái)半導(dǎo)體業(yè)界熱度極高的封裝技術(shù)chiplet。
獨(dú)領(lǐng)“封”騷的Chiplet
不管是蘋(píng)果M1 Ultra使用的UltraFusion封裝架構(gòu),還是英偉達(dá)采用的芯片互連技術(shù)NVIDIA NVLink-C2C,都有涉及相關(guān)chiplet之間的互聯(lián)互通。NVIDIA超大規(guī)模計(jì)算副總裁Ian Buck曾表示:“為應(yīng)對(duì)摩爾定律發(fā)展趨緩的局面,必須開(kāi)發(fā)小芯片和異構(gòu)計(jì)算?!?/p>
Ian Buck口中的小芯片正是chiplet,也常被譯為芯粒。它是系統(tǒng)級(jí)芯片(SoC)中IP模塊的芯片化,通過(guò)chiplet技術(shù)可以提高良率和降低成本,同時(shí)提高設(shè)計(jì)的靈活度,縮短設(shè)計(jì)周期。
目前的系統(tǒng)級(jí)芯片(SoC)并不只是一塊CPU或一塊GPU,而是CPU、GPU、ISP、NPU等多種計(jì)算單元都在一塊芯片上,簡(jiǎn)單來(lái)說(shuō),可以把chiplet技術(shù)想象成為一塊樂(lè)高積木,chiplet則是將這些不同的計(jì)算單元模塊化,多個(gè)chiplet模塊可以拼接成一個(gè)系統(tǒng)級(jí)芯片(SoC),而在過(guò)去,一個(gè)系統(tǒng)級(jí)芯片(SoC)是不能再次切割的。這樣做的好處在于,一塊完整的晶圓可以被分成更多的chiplet,這意味著同樣良率情況下更低的成本消耗。
例如在一片晶圓切割封裝時(shí)出現(xiàn)了一個(gè)點(diǎn)的損傷部位,直接做成一個(gè)系統(tǒng)級(jí)芯片(SoC)能切成10塊,假如做成chiplet是100塊,那么這塊晶圓做成系統(tǒng)級(jí)芯片(SoC)的良品率為90%,而做成chiplet的良品率可以達(dá)到99%。
chiplet除了大幅提高大型芯片的良率、降低設(shè)計(jì)成本等經(jīng)濟(jì)上的效益, chiplet技術(shù)也為異質(zhì)異構(gòu)的芯片制造提供了可能,這種模塊化的小芯片可以實(shí)現(xiàn)不同架構(gòu)、不同材質(zhì)、不同工藝節(jié)點(diǎn)甚至不同晶圓代工廠(chǎng)生產(chǎn)的產(chǎn)品集成到一塊芯片上,由此快速產(chǎn)生出一個(gè)適應(yīng)不同功能需求的超級(jí)芯片。
例如,AMD的數(shù)幾代產(chǎn)品都采用了“SiP + chiplet”的異構(gòu)系統(tǒng)集成模式,同時(shí),今年3月的GTC上,英偉達(dá)除了發(fā)布Grace CPU Superchip,還推出了Grace Hopper Superchip,它不是由兩塊相同的Grace CPU組成,而是由一個(gè)Grace CPU和一個(gè)Hopper架構(gòu)的GPU組成,這些都是chiplet為超級(jí)芯片的設(shè)計(jì)、生產(chǎn)所提供的工藝上的可能。
更有人認(rèn)為以chiplet為代表的先進(jìn)封裝技術(shù)正在成為超越摩爾的關(guān)鍵,戈登·摩爾根據(jù)自己的經(jīng)驗(yàn)在半導(dǎo)體領(lǐng)域做的一個(gè)預(yù)言:“在最小成本的前提下,集成電路所含有的元件數(shù)量大約每年便能增加一倍。(The complexity for minimum component costs has increased at a rate of roughly a factor of two per year)
如今據(jù)摩爾定律的提出已過(guò)去了57年,要想在拇指大小的芯片上做出更多的晶體管與更小的制程,變得越來(lái)越困難。從技術(shù)上來(lái)說(shuō)就是隨著芯片尺寸的微縮,短道溝效應(yīng)導(dǎo)致的漏電、發(fā)熱和功耗嚴(yán)重問(wèn)題一直困擾著芯片制程的繼續(xù)微縮。當(dāng)材料逼近1nm的物理極限時(shí),量子隧穿效應(yīng)導(dǎo)致有一定的電子可以跨過(guò)勢(shì)壘,從而漏電,這個(gè)問(wèn)題對(duì)于人類(lèi)來(lái)說(shuō)暫時(shí)是無(wú)解的。
雖然摩爾定律到現(xiàn)在仍在艱難維持,但產(chǎn)業(yè)界也確實(shí)意識(shí)到了制程不會(huì)無(wú)限縮小下去,晶體管也不可能無(wú)限增加下去,可以說(shuō)產(chǎn)業(yè)界將先進(jìn)封裝技術(shù)提升到與制程微縮同等重要的程度,從晶圓代工廠(chǎng)到封測(cè)廠(chǎng)商都在加大對(duì)先進(jìn)封裝技術(shù)的投入,從去年開(kāi)始,先進(jìn)封裝技術(shù)已成為了各大晶圓廠(chǎng)、封測(cè)廠(chǎng)商甚至一些Fabless的重點(diǎn)投入領(lǐng)域。
早在2021年1月,臺(tái)積電總裁魏哲家在財(cái)報(bào)會(huì)議上透露:“對(duì)于包括SoIC、CoWoS(蘋(píng)果M1 Ultr
a所采用的工藝)等先進(jìn)封裝技術(shù),我們觀(guān)察到chiplet正成為一種行業(yè)趨勢(shì)。臺(tái)積電正與幾位客戶(hù)一起,使用chiplet架構(gòu)進(jìn)行3D封裝研發(fā)?!?/p>
到了去年6月,封測(cè)龍頭日月光宣布將投入20億美元用于提高其晶圓封裝業(yè)務(wù);7月,英特爾公布了未來(lái)制程工藝和封裝技術(shù)路線(xiàn)圖,將繼續(xù)推動(dòng)Foveros 3D堆疊封裝技術(shù)與EMIB(嵌入式多管芯互連橋)封裝技術(shù)的應(yīng)用;9月,聯(lián)電與封測(cè)廠(chǎng)商頎邦相互交換股權(quán)。
在各大半導(dǎo)體廠(chǎng)商的追加投資的熱潮下,chiplet市場(chǎng)也迎來(lái)迅猛發(fā)展。據(jù)Omdia預(yù)計(jì),2024年chiplet的市場(chǎng)規(guī)模將達(dá)到58億美元,到2035年則超過(guò)570億美元,市場(chǎng)規(guī)模將迎來(lái)快速增長(zhǎng)。
當(dāng)然,chiplet的實(shí)現(xiàn)需要諸多技術(shù)接口上的整合,就如上文所說(shuō), chiplet可以實(shí)現(xiàn)不同架構(gòu)、不同材質(zhì)、不同工藝節(jié)點(diǎn)甚至不同晶圓代工廠(chǎng)生產(chǎn)的產(chǎn)品集成到一塊芯片上,但不同的芯片廠(chǎng)商其采用的連接協(xié)議是不同的,如英偉達(dá)Grace CPU Superchip采用的是NVLink-C2C技術(shù)、蘋(píng)果M1 Ultra采用的臺(tái)積電提供的連接協(xié)議,英特爾也有自己的授權(quán)協(xié)議AIB。
毫無(wú)疑問(wèn),各芯片巨頭們正在通過(guò)自家的chiplet協(xié)議來(lái)打造產(chǎn)品生態(tài)、搶占市場(chǎng),但chiplet技術(shù)的出現(xiàn)本來(lái)就意在打破不同生態(tài)間的壁壘,如果又因其背后的連接協(xié)議而造成產(chǎn)業(yè)鏈的割裂,可以說(shuō)是得不償失,于是,就在今年3月初,半導(dǎo)體產(chǎn)業(yè)第一個(gè)chiplet互聯(lián)接口標(biāo)準(zhǔn)化的“橋梁”——UCIe聯(lián)盟成了。
UCIe是機(jī)遇還是洪水猛獸?
今年3月2日,英特爾、AMD、ARM、高通、三星、臺(tái)積電、日月光等半導(dǎo)體產(chǎn)業(yè)鏈廠(chǎng)商,以及Google Cloud、Meta、微軟等互聯(lián)網(wǎng)硬件終端企業(yè)宣布了一項(xiàng)新技術(shù)標(biāo)準(zhǔn)UCIe(Universal Chiplet Interconnect Express)。
簡(jiǎn)單來(lái)說(shuō),UCIe是一個(gè)開(kāi)放的行業(yè)互連標(biāo)準(zhǔn),它定義了各小芯片之間的互聯(lián)標(biāo)準(zhǔn),這意味著半導(dǎo)體產(chǎn)業(yè)界正在打造一個(gè)標(biāo)準(zhǔn)化、通用化、即插即用的chiplet接口,這個(gè)開(kāi)放標(biāo)準(zhǔn)的推廣無(wú)疑將為整個(gè)產(chǎn)業(yè)帶來(lái)巨頭的創(chuàng)新空間,它不僅具有高帶寬、低延遲、經(jīng)濟(jì)節(jié)能的優(yōu)點(diǎn),還能夠應(yīng)用于包括計(jì)算機(jī)、云邊端、5G、汽車(chē)和移動(dòng)設(shè)備在內(nèi)的所有領(lǐng)域。
然而,UCIe所制定的行業(yè)互連標(biāo)準(zhǔn)雖好,但眼尖的人不難發(fā)現(xiàn)創(chuàng)立該聯(lián)盟的十大公司中沒(méi)有一家是來(lái)自中國(guó)的企業(yè),尤其是在半導(dǎo)體這樣一個(gè)極為敏感的行業(yè),這是不是意味著UCIe產(chǎn)業(yè)聯(lián)盟要自己搞一個(gè)協(xié)議在chiplet工藝中自立游戲規(guī)則,那么新玩家想要加入需要付出什么代價(jià)?是要像對(duì)待Arm一樣交授權(quán)費(fèi),或是又可以被拿來(lái)當(dāng)做“卡脖子”的工具?
對(duì)國(guó)內(nèi)的芯片企業(yè)而言,以chiplet技術(shù)為代表的先進(jìn)封裝正是現(xiàn)下適合長(zhǎng)期投入的優(yōu)質(zhì)賽道,畢竟短期內(nèi)國(guó)內(nèi)企業(yè)還無(wú)法通過(guò)自研或是進(jìn)口來(lái)獲取EUV光刻機(jī)。雖然,現(xiàn)在我們處于光刻來(lái)驅(qū)動(dòng)尺寸微縮的時(shí)代,但未來(lái)驅(qū)動(dòng)芯片行業(yè)繼續(xù)往前走的可能是設(shè)計(jì)與工藝協(xié)同優(yōu)化,以及系統(tǒng)與工藝協(xié)同優(yōu)化的階段,那么,先進(jìn)封裝或是下一次芯片產(chǎn)業(yè)洗牌的開(kāi)端,chiplet成為我國(guó)芯片產(chǎn)業(yè)彎道超車(chē)的一個(gè)絕佳技術(shù)機(jī)會(huì),但如今,UCIe產(chǎn)業(yè)聯(lián)盟先人一步成立,它未來(lái)是否會(huì)成為堵在前方的又一座大山?
好消息是,我國(guó)的chiplet行業(yè)互連標(biāo)準(zhǔn)制也在緊鑼密鼓的準(zhǔn)備中,今年3月28日起,中國(guó)計(jì)算機(jī)互連技術(shù)聯(lián)盟(CCITA)聯(lián)合電子標(biāo)準(zhǔn)院、中科院計(jì)算所、工信部以及國(guó)內(nèi)多個(gè)芯片廠(chǎng)商已完成《小芯片接口總線(xiàn)技術(shù)》、《微電子芯片光互連接口技術(shù)》的標(biāo)準(zhǔn)草案制定,國(guó)內(nèi)涉及小芯片技術(shù)的相關(guān)企業(yè)都可通過(guò)CCITA與聯(lián)盟反饋草案意見(jiàn)。
需要注意的是,中國(guó)計(jì)算機(jī)互連技術(shù)聯(lián)盟的《小芯片接口總線(xiàn)技術(shù)》與UCIe聯(lián)盟制定的相關(guān)標(biāo)準(zhǔn)有著不小的差異,如臺(tái)積電引以為傲的CoWoS(蘋(píng)果M1 Ultra所采用的工藝)技術(shù),大陸的封測(cè)廠(chǎng)目前無(wú)法達(dá)到。簡(jiǎn)單說(shuō),《小芯片接口總線(xiàn)技術(shù)》適合中國(guó)芯片產(chǎn)業(yè)鏈當(dāng)前的狀況,偏向成熟制程,UCIe聯(lián)盟的相關(guān)標(biāo)準(zhǔn)在某種程度上來(lái)說(shuō)更看重chiplet在先進(jìn)制程上的表現(xiàn)。
這當(dāng)然不是意味著《小芯片接口總線(xiàn)技術(shù)》就不如UCIe,在中芯國(guó)際、華虹半導(dǎo)體等大陸數(shù)一數(shù)二的晶圓廠(chǎng)無(wú)法制造先進(jìn)制程芯片時(shí),探索更適合當(dāng)下產(chǎn)業(yè)鏈狀況的小芯片互聯(lián)技術(shù)才顯得腳踏實(shí)地。中國(guó)計(jì)算機(jī)互連技術(shù)聯(lián)盟秘書(shū)長(zhǎng)、中科院計(jì)算所研究員郝沁汾認(rèn)為國(guó)內(nèi)的chiplet標(biāo)準(zhǔn)可以用更加成熟和低成本的方式做出,由此可替代先進(jìn)制程的昂貴方案。
就在不少人認(rèn)為未來(lái)中國(guó)芯片企業(yè)加入U(xiǎn)CIe聯(lián)盟無(wú)望,中國(guó)半導(dǎo)體產(chǎn)業(yè)得再接一記硬招的時(shí)候,成立UCIe聯(lián)盟的發(fā)起者英特爾,在4月2日竟然把一家大陸芯片公司芯原微電子拉入了UCIe聯(lián)盟。
芯原微電子究竟是何方神圣?據(jù)該公司官網(wǎng)資料,芯原是國(guó)內(nèi)的一家半導(dǎo)體IP供應(yīng)商,擁有圖形處理器IP、神經(jīng)網(wǎng)絡(luò)處理器IP、視頻處理器IP、數(shù)字信號(hào)處理器IP、圖像信號(hào)處理器IP和顯示處理器IP六大類(lèi)處理器IP核。根據(jù)研究機(jī)構(gòu)IPnest統(tǒng)計(jì),芯原是中國(guó)大陸排名第一、全球排名第七的半導(dǎo)體IP供應(yīng)商,目前芯原推出了基于Chiplet架構(gòu)所設(shè)計(jì)的處理器平臺(tái),該平臺(tái)12nm SoC版本已完成流片和驗(yàn)證,并正在進(jìn)行chiplet版本的迭代。
中國(guó)半導(dǎo)體IP的核心企業(yè)加入U(xiǎn)Cle聯(lián)盟意味著什么現(xiàn)在還很難說(shuō)清,是好是壞還有待時(shí)間驗(yàn)證,但誰(shuí)也不敢就此保證UCIe對(duì)中國(guó)芯片企業(yè)將徹底開(kāi)放,畢竟有著前車(chē)之鑒,這不是簡(jiǎn)單的選Lightning接口還是Type-C接口的問(wèn)題,其背后所代表的技術(shù)路線(xiàn)、支撐其的產(chǎn)業(yè)鏈乃至背后的經(jīng)濟(jì)博弈每一項(xiàng)都不可小覷。
唯一能確定的是,國(guó)內(nèi)現(xiàn)已完成草案的《小芯片接口總線(xiàn)技術(shù)》、《微電子芯片光互連接口技術(shù)》不能停下腳步,盡快匯集更多企業(yè),做到國(guó)內(nèi)chiplet技術(shù)標(biāo)注的落地和不斷迭代是一個(gè)艱難卻必定要做下去的事情。
來(lái)源:品玩