三年前,在一場名為“固態(tài)電路大會”的芯片設(shè)計師會議上,我(本文作者)與 Facebook 或Meta的人工智能負責(zé)人Yann LeCun進行了交談。LeCun 當(dāng)時正在向芯片設(shè)計人員發(fā)表主題演講,討論他們應(yīng)該如何考慮讓他們的芯片能夠更好地處理 AI 程序,特別是 LeCun 幫助開創(chuàng)的深度學(xué)習(xí)版本。
當(dāng) LeCun 完成他的主題演講并且我們在后臺接受ZDNet 采訪時,他提出的觀點之一是 Meta 和其他所有人都需要一個替代Nvidia的公司,因為該公司的芯片已經(jīng)連續(xù)十多年占領(lǐng)機器學(xué)習(xí)的主導(dǎo)地位。
他說,不管怎樣,我們都需要打破這種局面,或者 Meta 將構(gòu)建自己的芯片,類似于Alphabet的谷歌如何構(gòu)建自己的“TPU”芯片來處理 AI。
“換句話說,我們需要的是目前占主導(dǎo)地位的供應(yīng)商的競爭對手,”LeCun 說,暗指英偉達。
“可能不是因為他們不擅長,而是因為他們做出了假設(shè),如果有一套不同的硬件做出不同的假設(shè),可以用來補充當(dāng)前 GPU 擅長的東西,那就太好了,”值得一提,圖形處理單元是由英偉達首創(chuàng)。
事實證明,這兩種選擇都沒有實現(xiàn)。LeCun 顯然沒有制造自己的芯片,而且他仍然沒有 Nvidia 的替代供應(yīng)商。
周一,Meta宣布了其所謂的AI Research SuperCluster或“RSC”,這是一款致力于為 LeCun 和他的團隊所做研究提供動能的超級計算機。該機器包含 6,080 個 Nvidia 的“A100”GPU 芯片,這是其當(dāng)前的頂級部件。
Meta 的 AI 負責(zé)人、工程先驅(qū) Yann LeCun 一直很清楚需要 Nvidia 的替代品,但顯然,他一直找不到任何替代品。
這就是當(dāng)今人工智能的趨勢:越來越大的計算機來處理越來越大的神經(jīng)網(wǎng)絡(luò)。LeCun 和他的同事告訴全世界事情就是這樣發(fā)展的,而 Nvidia告訴全世界他們將成為實現(xiàn)這一目標(biāo)的最優(yōu)選擇。
顯然,這對 Nvidia 來說是一個巨大的勝利,擁有巨大的吹噓權(quán),因為 Meta 將該系統(tǒng)稱為“當(dāng)今運行的最快的 AI 超級計算機之一”,并承諾“當(dāng)它完全建成后,它將成為世界上最快的 AI 超級計算機” 2022 年年中。”
這也是Pure Storage的一大勝利,它提供了所有基于閃存的存儲,價值近 200 PB(1 PB 等于一千萬億字節(jié))。
哦,這也是我本月早些時候采訪的一家公司Smart Global的一大勝利。Smart 的Penguin Computing部門生產(chǎn)高性能計算機,也為 RSC 銷售了幾臺機器。
真的,對于英偉達來說,這不僅僅是一場勝利,它是一個鮮明的例子,說明在一些公司投資的規(guī)模上,英偉達根本沒有競爭對手。
盡管英偉達唯一的公開 GPU 競爭對手Advanced Micro Devices銷售內(nèi)置于許多超級計算機中的出色 GPU 芯片,但事實并非如此。
盡管有許多有價值的競爭對手是初創(chuàng)公司,但這種缺乏有意義的反對也是如此,他們推出了令人驚嘆的芯片和致力于人工智能的整個計算機系統(tǒng),包括Cerebras Systems、SambaNova和Graphcore。在我們說話的時候,還有更多的人正在接受資助。
盡管 Meta 等公司渴望另一種選擇,但他們都無法打破這些公司的購買習(xí)慣。在某些情況下,這些公司已經(jīng)簽下了知名客戶。例如,Cerebras與GlaxoSmithKline等公司取得了重大勝利,這些客戶正在使用該機器進行強化研究,從而產(chǎn)生了原創(chuàng)性發(fā)現(xiàn)。迄今為止,這種孤立的勝利并沒有扭轉(zhuǎn)英偉達的局面。他們是證明規(guī)則的例外。
盡管 Graphcore 等公司在某些情況下愿意在選擇的性能基準(zhǔn)測試上與 Nvidia 匹敵,但仍缺乏替代方案。
由于外界對我們?nèi)魏稳硕疾煌耆宄脑颍ㄎ易罱鼪]有就此事與 LeCun 談過),像 Meta 這樣的公司最好的選擇仍然是現(xiàn)任者 Nvidia。
我們可以推測,我建議系統(tǒng)擴展到 6,080 個 GPU 以構(gòu)建世界上最大的 AI 計算機的能力,目前超過了任何新貴在特定用例中在性能或性能方面所能提供的任何優(yōu)勢。效率。(我假設(shè)金錢不是 Meta 的對象,盡管這可能是錯誤的。)
英偉達的首席執(zhí)行官黃仁勛(中)放棄了與英特爾的競爭,因為后者顯然勢不可擋。他現(xiàn)在可能認為其他人應(yīng)該效仿他,放棄與英偉達的對抗。
正如 LeCun 所指出的,GPU 在 AI 處理方面有其局限性,但如果你想要在一種巨大的計算墻中堆疊最多數(shù)量的磚塊,它是一塊非常有用的磚塊。
一個重要的細節(jié)是,英偉達在 2020 年收購 Mellanox 時從Mellanox那里獲得的資產(chǎn)被證明是一種將許多芯片連接在一起的重要方式。Meta 也在其新聞稿中突出提到了連接性。
一年回報。
英偉達的首席執(zhí)行官黃仁勛本人可以提供更簡潔的解釋,他是個直言不諱的人。2015 年,在 Nvidia 于 AI 領(lǐng)域占據(jù)主導(dǎo)地位的曙光之際,該公司正在逐漸放棄推翻英特爾在服務(wù)器微處理器業(yè)務(wù)上的控制權(quán)。在那年的 CES 上,我問黃為什么他推翻英特爾的戰(zhàn)斗沒有成功。他的回答很有啟發(fā)性。
“我認為英特爾在提高至強的性能方面做得非常好,”英特爾的主要服務(wù)器芯片,這是黃的回應(yīng)。“我認為英特爾已經(jīng)取得了很大進步。”
換句話說,老牌英特爾只是保持足夠好,以至于來自挑戰(zhàn)者的替代品沒有優(yōu)勢。有人想知道英偉達在人工智能大戰(zhàn)中是否也是如此。只要領(lǐng)先品牌不斷進步,沒有什么好到可以推翻領(lǐng)先品牌的。
人工智能領(lǐng)域可能還需要替代品。深度學(xué)習(xí)的基礎(chǔ)可能會發(fā)生巨大變化。LeCun 本人曾建議,未來的道路涉及神經(jīng)網(wǎng)絡(luò),這些網(wǎng)絡(luò)消除了他們今天使用的數(shù)十億“參數(shù)”,從而產(chǎn)生了完全不同的東西,他稱之為“基于能量的學(xué)習(xí)”。
目前,主導(dǎo)地位屬于英偉達。問題是,世界上有多少其他公司像 Meta 那樣認輸,與現(xiàn)任者并駕齊驅(qū),而不是尋找替代品。
除了這些其他初創(chuàng)公司獲得英偉達之外,還有什么可能改變?我一直認為, Nvidia 面臨的主要挑戰(zhàn)一直是RISC-V開源芯片運動。它仍然可能產(chǎn)生影響。并且也許 AMD 在銷售用于 AI 的 GPU 方面會變得更強大,以對抗 Nvidia。
我建議作為一種非常非常外部的可能性,Meta 可以使用所有這些 GPU 來設(shè)計下一個偉大的內(nèi)部芯片,就像谷歌的 TPU 一樣。畢竟,谷歌已經(jīng)展示了使用深度學(xué)習(xí)設(shè)計芯片的方法。就好像 LeCun 只是在使用 Nvidia 來實現(xiàn)他對定制 Meta 芯片的夢想。
這種前景更像是希望外星人到達地球以解決氣候變化問題。
目前,Meta 正在計劃更多的是 Nvidia。據(jù)介紹,RSC 的“第二階段”將“將 GPU 的數(shù)量從 6,080 個增加到 16,000 個,這將使 AI 訓(xùn)練性能提高 2.5 倍以上。”
Nvidia 股價最近為 223.24 美元,自年初以來下跌了 24%,在過去 12 個月中上漲了 60%。