我們擅長商業(yè)策略與用戶體驗的完美結(jié)合。
歡迎瀏覽我們的案例。
今天 3 月份的 GTC 大會上,英偉達 CEO 黃仁勛拋出金句「AI 的 iPhone 時刻已經(jīng)到了」
現(xiàn)如今,時隔 5 個月后,更準(zhǔn)確的說,或許黃仁勛的金句可以改寫為「英偉達 AI 的 iPhone 時刻已經(jīng)到了。」
生成式 AI 的爆火,讓人們得以窺見下一個風(fēng)口,無數(shù)科技巨頭爭先搶后地躬身入局生成式 AI 賽道,試圖打開這道充滿機遇的科技大門。
但想法很主觀,現(xiàn)實很客觀,算力、模型、數(shù)據(jù)一直是 AI 發(fā)展的三大要素,AI 芯片所代表的算力既是人工智能的底層基石,也是打開這道科技大門的鑰匙。
而現(xiàn)如今,這把通往未來的鑰匙正掌握在英偉達的手中。
圖片來自網(wǎng)絡(luò)/侵刪
58 年前,英特爾創(chuàng)始人之一戈登· 摩爾在搜集 1959 年至 1965 年集成電路上晶體管數(shù)量的數(shù)據(jù)基礎(chǔ)上,提出了著名的摩爾定律。
集成電路上可容納的晶體管數(shù)目,約每隔兩年便會增加一倍。
隨后新的推斷又涌現(xiàn)了出來,兩年的時間間隔被縮短到了 18 個月。
在摩爾定律的作用下,CPU 和 GPU 的處理性能都獲得了指數(shù)級的增長,2000 年以后,CPU 從單核走向多核,核心數(shù)量得到大幅提升。
AI 深度學(xué)習(xí)的訓(xùn)練和推理大量依賴矩陣計算和浮點計算,對算力提出了極高的要求,而 GPU 能夠大規(guī)模并行計算,在矩陣和向量計算上遠(yuǎn)超 CPU,成為高性能計算的「寵兒」。
此外,高速的內(nèi)存寬帶、可擴展性強的算力池、專門優(yōu)化的深度學(xué)習(xí)框架、云端部署支撐等優(yōu)點,也堅定確立了 GPU 在 AI 時代的算力核心地位。
成立于 1993 年 4 月,英偉達最初便是靠 GPU 起家,通過不斷的創(chuàng)新和發(fā)展,逐漸成為了高性能計算領(lǐng)域的領(lǐng)導(dǎo)者。
根據(jù) Jon Peddie Research 發(fā)布的 GPU 市場數(shù)據(jù)統(tǒng)計報告,英偉達以 84% 的市場份額排名第一,排名第二的 AMD 為 12%,第三位的英特爾為 4%。
A100 和 H100 都是英偉達專門為 AI 計算設(shè)計的頂級數(shù)據(jù)中心 GPU,在訓(xùn)練和推理大型神經(jīng)網(wǎng)絡(luò)方面,性能都遠(yuǎn)超其他競爭對手,二者也都采用專門的 Tensor Core 和數(shù)據(jù)流架構(gòu),堪稱英偉達手里的兩張王牌芯片。
今年以來,英偉達主打的就是「你買的越多,省的也越多」,非常熟練且「貼心」地推出各種迭代更新的 GPU。
3 月,英偉達一口氣發(fā)布了 H100 NVL GPU、L4 Tensor Core GPU、L40 GPU 以和 NVIDIA Grace Hopper 四款 AI 推理芯片。
兩個月后,5 月的臺北電腦展上,黃仁勛發(fā)布了用 256 個 NVIDIA GH200 Grace Hopper 超級芯片組成的超級計算機 DGX GH200。
就在兩周前,黃仁勛又發(fā)布了搭載 HBM3e 內(nèi)存新版 GH200 Grace Hopper,這也是世界上首個搭載 HBM3e 內(nèi)存的 GPU 芯片。
HBM3e 內(nèi)存是一種新型的高帶寬內(nèi)存技術(shù),在運算速度上 HBM3e 能比 HBM3 運算速度快 50%,提供最高 5TB/秒的傳輸速率。
訓(xùn)練和推理是 AI 大模型的非常重要的兩個步驟,而這恰恰是 GH200 所擅長的部分。在黃仁勛看來,未來 GH200 的典型應(yīng)用場景就是大語言模型,并且「加速運算」、「AI 運算」將逐漸取代傳統(tǒng) x86 GPU 的「通用計算」。
過往無數(shù)的案例證明,優(yōu)異生態(tài)系統(tǒng)一旦構(gòu)筑成護城河,外來者在競爭中便占了下風(fēng)。
英偉達過硬的生態(tài)系統(tǒng)自然少不了競爭對手的蓋章認(rèn)證,神經(jīng)網(wǎng)絡(luò)科學(xué)家 Naveen Rao 曾在英特爾擔(dān)任過副總裁與人工智能平臺事業(yè)部總經(jīng)理。
他發(fā)現(xiàn)英偉達的最大優(yōu)勢不僅僅在于芯片本身,而是英偉達擁有一個具有大量優(yōu)秀人工智能程序員的大型社區(qū)和集散地。
CUDA 是英偉達基于其生產(chǎn)的 GPUs 的一個并行計算平臺和編程模型,目的是便于更多的技術(shù)人員參與開發(fā)。
開發(fā)人員可以通過 C/C++、Fortan 等高級語言來調(diào)用 CUDA 的 API,來進行并行編程,并進行高性能計算,這種生態(tài)系統(tǒng)的建立使得許多開發(fā)者依賴于 CUDA。
此前,黃仁勛向外界透露,CUDA 在全球已經(jīng)擁有超過 400 萬開發(fā)者和超過 3000 個應(yīng)用程序,CUDA 下載量累計達到 4000 萬次,全球有 40000 家大型企業(yè)正在使用英偉達的產(chǎn)品進行加速計算,已有 15000 家初創(chuàng)公司建立在英偉達的平臺上。
龐大的數(shù)字折射出英偉達顯著的先發(fā)優(yōu)勢,倘若其他對手想要推出新的硬件,則還需要考慮追趕這個已經(jīng)形成的人工智能創(chuàng)新生態(tài)系統(tǒng)。
交易的兩端,一端連著賣方,一端連著買方。
4 月份,「雙標(biāo)」的馬斯克一遍聯(lián)名簽署禁止訓(xùn)練 AI,一邊偷偷掃貨 1 萬張 GPU 來開發(fā)大模型,甚至還不忘在 X 上公開吐槽:「似乎每個人、每條狗都在購買 GPU」。
上個月,甲骨文董事長在公開場合表示,甲骨文公司將斥資數(shù)十億美元購買英偉達的 GPU,以擴大針對新一波人工智能公司的云計算服務(wù)。
得算力者得天下,在你追我趕的生成式 AI 賽道上,國內(nèi)也同樣蔓延著求「芯」若渴的焦慮。
據(jù)英國《金融時報》報道,中國互聯(lián)網(wǎng)巨頭正爭相搶英偉達高性能 AI 芯片,今明兩年的訂單價值高達 50 億美元。
其中百度、騰訊、阿里巴巴以及字節(jié)跳動今年向英偉達下達的支付訂單金額合計 10 億美元,總共采購 10 萬張 A800,相當(dāng)于每張 A800 芯片的價格達到 1 萬美元,明年再交付余下的 40 億美元。
需要說明的是,A800 本質(zhì)上是 A100 的「閹割版」。由于去年 8 月份受到政策影響,英偉達只能面向中國大陸市場推出不受限制的替代版本。
不少行業(yè)人士認(rèn)為,GPU 已經(jīng)成為市場上公認(rèn)的稀缺貨,一芯難求的局面在未來的一兩年內(nèi)依舊難以緩解。
因此,在 GPU 供不應(yīng)求的持續(xù)追捧下,英偉達的 GPU 甚至成為一些 AI 初創(chuàng)公司的硬通貨。
作為一家云計算初創(chuàng)公司,CoreWeave 想要獲得創(chuàng)業(yè)貸款并不是一件容易的事情。但「不看僧面看佛面」,得益于英偉達的投資人身份,CoreWeave 甚至可以將 H100 GPU 作為抵押物,輕易獲得了 23 億美元的貸款。
在貸款方看來,這自然不會是一筆虧本的買賣。
一方面,這筆貸款能夠讓 CoreWeave 的計算規(guī)模和實力得到快速擴張,增強償還貸款的能力,另一方面,英偉達明年將推出更多迭代的 GPU,憑借與英偉達密切的合作關(guān)系以及這筆高額度貸款,CoreWeave 還可以在搶購 GPU 上奪得先機。
正如前面所提到,既然頭部大廠在市場上都搶不到 GPU,那實力并不雄厚的 AI 初創(chuàng)公司的處境顯然更加堪憂。
于是乎,一些聰明的 AI 初創(chuàng)公司只能選擇另辟蹊徑,抱團取暖,投入英偉達的懷抱。
今年 6 月份,人工智能初創(chuàng)公司 Inflection AI 官宣,完成 13 億美元的新一輪融資,值得注意的是,嶄新的投資名單里首次出現(xiàn)英偉達的身影。
Inflection AI 表示,將和合作伙伴 CoreWeave 以及英偉達一起,構(gòu)建世界上最大的 AI 集群。
看似歡喜的強強聯(lián)合更像是一種無奈的抉擇,Inflection AI CEO Mustafa Suleyman 接受《紐約時報》的采訪時表示:「公司沒有義務(wù)使用英偉達的產(chǎn)品,但競爭對手沒有提供可行的替代方案。」
事實上,Inflection AI 將全力打造一臺先進的超級計算機,其中包括近 700 個 Intel Xeon CPU 的四節(jié)點機架服務(wù)器,以及配備了 22000 個 H100 GPU。
如此龐大數(shù)量的 GPU,讓旁人羨慕之余,很難不讓人聯(lián)想到英偉達 GPU「肥水不流外人田」的優(yōu)先提供策略。
當(dāng)然,生成式 AI 的春風(fēng)拂過,全球 GPU 供不應(yīng)求,價格水漲船高,英偉達也在這次 AI 浪潮中賺得盆滿缽滿。
去年底,消息人士向投資銀行公司的 Raymond James 透露,H100 GPU 的成本為 3320 美元(當(dāng)前約 24181 元人民幣),而英偉達選擇以 25000 至 30000 美元(當(dāng)前約 18.2 萬至 21.9 萬元人民幣)的價格出售這些 GPU。
雖然這一說法可能沒有考慮到運輸物流等其他成本,不過僅從生產(chǎn)成本 / 售價的比例來看,英偉達 H100 GPU 簡直就是一個「超級搖錢樹」。
此外,據(jù)外媒 Tomshardware 報道,英偉達今年內(nèi)計劃出售超過 55 萬塊 H100 GPU。倘若屬實,這意味著英偉達光從 H100 GPU 中獲得的收益就已經(jīng)是個天文數(shù)字。
生成式 AI 給英偉達帶來的驚喜遠(yuǎn)不止于此。
今年是英偉達的「而立之年」,在五月的最后一天,英偉達成為全球第一家市值突破 1 萬億美元的芯片公司,這也是歷史上第九家躋身萬億市值俱樂部的科技公司。
2024 財年第一財季財報顯示,英偉達第一財季營收為 71.92 億美元,與上一財季的 60.51 億美元相比增長 19%,凈利潤為 20.43 億美元,每股收益和營收均超過華爾街分析師的預(yù)期。
此外,本月 24 日發(fā)布的第二財季財報也預(yù)計營收超過 100 億美元,截至發(fā)稿前,英偉達的市值已經(jīng)達到 1.16 萬億美元,市盈率達到 244.09 倍,增長勢頭持續(xù)看好。
今年 6 月,身穿畢業(yè)服的黃仁勛受邀參加了中國臺灣大學(xué)的畢業(yè)演講,用過往的人生經(jīng)驗寄語畢業(yè)生!
無論是什么,像我們一樣全力以赴地追求它,跑吧!不要慢慢走。
不論是為了食物而奔跑,或不被他人當(dāng)做食物而奔跑。
你往往無法知道自己正處在哪一種情況,無論如何,都要保持奔跑。
歷史的機遇稍縱即逝,GPU 的賽道注定是贏者通吃的賽道。
一直狂奔的黃仁勛抓住 AI 的機遇,讓誕生于路邊連鎖餐廳的英偉達成功躋身于萬億美元俱樂部,成為了這波 AI 浪潮的最大贏家,也將繼續(xù)領(lǐng)跑這個時代。
(邯鄲小程序)