1993年4月5日,黃仁勛這天剛好滿30歲,和普里姆以及馬拉喬夫斯基三人,在加州圣何塞一家連鎖餐廳里討論著創(chuàng)業(yè)成立公司的事。
這家丹尼餐廳位于一座立交橋旁邊,環(huán)境吵鬧同時(shí)裝修簡(jiǎn)陋,店鋪的前臉布滿了彈孔,因?yàn)槁愤^(guò)的社會(huì)人經(jīng)常朝停在門(mén)前的警車(chē)開(kāi)槍。三個(gè)創(chuàng)始人此時(shí)正拿雞蛋卷裹香腸片,就著劣質(zhì)焦咖啡,英偉達(dá)就在這樣的環(huán)境下誕生了。
黃仁勛出生在臺(tái)南囝仔,今天從這個(gè)地方往東北方向不到20公里,就是臺(tái)積電的第十八晶圓廠。
這個(gè)生產(chǎn)基地2017年底開(kāi)工建設(shè),預(yù)計(jì)到今年的總投資額將超過(guò)1000億美元,是臺(tái)積電最昂貴的晶圓廠,其最先進(jìn)的5納米和3納米制程在這落地。無(wú)論是英偉達(dá)的RTX4000系列游戲顯卡,還是當(dāng)下一卡難求的H100,都在這里完成從硅到芯片的關(guān)鍵轉(zhuǎn)化。兩家公司相互成就,如今共同掌握著尖頂星科技,市值合計(jì)1.5萬(wàn)億美元。
從成立之日算起,黃仁勛在英偉達(dá)CEO位置上干了整整三十年。論敬業(yè)程度,硅谷同行里大概少有人能出其右。
在硅谷敘事模式里,這里成功的科技公司通常在年輕創(chuàng)始人帶領(lǐng)下迅速成長(zhǎng)為世界巨頭,或者已經(jīng)成為世界巨頭的公司因?yàn)楦簧闲蝿?shì)而快速?zèng)]落,又或者沒(méi)落后又再次憑借某個(gè)拳頭產(chǎn)品重新變得偉大。總之來(lái)來(lái)回回,興也勃焉亡也忽焉,核心就是一個(gè)快字。
以這樣的視角打量,英偉達(dá)顯然不太一樣。除了在最初創(chuàng)業(yè)時(shí)差點(diǎn)“暴斃”,英偉達(dá)在長(zhǎng)達(dá)二十年的時(shí)間里活得相當(dāng)寧?kù)o,談不上驚艷但也沒(méi)遭遇大災(zāi)大難。
直到最近幾年,英偉達(dá)突然開(kāi)掛爆種,從人工智能到加密貨幣,從元宇宙到ChatGPT,不是英偉達(dá)在追風(fēng)口,而更像是風(fēng)口失了智般往英偉達(dá)身上撞。
作為總設(shè)計(jì)師,黃仁勛本人顯然不會(huì)認(rèn)可這種說(shuō)法。在他那里,英偉達(dá)的故事應(yīng)該是關(guān)于技術(shù)理解、商業(yè)遠(yuǎn)見(jiàn)和長(zhǎng)期主義的絕佳范例。
頂多再加一點(diǎn)小小的運(yùn)氣。
01、東亞的風(fēng)瞇了黃仁勛的眼
黃仁勛和另外兩個(gè)合伙人最終決定創(chuàng)業(yè)時(shí),有著相當(dāng)樸素但又同時(shí)觸及本質(zhì)的思考。無(wú)論電影、電視或者印刷的書(shū)籍報(bào)紙,抑或是音樂(lè),這些都是人類用來(lái)表達(dá)想法講述故事的媒介。
而當(dāng)時(shí)正顯露雛形的3D圖像技術(shù),憑借實(shí)時(shí)生成的畫(huà)面和互動(dòng)性,將有可能成為下一種新的大眾媒介。
唯一的問(wèn)題是此時(shí)的3D圖像任務(wù),由于需要耗費(fèi)極高的計(jì)算量,只有使用極其龐大的專業(yè)工作站才能完成。而黃仁勛和英偉達(dá)想要做的,就是把這項(xiàng)技術(shù)變得足夠便宜,然后普及它。
事實(shí)上,1993年英偉達(dá)成立的時(shí)候,它是第一家嘗試把3D圖像推向普通消費(fèi)者的公司。不過(guò)首先做到這件事的公司并不是英偉達(dá),索尼在一年零八個(gè)月后推出的初代PS游戲主機(jī)要成功得多,在推出九年后,這款主機(jī)出貨量突破了1億臺(tái)。
另一方面,英偉達(dá)前期的先發(fā)優(yōu)勢(shì)很快就不復(fù)存在,短短兩年時(shí)間里極客遍地的硅谷就冒出了90家英偉達(dá)的競(jìng)爭(zhēng)者。而在這兩年時(shí)間里,市場(chǎng)形勢(shì)已經(jīng)發(fā)生了翻天覆地的變化,問(wèn)題出在DRAM這個(gè)元器件上面。
從技術(shù)原理上說(shuō),圖像在計(jì)算機(jī)內(nèi)部的存儲(chǔ)需要消耗相當(dāng)大的空間資源。在未經(jīng)壓縮的情況下,如今一張1080P的圖片含有超過(guò)兩百萬(wàn)像素點(diǎn)(1920 × 1080),按照8比特的色深,每個(gè)像素點(diǎn)需要4個(gè)字節(jié)的存儲(chǔ)空間,所有像素點(diǎn)合計(jì)超過(guò)8M字節(jié)。而要產(chǎn)生動(dòng)態(tài)連續(xù)的觀感,屏幕上顯示的圖像還需要保持每秒多次刷新。
盡管在30年前屏幕的顯示規(guī)格,無(wú)論是說(shuō)分辨率還是色彩還沒(méi)有這么高,但存儲(chǔ)空間仍然是在算力之外3D圖像技術(shù)的關(guān)鍵瓶頸。在英偉達(dá)成立的1993年,DRAM內(nèi)存的價(jià)格在50美元/MB這個(gè)水平,主流VGA顯示器的分辨率則是640*480。
即便使用當(dāng)時(shí)最先進(jìn)的解決方案,3D圖像顯示所需要的DRAM也得4MB,所以單單是這塊DRAM的成本就需要200美元。
加上板上的控制芯片和其他組件,再算上一定的利潤(rùn)空間,最終這些產(chǎn)品的定價(jià)得要1000美元往上。雖然今天游戲玩家花大幾千或者上萬(wàn)的價(jià)格買(mǎi)張顯卡還處在可以理解的范疇,但這是因?yàn)閲@這張顯卡已經(jīng)建立起了豐富的生態(tài)。而在30年前是沒(méi)有這么多所謂的3A大作的,消費(fèi)級(jí)市場(chǎng)不會(huì)有人愿意花這么多錢(qián)買(mǎi)個(gè)電子元件回來(lái)當(dāng)擺設(shè)。
所以黃仁勛他們圍繞DRAM搞了技術(shù)創(chuàng)新,使得英偉達(dá)產(chǎn)品需要的內(nèi)存空間大大降低,從紅杉那里融到的1千萬(wàn)美元很大部分也都花在了這個(gè)“遙遙領(lǐng)先”的解決方案上。黃仁勛本來(lái)以為這會(huì)給他們的產(chǎn)品帶來(lái)差異化的競(jìng)爭(zhēng)力,但到創(chuàng)業(yè)的第二年,DRAM的價(jià)格就從單價(jià)50美元跌到了5美元。
這意味著英偉達(dá)前期瞄著內(nèi)存優(yōu)化做的巨大投入完全打了水漂。
后來(lái)的幾乎所有文章都把英偉達(dá)NV1這款產(chǎn)品的失敗,歸結(jié)到跟OpenGL路線的三角渲染模式不兼容上面,但實(shí)際上不兼容并不是NV1失敗的真正原因。給NV1造成致命打擊的,是內(nèi)存價(jià)格暴跌把NV1從先進(jìn)變成了不先進(jìn),而一款不先進(jìn)的產(chǎn)品并沒(méi)有機(jī)會(huì)參與行業(yè)標(biāo)準(zhǔn)的塑造,最終的不兼容其實(shí)是結(jié)果而非原因。
DRAM價(jià)格暴跌的原因是供過(guò)于求,新產(chǎn)能的主要貢獻(xiàn)者是亞洲人。在九十年代,韓國(guó)和臺(tái)灣的經(jīng)濟(jì)都出現(xiàn)了爆發(fā)性增長(zhǎng),兩家的經(jīng)濟(jì)模式都是出口導(dǎo)向,支柱產(chǎn)業(yè)是電子和半導(dǎo)體。以韓國(guó)為例,在政府支持下,幾家財(cái)閥借助從銀行獲得的貸款大量進(jìn)行資本開(kāi)支,生產(chǎn)規(guī)模迅速擴(kuò)張。僅韓國(guó)內(nèi)存行業(yè)產(chǎn)能在1991到1995的短短幾年里就增長(zhǎng)了8.3倍。
由于行業(yè)特性,內(nèi)存晶圓廠需要保持很高的產(chǎn)能利用率才能攤平固定成本。內(nèi)存廠商甚至?xí)诿髦┙o遠(yuǎn)超需求的情況下繼續(xù)生產(chǎn),這進(jìn)一步推低了產(chǎn)品價(jià)格。不過(guò)這些余波對(duì)黃仁勛而言已經(jīng)不重要了,因?yàn)榇丝痰挠ミ_(dá)要拋掉過(guò)去另起新灶了。
02、英特爾不是對(duì)手,是黑洞
在NV1發(fā)布的兩年后,英偉達(dá)迎來(lái)了第一款成功的產(chǎn)品:RIVA128。RIVA128這塊產(chǎn)品標(biāo)志著英偉達(dá)在技術(shù)路線上的重大轉(zhuǎn)向,英偉達(dá)徹底放棄了之前與行業(yè)不兼容的解決方案,選擇全面擁抱Direct3D和OpenGL的技術(shù)規(guī)范。
這個(gè)時(shí)候3Dfx公司生產(chǎn)的Voodoo顯卡已經(jīng)成為行業(yè)標(biāo)桿,而剛推出的RIVA128由于驅(qū)動(dòng)問(wèn)題在圖像質(zhì)量上跟Voodoo有明顯差距。
不過(guò)英偉達(dá)通過(guò)后續(xù)的固件更新,很快使RIVA128輸出的圖像畫(huà)質(zhì)趕上甚至超越Voodoo。在這種情況下,RIVA128兩個(gè)設(shè)計(jì)優(yōu)勢(shì)就體現(xiàn)了出來(lái)。
一方面,大概是前期走自主路線累積的技術(shù)基礎(chǔ),英偉達(dá)在RIVA128上通過(guò)特殊的內(nèi)存架構(gòu)設(shè)計(jì),使得其能夠輸出更高分辨率的圖像。另一方面,跟Voodoo顯卡不同,RIVA128同時(shí)集成了2D和3D圖形芯片,這使得插RIVA128的電腦不需要一張單獨(dú)的2D顯卡來(lái)處理輸出。
接下來(lái)的時(shí)間里,RIVA128及其改款產(chǎn)品幫助英偉達(dá)在顯卡市場(chǎng)站穩(wěn)了腳跟。1999年,英偉達(dá)發(fā)布了第一款GeForce系列產(chǎn)品:GeForce256。盡管在這之前其實(shí)已經(jīng)有了類似的概念,但英偉達(dá)仍然把GeForce256稱之為“世界上第一款GPU”,GPU這個(gè)新潮的詞匯走向大眾化也是從這開(kāi)始的。
GeForce256的確算得上是一張劃時(shí)代的GPU,它第一次把多邊形轉(zhuǎn)換與光源處理(T&L)相關(guān)的幾何計(jì)算從CPU肩上解放了出來(lái)。
這里我們不妨對(duì)芯片特點(diǎn)做個(gè)簡(jiǎn)單的科普。所有的芯片大致可以分成兩個(gè)類型,通才和專才。通才類型的芯片就是CPU,它們是不折不扣的多面手,能夠執(zhí)行各種通用普遍的計(jì)算任務(wù)。而GPU則更接近專才,它們就像精通某項(xiàng)技藝的大國(guó)工匠,擅長(zhǎng)于把聚焦范圍內(nèi)的任務(wù)做到極致。
而芯片行業(yè)歷史上的一個(gè)大趨勢(shì),就是由于摩爾定律的存在,CPU能做的事情越來(lái)越多,性能也越來(lái)越強(qiáng)。這就導(dǎo)致很多計(jì)算任務(wù)開(kāi)始是由專有設(shè)備完成的,但當(dāng)這些任務(wù)變得普遍同時(shí)又趨于穩(wěn)定的時(shí)候,把它們集成進(jìn)CPU就是水到渠成的轉(zhuǎn)折。
這個(gè)過(guò)程中,CPU廠商加強(qiáng)了產(chǎn)品競(jìng)爭(zhēng)力,消費(fèi)者因?yàn)榧色@得了性價(jià)比,只有原來(lái)這些專有廠商被掃進(jìn)了歷史的垃圾堆:通才型芯片像個(gè)黑洞一樣,把專才芯片吸納進(jìn)去。
比如,密碼學(xué)作為現(xiàn)代網(wǎng)絡(luò)通信的關(guān)鍵基礎(chǔ)設(shè)施,初期就是靠單獨(dú)的集成電路實(shí)現(xiàn)的,后來(lái)變成了CPU的幾條指令。其他像音頻卡、視頻卡之類的產(chǎn)品,也都重復(fù)了類似的發(fā)展路徑。
在這個(gè)背景下,再來(lái)看GeForce256將T&L計(jì)算任務(wù)從CPU那里拿過(guò)來(lái)的操作,就有了非同一般的象征意義。因?yàn)閺男袠I(yè)發(fā)展方向來(lái)說(shuō),這是跟我們上面描述的“通才吸納專才”這個(gè)過(guò)程完全相反的動(dòng)作。
作為芯片行業(yè)一個(gè)剛剛起步的玩家,在看到那些同行前赴后繼的悲慘命運(yùn)過(guò)后,黃仁勛明白只有創(chuàng)造獨(dú)特價(jià)值,企業(yè)才有長(zhǎng)期存在的可能。
幸運(yùn)的是,跟密碼學(xué)或者普通的音視頻解碼相比,3D圖像領(lǐng)域有著高得多的天花板。普通用戶總是在期待畫(huà)面質(zhì)量更加精致,圖像刷新速率更高,這帶來(lái)了對(duì)GPU性能的追求。而反過(guò)來(lái)當(dāng)GPU對(duì)現(xiàn)有需求進(jìn)行回應(yīng)后,又會(huì)再度激發(fā)新的需求,這構(gòu)成了長(zhǎng)期維持的正向循環(huán)激勵(lì)。
直到現(xiàn)在,最旗艦GPU往往也只是剛好滿足最苛刻3A游戲的性能需求。同時(shí),像元宇宙這類新的應(yīng)用前景,已經(jīng)因?yàn)橛|及現(xiàn)有的算力瓶頸而難以到達(dá)。
所以現(xiàn)實(shí)的情況總是,即便核顯達(dá)到了幾年前獨(dú)立GPU的性能,英偉達(dá)新的GPU又與之拉開(kāi)了顯著的差距。對(duì)英特爾而言,在很長(zhǎng)一段時(shí)間里它其實(shí)算不上英偉達(dá)的對(duì)手,因?yàn)樗⒉幌脒M(jìn)入并主導(dǎo)GPU這個(gè)行業(yè),而是在等待吞并并消滅這個(gè)行業(yè),就像它曾經(jīng)多次做到的那樣。
03、漫長(zhǎng)季節(jié)里長(zhǎng)出的CUDA
到目前為止的30年里,除了創(chuàng)立初期那段時(shí)間,此后的英偉達(dá)幾乎再也沒(méi)有遇到過(guò)生死存亡的危急時(shí)刻。在把昔日巨頭3Dfx收入囊中過(guò)后,GPU行業(yè)進(jìn)入了英偉達(dá)/ATI寡頭壟斷時(shí)代。隨后十幾年里英偉達(dá)的市場(chǎng)份額穩(wěn)步提升,但整體營(yíng)收則在2008年達(dá)到40億美元過(guò)后,緩慢振蕩提升,最終在2016年才艱難到達(dá)50億美元的里程碑。
與之對(duì)應(yīng)的是,在2016年之前,英偉達(dá)的股價(jià)保持在10美元以下的區(qū)間隨業(yè)績(jī)表現(xiàn)浮動(dòng)。這是一段漫長(zhǎng)的季節(jié),過(guò)程中黃仁勛帶領(lǐng)同事做了辛勤的嘗試,英偉達(dá)龐大帝國(guó)的地基在此期間悄然建立。
我們?cè)谏蟼€(gè)部分曾經(jīng)談過(guò),為了避免被集成,造GPU的英偉達(dá)需要跑得比造CPU的英特爾更快。這個(gè)目標(biāo)是通過(guò)造更強(qiáng)大的芯片,同時(shí)向開(kāi)發(fā)者群體提供更多能有效利用這些強(qiáng)大芯片的工具棧來(lái)實(shí)現(xiàn)的。
這個(gè)群體里比例最大的一部分是游戲開(kāi)發(fā)者,所以英偉達(dá)發(fā)明了可編程著色器(programmable shader)這樣的技術(shù),來(lái)使得游戲開(kāi)發(fā)在畫(huà)面呈現(xiàn)上有更多的靈活度和特色。
黃仁勛本人把可編程著色器視為英偉達(dá)史上最關(guān)鍵的創(chuàng)新之一,它擴(kuò)張了行業(yè)邊界,也正是這項(xiàng)技術(shù)使GPU能夠消耗掉越來(lái)越多的晶體管和算力,也就避免了被CPU或者主板上的芯片組集成吞并。
但黃仁勛的技術(shù)遠(yuǎn)見(jiàn)在于,他不只是帶著英偉達(dá)沿著計(jì)算圖形這條路走到底,還很早就看到了GPU和CPU在計(jì)算范式上的本質(zhì)區(qū)別,并以極大的耐心和勇氣為此做了充分的準(zhǔn)備。
人們?cè)谶M(jìn)入千禧年后不久,其實(shí)就已經(jīng)發(fā)現(xiàn)摩爾定律在逐步失效,因而多核CPU漸成趨勢(shì)。發(fā)展到今天,頂級(jí)的消費(fèi)級(jí)CPU已經(jīng)堆到16個(gè)物理核心,服務(wù)器CPU甚至有高達(dá)128個(gè)物理核心,因此面向CPU的多線程并行編程早已變得相當(dāng)普遍。
但CPU的多核并行跟GPU出發(fā)點(diǎn)完全不同,多核CPU的出現(xiàn)更多是為應(yīng)對(duì)單核性能難以繼續(xù)保持大幅提升的退而求其次,而GPU從一開(kāi)始方法論就是把大問(wèn)題分解成盡可能多的小問(wèn)題,然后再用盡可能多的“弱”計(jì)算核心去解決這些小問(wèn)題。
舉個(gè)例子,跟如今高端消費(fèi)級(jí)CPU的16個(gè)核心相比,像4090這類高端的消費(fèi)級(jí)GPU擁有超過(guò)16000個(gè)核心,千倍的量變顯然意味著質(zhì)變。
以可編程著色器為代表的技術(shù),只是上述模式在圖形計(jì)算領(lǐng)域的應(yīng)用,將其進(jìn)一步推而廣之至通用計(jì)算領(lǐng)域?qū)⒂懈鼜V闊的新世界,而英偉達(dá)打開(kāi)這個(gè)新世界的鑰匙就是CUDA。
用黃仁勛的話說(shuō),第一步是“make graphics programmable”, 第二步則是“open up GPU for programmability for all kinds of things”。
在英偉達(dá)推出CUDA之前,GPU編程是件非常麻煩的事情,需要寫(xiě)很多底層代碼。CUDA的易用性使得更廣泛的人群成為開(kāi)發(fā)者,釋放出GPU這個(gè)計(jì)算平臺(tái)的潛力。但在英偉達(dá)的每張顯卡上都嵌入對(duì)CUDA的支持是種成本很高的做法,CUDA體系的研發(fā)和維護(hù)也都需要巨量的資源投入。
不過(guò)無(wú)論黃仁勛如何苦口婆心地闡述CUDA是項(xiàng)多么偉大的創(chuàng)新,華爾街的分析師們并不買(mǎi)賬,所以英偉達(dá)的股*長(zhǎng)期保持在個(gè)位數(shù)美元的位置徘徊。站在今天往回看,當(dāng)然會(huì)有人罵這群分析師身在寶山不識(shí)寶。不過(guò)分析師也有話說(shuō)啊,畢竟這些年里科技公司吹過(guò)但沒(méi)實(shí)現(xiàn)的牛逼太多了。
04、失敗的Tegra,成功的Orin
2013年9月5日,雷軍在北京國(guó)家會(huì)議中心發(fā)布了第三代小米手機(jī)。黃仁勛當(dāng)時(shí)作為特邀嘉賓,也來(lái)到了現(xiàn)場(chǎng)。當(dāng)時(shí)小米還沒(méi)有PC產(chǎn)品線,黃仁勛來(lái)北京是為了給旗下的手機(jī)SoC站臺(tái),小米3的移動(dòng)版用的是英偉達(dá)Tegra4四核CPU。
盡管發(fā)布會(huì)上兩人談笑風(fēng)生,但雷軍并沒(méi)有把寶全壓在英偉達(dá)上面,小米3的聯(lián)通和電信版都用的高通處理器。
這是英偉達(dá)進(jìn)軍移動(dòng)計(jì)算領(lǐng)域的高光時(shí)刻,也是黃仁勛當(dāng)時(shí)為英偉達(dá)尋找的下個(gè)星辰大海。在智能手機(jī)浪潮興起后,黃仁勛認(rèn)為移動(dòng)計(jì)算領(lǐng)域的蓬勃需求將誘發(fā)一場(chǎng)革命,這最終甚至?xí)催^(guò)來(lái)顛覆PC和服務(wù)器市場(chǎng)。
2011年初,黃仁勛接受科技媒體VentureBeat采訪時(shí)說(shuō)到,Tegra系列芯片將會(huì)使英偉達(dá)的有效市場(chǎng)擴(kuò)大6倍。
不過(guò)在說(shuō)完這句話后,黃仁勛還順便跟了句諾基亞從塞班系統(tǒng)向Windows的轉(zhuǎn)型會(huì)是英偉達(dá)的“絕好機(jī)會(huì)”。除諾基亞之外,Tegra芯片的另一個(gè)關(guān)鍵客戶是摩托羅拉。旗下的安卓平板Motorola Xoom正是使用的Tegra2芯片。在蘋(píng)果的iPad2代500美元起售的情況下,Xoom這款平板的定價(jià)達(dá)到了800美元。
事后來(lái)看,這些細(xì)節(jié)大概已然預(yù)示了英偉達(dá)Tegra產(chǎn)品線進(jìn)入移動(dòng)芯片市場(chǎng)將遭受的失敗。
不過(guò)英偉達(dá)對(duì)Tegra的投入并非竹籃打水,頗有失之東隅收之桑榆的幸運(yùn)感。在最終因?yàn)榛鶐?wèn)題徹底退出手機(jī)市場(chǎng)后,Tegra系列產(chǎn)品轉(zhuǎn)變了設(shè)計(jì)目標(biāo),從此前瞄準(zhǔn)功耗和效率的表現(xiàn)調(diào)整到專注于性能。
典型的代表產(chǎn)品是Tegra X1,該款芯片被用在了任天堂的Switch游戲主機(jī)上面,被認(rèn)為帶來(lái)了優(yōu)質(zhì)的畫(huà)面體驗(yàn)。
更進(jìn)一步的,研發(fā)Tegra系列芯片的過(guò)程中,英偉達(dá)積累了豐富的SoC開(kāi)發(fā)經(jīng)驗(yàn),這雖然最終沒(méi)能撬開(kāi)移動(dòng)市場(chǎng),但卻幫助英偉達(dá)快速布局了智能汽車(chē)時(shí)代。在采用軟硬件全棧自研之前,特斯拉汽車(chē)上就搭載的Tegra X2芯片。
同時(shí),當(dāng)前高端智能汽車(chē)上標(biāo)配的Orin芯片也是屬于Tegra這個(gè)系列。實(shí)際上,目前英偉達(dá)服務(wù)于駕駛輔助的“Nvidia Drive”和服務(wù)于嵌入式設(shè)備自動(dòng)化的“Nvidia Jetson”都是基于Tegra系列芯片。
自動(dòng)駕駛芯片是智能駕駛平臺(tái)的關(guān)鍵要素,在英偉達(dá)之外,高通和英特爾也對(duì)此雄心勃勃。不過(guò)就目前的形勢(shì)來(lái)說(shuō),英偉達(dá)仍然處于明顯領(lǐng)先的位置。
英特爾這邊,在以高額溢價(jià)支付153億美元收購(gòu)Mobileye過(guò)后,雖然一舉跨進(jìn)了汽車(chē)零部件供應(yīng)商的第一陣營(yíng),但在高端產(chǎn)品性能上已被英偉達(dá)拉開(kāi)差距。根據(jù)Mobileye向美國(guó)證監(jiān)會(huì)SEC提交的文件,Mobileye的估值已從去年3月的500億美元大幅下滑至160億美元。而高通這邊,在以440億美元收購(gòu)恩智浦的交易告吹后,主要聲量更多集中在以驍龍8155為代表的座艙芯片上面。
05、算法、硬件和彩票
愛(ài)迪生在1877年造出了世界上第一臺(tái)留聲機(jī),隨后這項(xiàng)發(fā)明跟黑膠唱片一起,在那個(gè)年代的音樂(lè)愛(ài)好者群體里擴(kuò)散開(kāi)來(lái)。但愛(ài)迪生本人對(duì)這個(gè)現(xiàn)實(shí)感到沮喪和失望,因?yàn)樗畛鯙榱袈暀C(jī)設(shè)計(jì)的用途是記錄臨終之人的遺言。跟這個(gè)設(shè)想比起來(lái),拿留聲機(jī)聽(tīng)音樂(lè)這事就有點(diǎn)太low了。
在科技史上,這種不按劇本走的發(fā)明其實(shí)不少,另外一個(gè)較為著名的例子是輝瑞公司研發(fā)的心血管藥物西地那非。這種命運(yùn)的奇特安排有時(shí)是一種捉弄,有時(shí)則被證明是一種幸運(yùn),就像英偉達(dá)一樣。
當(dāng)然,這么說(shuō)并不是要否定黃仁勛的技術(shù)眼光和商業(yè)才能,而是強(qiáng)調(diào)在個(gè)人奮斗的因素之外,也要考慮到歷史的行程。
黃仁勛當(dāng)然一直知道在電子游戲之外,英偉達(dá)的GPU存在更多的潛力,從一種新的計(jì)算范式角度來(lái)理解GPU,將會(huì)帶來(lái)大得多的可能。但根據(jù)福布斯2016的一篇文章,他并沒(méi)有實(shí)際上預(yù)料到深度學(xué)習(xí)會(huì)成為GPU的爆發(fā)性應(yīng)用。
深度學(xué)習(xí)的基礎(chǔ)性工作早在上個(gè)世紀(jì)就已經(jīng)奠基完畢:反向傳播算法最早在1963年就已經(jīng)提出,深度卷積神經(jīng)網(wǎng)絡(luò)則是在1979年就存在了。但在中間這幾十年里,這些概念并沒(méi)有被發(fā)揚(yáng)光大,直到我們有了足夠多的數(shù)據(jù)和充分的算力。
事實(shí)上,Google Brain一位叫做薩拉·胡克的研究員把深度學(xué)習(xí)通過(guò)現(xiàn)代GPU設(shè)備取得的進(jìn)展稱之為中了“硬件彩票”。雖然薩拉那篇論文的核心觀點(diǎn)是想提醒公眾,如今在學(xué)術(shù)界和業(yè)界取得成功脫穎而出的研究想法,很大可能并不是因?yàn)檫@些想法本身在解決對(duì)應(yīng)問(wèn)題上優(yōu)于其他失敗的idea,只是因?yàn)檫@類想法更符合現(xiàn)有的硬件環(huán)境。
她認(rèn)為深度學(xué)習(xí)在GPU這類并行計(jì)算設(shè)備幫助下取得的成績(jī),或許就是例子。但從薩拉的觀點(diǎn)中,我們顯然也可以反過(guò)來(lái)窺見(jiàn)一絲GPU最終被深度學(xué)習(xí)選中的偶然性。
今天我們談起深度學(xué)習(xí)的起源和英偉達(dá)的命運(yùn)拐點(diǎn)時(shí),總是繞不開(kāi)的一個(gè)標(biāo)志性事件,即2012年Hinton及他的博士生Krizhevsky和Sutskever參加ImageNet圖像識(shí)別大賽時(shí),用卷積神經(jīng)網(wǎng)絡(luò)把錯(cuò)誤率從上年度的25%一舉降到了15%。而Krizhevsky等人在訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的時(shí)候,使用了兩張英偉達(dá)的GeForce游戲顯卡學(xué)習(xí)了120萬(wàn)張圖片。
但Krizhevsky等人并不是第一個(gè)使用GPU來(lái)訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)的學(xué)者。吳恩達(dá)的斯坦福團(tuán)隊(duì)在2008年就寫(xiě)了一篇《Large-scale Deep Unsupervised Learning using Graphics Processors》的論文,里面提到用GPU可以大幅加速神經(jīng)網(wǎng)絡(luò)模型的學(xué)習(xí)過(guò)程。
然而直到2013年的英偉達(dá)GTC大會(huì)上,黃仁勛演講時(shí)的keynote里都基本沒(méi)有怎么提AI。要等到第二年的GTC,我們才會(huì)看到黃仁勛把人工智能領(lǐng)域看作英偉達(dá)最關(guān)鍵的業(yè)務(wù)。
這也說(shuō)明黃仁勛并非一開(kāi)始就推all in AI,而是在業(yè)界已然形成風(fēng)氣后才做這件事。不過(guò)即便從這時(shí)間節(jié)點(diǎn)上來(lái)說(shuō),英偉達(dá)的動(dòng)作也算相當(dāng)早了。
當(dāng)然,如之前所說(shuō),沒(méi)有精準(zhǔn)預(yù)見(jiàn)AI會(huì)在多年后成為英偉達(dá)的帝國(guó)基座,并不影響黃仁勛的偉大。
某種程度上說(shuō),從最初沿著圖像計(jì)算這個(gè)方向的創(chuàng)新,到后來(lái)圍繞CUDA建立的技術(shù)生態(tài),英偉達(dá)的布局注定將會(huì)長(zhǎng)出驚艷的果實(shí)。黃仁勛沒(méi)有預(yù)料到這個(gè)果實(shí)具體會(huì)是什么,但他知道它一定會(huì)長(zhǎng)出來(lái)。
最新的二季度財(cái)報(bào)顯示,英偉達(dá)本季營(yíng)收達(dá)到了破紀(jì)錄的135.1億美元,同比增長(zhǎng)101%。其中,最大貢獻(xiàn)為數(shù)據(jù)中心業(yè)務(wù),當(dāng)季業(yè)務(wù)收入為103.2億美元,同比增長(zhǎng)171%,同創(chuàng)下歷史新高。即便在之前的業(yè)績(jī)指引里,已經(jīng)預(yù)料到這個(gè)季度營(yíng)收和利潤(rùn)會(huì)爆,但管理層和華爾街都沒(méi)想到會(huì)爆的這么厲害。
自2021財(cái)年Q2數(shù)據(jù)中心營(yíng)收超過(guò)游戲業(yè)務(wù)以來(lái),前者日益成為英偉達(dá)業(yè)績(jī)的壓艙石。二季度數(shù)據(jù)中心業(yè)務(wù)收入占總收入的比例從去年同期的35%上升到了76%。
如果要提英偉達(dá)近幾年唯一經(jīng)歷的一個(gè)挫敗,大概就是2020年對(duì)Arm公司的收購(gòu)因監(jiān)管原因告吹。
我們之前在第二部分里提到過(guò),從芯片的分類來(lái)說(shuō),英特爾和英偉達(dá)分別處于通才和專才兩端。當(dāng)下數(shù)據(jù)中心的發(fā)展趨勢(shì)是系統(tǒng)集成程度越來(lái)越高,越來(lái)越往SoC的方向發(fā)展,芯片公司需要整合CPU和GPU,就像蘋(píng)果在消費(fèi)者業(yè)務(wù)里M系列芯片做的那樣。
而隨著數(shù)據(jù)中心業(yè)務(wù)對(duì)于兩家公司的重要性不斷提升,二者都在試圖彌補(bǔ)自身的短板。
英特爾一直都是做CPU的,它需要往專才的方向靠,所以過(guò)去幾年接連收購(gòu)了Altera、Mobileye、Habana Labs等公司;而英偉達(dá)一直都是做GPU的,所以它需要往通才的方向靠,這構(gòu)成了它收購(gòu)Arm的基本邏輯。另外,從這個(gè)角度看,AMD由于在很早之前就收購(gòu)了ATI,有著多年CPU和GPU兩方面的打螺絲經(jīng)驗(yàn),所以理論上說(shuō)它其實(shí)有些獨(dú)特的優(yōu)勢(shì)。
當(dāng)然,這樁收購(gòu)案告吹的最大受害者可能是孫正義,即便他剛從Arm上市中回了波血。
當(dāng)時(shí)軟銀因終止收購(gòu)獲得的12.5億美元分手費(fèi),對(duì)于本來(lái)可能獲得的收益來(lái)說(shuō)顯得不值一提。因?yàn)?020年的時(shí)候英偉達(dá)的收購(gòu)要約是120億美元現(xiàn)金,加上215億美元的英偉達(dá)股*。如果按照最新市值計(jì)算,這筆交易的價(jià)值已經(jīng)在千億美元規(guī)模。這樣看,孫正義愿景基金上個(gè)財(cái)年虧損的320億美元,或許都有機(jī)會(huì)找補(bǔ)回來(lái)。
06、寫(xiě)在最后
英特爾的創(chuàng)始員工和第三任CEO安迪·格魯夫曾說(shuō)過(guò)一句話,“成功引起自滿,自滿導(dǎo)致失敗,只有偏執(zhí)狂才能生存”。
我們很難說(shuō)這是否道出了英特爾錯(cuò)失新浪潮的原因,但可以確定的是,黃仁勛的偏執(zhí)是今天成就英偉達(dá)的關(guān)鍵。在商業(yè)和技術(shù)兩方面,他都稱得上是天才。
在目所能及的范圍內(nèi),當(dāng)下的英偉達(dá)還沒(méi)有與之匹敵的對(duì)手。但萬(wàn)億英偉達(dá)所昭示的簡(jiǎn)單事實(shí)是,它正處在一條前途光明但又令人趨之若鶩的賽道上。谷歌亞馬遜微軟這些大廠都在嘗試自己設(shè)計(jì)的AI加速芯片,瞄準(zhǔn)自動(dòng)駕駛和其他AI算力的創(chuàng)業(yè)公司如雨后春筍,而已被甩在身后的AMD和英特爾更有充分的可能卷土重來(lái)。
黃仁勛仍需帶領(lǐng)英偉達(dá)的同志繼續(xù)保持謙虛謹(jǐn)慎、不驕不躁的作風(fēng)。