“天空沒留下翅膀的痕跡,但我已飛過?!碧└?duì)柕膫魇兰丫洌】尚稳軴penAI視頻生成模型Sora(日語“天空”發(fā)音)在輿論場(chǎng)上的現(xiàn)象級(jí)影響。
在Sora的吹風(fēng)下,被視為”生成式人工智能硬件霸主“的英偉達(dá),市值已躍過2萬億美元大關(guān),其創(chuàng)始人黃仁勛,儼然已成為人類科技發(fā)展的頂級(jí)布道者。而僅在十幾個(gè)月前,被加密貨幣泡沫破裂連番打擊的英偉達(dá),股價(jià)重挫了60%,《經(jīng)濟(jì)學(xué)人》雜志甚至落井下石稱:“當(dāng)他透過眼鏡打量他覺得會(huì)改變AI面貌的花哨新模型,以及像元宇宙這樣更模糊的概念,他是否存在低估此時(shí)此地殘酷性的危險(xiǎn)?”
當(dāng)下令人眼花繚亂,很多生成式AI的技術(shù)預(yù)測(cè)橫空出世,投資者對(duì)生成式AI的前景顯得愈發(fā)興奮。
其實(shí),早在四分之一個(gè)世紀(jì)前,技術(shù)奇點(diǎn)理論布道者Ray Kurzweil在其杰作《靈魂機(jī)器的時(shí)代》中,展望了“大規(guī)模并行神經(jīng)網(wǎng)絡(luò)計(jì)算機(jī)”發(fā)展,并預(yù)測(cè)2020年前后在這一算力基礎(chǔ)支撐下,人工智能技術(shù)將實(shí)現(xiàn)一些里程碑:
絕大部分商業(yè)交易場(chǎng)景都包含有一個(gè)虛擬人;
大多數(shù)道路安裝有自動(dòng)駕駛系統(tǒng);
人們開始與機(jī)器人建立聯(lián)系,把它們當(dāng)作同伴、教師、看護(hù)者甚至愛人;
虛擬藝術(shù)家出現(xiàn)于各種藝術(shù)領(lǐng)域;
媒體廣泛報(bào)道電腦通過了圖靈試驗(yàn),雖然這些試驗(yàn)還不符合內(nèi)行認(rèn)定的標(biāo)準(zhǔn)...
歷經(jīng)二十多年亢奮與失望交錯(cuò)的曲折前行,直到OpenAI的崛起,似乎讓我們堪稱趕上了未來科學(xué)界所描繪的進(jìn)步里程碑。
對(duì)生成式人工智能的技術(shù)意義,素來低調(diào)的深度學(xué)習(xí)教父Geoffrey Hinton也不吝溢美之詞:“AI對(duì)世界的改變將超過人類歷史上任何事物,它在尺度上堪與工業(yè)革命相比,抑或是車輪、電能的發(fā)明”。(“AI is going to change the world more than anything in the history of humanity.”)
的確,即便無法說出Hinton或黃仁勛等大咖的金句,普通公眾也不難從ChatGPT、Sora的病毒式傳播中,被喚醒某種樸素而又強(qiáng)烈的直覺,意識(shí)到一場(chǎng)重大的變革正在當(dāng)下發(fā)生。如果說2016年的AlphaGo人機(jī)大戰(zhàn),完成了對(duì)人工智能“有用性”(usefulness)的全民普及,那么如今熱度一浪高過一浪的AI大模型,則可被視為“易用性”(easeofuse)的清晰展示,技術(shù)擴(kuò)散的兩大先決條件至此已然齊備,人工智能“漫長(zhǎng)的夏天”已可預(yù)見。
宣稱Sora代表著OpenAI底層模型對(duì)真實(shí)世界已具備認(rèn)知和理解能力,AI足以生成自己的開放世界,并且在這個(gè)世界中自我交互、自我進(jìn)化,通向通用人工智能(AGI)的道路已然貫通。
然而,過濾掉李一舟式的”土法上馬“玩家,圍繞生成式AI的解讀已汗牛充棟,但真正能夠解釋出“到底有什么用?有多大用?”這些本質(zhì)的問題上,迄今依然沒有清晰明確的答案,
事實(shí)上,被打磨得絲絲入扣的技術(shù)與商業(yè)演進(jìn)故事中,許多關(guān)鍵里程碑都并非事先存在于某個(gè)技術(shù)天才的腦海,其或是工程實(shí)踐中相互啟迪深化認(rèn)知、逐漸形成的研究群體共識(shí)產(chǎn)物,或是純屬神經(jīng)網(wǎng)絡(luò)模型自行“涌現(xiàn)”的特性。
“人們并不知道他們要的是什么,直到你把它展現(xiàn)在眼前”,喬布斯的這句名言,既適用于創(chuàng)新的受眾,也同樣適用于創(chuàng)新的主體。
就拿OpenAI來說,其GPT模型的性能“涌現(xiàn)”,本就是一個(gè)工程探索中隨著模型參數(shù)量提高而帶來的“意外”,至于Sora所展現(xiàn)出的幀間連貫性、客體一致性,該項(xiàng)目開發(fā)者Tim Brooks同樣坦承是一種未曾事先設(shè)定的能力,從所謂的Diffusion Transformer工程原理看,Sora恐怕的確談不上”世界模型“,按照Yann LeCun對(duì)世界模型的描述,其中所必需的真實(shí)物理世界直覺性”常識(shí)“,顯然與擅長(zhǎng)逼近隱含概率分布的傳統(tǒng)神經(jīng)網(wǎng)絡(luò)路徑南轅北轍,驚艷的視頻效果可能僅僅證明,Sora學(xué)到了物理規(guī)律的概率分布,而不是物理定律本身。
從技術(shù)路線的角度進(jìn)一步深入追問,Sora仍然沒有證明或證偽一個(gè)異常重要的問題:面對(duì)神經(jīng)網(wǎng)絡(luò)的”黑箱“,暴力提升復(fù)雜性的Scaling Law到底是通向AGI的可行路徑,還是一個(gè)低垂果實(shí)被摘取殆盡、飽食之后的甜美錯(cuò)覺?
如果答案是前者,那么毫無疑問,美國已經(jīng)牢牢捏住了通向AGI的全部關(guān)鍵籌碼,從以英偉達(dá)為代表的基礎(chǔ)設(shè)施供應(yīng)商,到OpenAI、谷歌等大模型開發(fā)者,其相對(duì)海外競(jìng)爭(zhēng)者的優(yōu)勢(shì)之大都堪稱驚人,而其對(duì)中國這一主要競(jìng)爭(zhēng)者的連番打壓則顯示出美國人主動(dòng)捍衛(wèi)這一優(yōu)勢(shì)的決心,不過在美國AI產(chǎn)業(yè)”贏麻了“的高光時(shí)刻,或許有必要同時(shí)銘記一個(gè)冷峻的規(guī)律:命運(yùn)的饋贈(zèng),往往也同時(shí)包含著代價(jià)。
埃森哲此前進(jìn)行的一項(xiàng)生成式AI對(duì)人類工作崗位沖擊程度研究中,銀行、保險(xiǎn)、軟件赫然位列風(fēng)險(xiǎn)暴露程度前三高行業(yè),而眾所周知,這些皆為當(dāng)前美國經(jīng)濟(jì)的高端支柱,一旦生成式AI的技術(shù)成熟度越過某一平衡點(diǎn),其加速普及或?qū)⑹姑绹陨碜钕纫沧钌畹馗惺艿睫D(zhuǎn)型之痛,其間的社會(huì)經(jīng)濟(jì)后果尚難意料。
而如果答案是后者,那么人工智能史上第一次大低谷時(shí)的評(píng)斷,同樣可以無縫挪用到今天:“第一個(gè)爬上樹的人可以聲稱這是飛往月球的顯著進(jìn)步”。
在Scaling Law邊際效應(yīng)遞減的情況下,語言文字類大模型應(yīng)用能否克服間歇性幻覺和災(zāi)難性遺忘,避免輸出類似于前一段時(shí)間”動(dòng)車組列車溫度達(dá)到了1538℃“的笑話?
再以Sora為例,其應(yīng)用前景能否指向所謂的”一句話生成一部電影“?從目前推測(cè)看,如果該模型無法實(shí)現(xiàn)連續(xù)提示校正,而只能靠Prompt擲骰子一樣反復(fù)嘗試效果,則其在圖像生產(chǎn)場(chǎng)景中的應(yīng)用仍然會(huì)是鏡花水月,即便是短時(shí)長(zhǎng)的廣告視頻制作,其細(xì)分市場(chǎng)規(guī)模又是否能撐得起當(dāng)下不下10萬億美元的生成式AI概念股市值?
無論如何,有這樣一個(gè)事實(shí)值得強(qiáng)調(diào),今天公眾對(duì)Sora的狂熱期盼,在工業(yè)革命發(fā)軔以來已經(jīng)出現(xiàn)過許多次,每一次人們都認(rèn)為,距離自動(dòng)化帶來的人類社會(huì)新紀(jì)元已經(jīng)咫尺之遙??纯纯刂普撝妇S納在其1950年作品《人有人的用處》中所討論的機(jī)器替代人類可能性及其影響,與今天的輿論議題是何其相似:”從這一階段開始,一切工作都可以由機(jī)器去完成。這種機(jī)械化的方法同樣適用于工業(yè)企業(yè)圖書館和檔案處的絕大部分的工作上面。換句話說,機(jī)器既不偏愛體力勞動(dòng),也不偏愛文牘式的勞動(dòng)。因此,新的工業(yè)革命所能滲透進(jìn)去的領(lǐng)域就會(huì)非常廣泛,包括執(zhí)行不太用腦筋的一切勞動(dòng)在內(nèi)......新工業(yè)革命是一把雙刃刀,它可以用來為人類造福,也可以毀滅人類,如果我們不去理智地利用它,它就有可能很快地發(fā)展到這個(gè)地步的?!?/span>
當(dāng)然,今天的ChatGPT、Sora乃至稍早前同樣里程碑意義的AlphaGO,盡管帶給公眾的感知沖擊清晰而深刻,但任何切換到生產(chǎn)者視角的普通人,都不難立即理解其在能力和場(chǎng)景上,與生產(chǎn)力工具的要求之間仍有深深的鴻溝,激發(fā)起大眾的獵奇心,只是從技術(shù)可能性到商業(yè)變革的萬里長(zhǎng)征第一步。
讓時(shí)間給出答案,或許是最明智的一種態(tài)度。
毋庸置疑,當(dāng)下的AI狂熱,已經(jīng)堪與千禧年的互聯(lián)網(wǎng)泡沫相媲美,彼時(shí)狂熱的投資者與創(chuàng)業(yè)者們,同樣在缺少清晰應(yīng)用場(chǎng)景的情況下,樂于為想象中的變革愿景壓上一切,這場(chǎng)泡沫慘烈破滅后不久,2001年圣誕購物季亞馬遜扭虧為盈,方才標(biāo)志著互聯(lián)網(wǎng)經(jīng)濟(jì)找到了方向感。
人們一次次因?yàn)榭吹缴椒宥霭l(fā),又因?yàn)閷ふ衣窂蕉鴧s步,直到在低谷與邊緣,工程與應(yīng)用創(chuàng)新的重大突破自下而上點(diǎn)燃,歷史的脈絡(luò),總是這么簡(jiǎn)潔而深刻。
以史為鑒,生成式人工智能的產(chǎn)業(yè)化之路,恐怕依然會(huì)是如此,向前走迷迷茫茫,向后看清清楚楚。在主要平臺(tái)型巨頭的AI算力與AI模型”軍備競(jìng)賽“完成后,OpenAI乃至英偉達(dá)的資本泡沫恐怕也將難逃出清命運(yùn),抓緊時(shí)間兌現(xiàn)價(jià)值,這或許正是前者精心包裝Sora以作公關(guān)的意圖所在,不過產(chǎn)業(yè)的精彩,恐怕正要待泡沫破裂之后才會(huì)真正上演。
Kurzweil曾經(jīng)的另一段預(yù)言,或可作為本文結(jié)語與期許:”考慮到所有這些因素,我們有理由估計(jì),到2020年左右一臺(tái)價(jià)值1000美元的個(gè)人計(jì)算機(jī)在運(yùn)算速度和容量方面,尤其是在神經(jīng)連接運(yùn)算(人腦的主要運(yùn)算方式)方面將相當(dāng)于人的大腦“。