熱火烹油的大模型賽道打起了“嘴仗”。
搜狗前CEO王小川評(píng)價(jià)百度創(chuàng)始人李彥宏的采訪發(fā)言稱:“你們采訪的可能是平行世界的他,不是我們這個(gè)世界里的?!?/span>
而針對王小川的評(píng)論,百度集團(tuán)副總裁、搜索平臺(tái)負(fù)責(zé)人肖陽又回應(yīng)道:“王小川脫離一線太久,確實(shí)跟我們不在一個(gè)宇宙,自然對國內(nèi)人工智能技術(shù)的發(fā)展缺乏了解?!?/span>
意外的是,王小川在14日凌晨又“嘲諷”了一把,稱對方是“脫離一線15年的人,去懟離開1.5年的人”。
這場爭論也暴露出創(chuàng)業(yè)派與大廠間微妙的競爭關(guān)系。
毋庸置疑,大模型技術(shù)徹底點(diǎn)燃了科技圈的熱情,創(chuàng)業(yè)者忙著招兵買馬,生怕錯(cuò)過了新風(fēng)口;一級(jí)市場關(guān)于大模型的投融資熱度攀升,不少FA們甚至跑去B站開始惡補(bǔ)AI知識(shí)。
政策端也在吹來暖風(fēng),北京市經(jīng)濟(jì)和信息化局發(fā)布的《2022年北京人工智能產(chǎn)業(yè)發(fā)展白皮書》顯示,今年,北京將支持頭部企業(yè)打造對標(biāo)ChatGPT的大模型。
熱鬧只是硬幣的A面。
無論是忙著官宣大模型的科技大廠,還是廣發(fā)英雄帖的創(chuàng)業(yè)公司,身處這股浪潮之中的人們都在思考一些關(guān)鍵問題:率先做出第一個(gè)中國版GPT的是誰?還有多久才能做出來?市場格局又會(huì)是發(fā)生怎樣的變化?
這些問題都難以給出正確的答案,事實(shí)上,也沒有人能給出準(zhǔn)確的回答。畢竟,人們總是高估一項(xiàng)科技所帶來的短期效益,卻又低估它的長期影響。
本文將圍繞當(dāng)下中國的大模型競爭現(xiàn)狀,基于行業(yè)資料與研究,主要回答三個(gè)問題:
1.為什么國內(nèi)科技公司要紛紛競逐大模型?
2.火熱背后,中國科技公司究竟缺什么?
3.中國科技公司“大模型之戰(zhàn)”的走向會(huì)是什么?
理解中國科技巨頭們的“大模型焦慮”,一張產(chǎn)品發(fā)布時(shí)刻表就夠了。
在OpenAI發(fā)布GPT-4大模型后,百度用“Demo演示”的形式正式發(fā)布文心一言。同樣在3月,53歲的周鴻祎決定“把剛出生的孩子抱出來給大家看看”,他推出360的大模型產(chǎn)品,甚至倉促到名字都要現(xiàn)場取。
隨后的一個(gè)多月里,科技巨頭、創(chuàng)業(yè)公司與高校研究院們展開了一輪關(guān)于“大模型”的軍備競賽,整個(gè)4月可以被稱為“大模型的發(fā)布月”,繼百度之后,華為、商湯、阿里已在4月亮出自己的大模型產(chǎn)品。
最新的消息是,京東計(jì)劃在今年發(fā)布新一代產(chǎn)業(yè)大模型“言犀”,被視為“京東版”ChatGPT。
大模型也成為了互聯(lián)網(wǎng)大佬扎堆二次創(chuàng)業(yè)的熱門賽道。
原美團(tuán)聯(lián)合創(chuàng)始人王惠文、創(chuàng)新工場CEO李開復(fù)、前京東AI掌門人周伯文、前阿里技術(shù)副總裁賈揚(yáng)清等均入局創(chuàng)業(yè)。前搜狗CEO王小川的百川智能已完成了5000萬美元融資,王小川給了自己一個(gè)DDL:“今年年底做到國內(nèi)最好的”。
一位業(yè)內(nèi)人士這樣形容當(dāng)下百花齊放的圖景:“(這波創(chuàng)業(yè))很像2000年左右的互聯(lián)網(wǎng)創(chuàng)業(yè)潮?!?/span>
普通讀者們很難理解科技圈對大模型的擁躉,畢竟類似的創(chuàng)業(yè)潮在元宇宙、XR行業(yè)也都復(fù)現(xiàn)過。但如果深入理解人工智能的發(fā)展歷史與傳統(tǒng)AI時(shí)代的困境,就能理解為何這群極客們?nèi)绱藷釔鄞竽P汀?/span>
關(guān)于大模型的定義,OpenAI創(chuàng)始人Altman與李開復(fù)更愿意將大模型定義為“一種新技術(shù)平臺(tái)”,而學(xué)界則將“大模型”對比“小模型”,定義為一種“基于大量數(shù)據(jù)訓(xùn)練的、擁有巨量參數(shù)的模型”,這種模型能適應(yīng)廣泛的下游任務(wù)。
在AI1.0時(shí)代,比起創(chuàng)業(yè)者對AI智能化的疾呼,大多數(shù)人對人工智能只停留在一些單一場景產(chǎn)品端的理解。
例如人工智能客服、人工智能質(zhì)檢等,上述場景都是針對一項(xiàng)任務(wù)具體開發(fā)一個(gè)專用小模型,并不具備“理解能力”。就像周鴻祎將此前的人工智能產(chǎn)品形容為“人工智障”,在他看來:“在GPT之前,從來沒有一個(gè)人工智能的產(chǎn)品能真正的理解我們這個(gè)世界?!?/span>
從人工智障到人工智能的進(jìn)化,大模型的出現(xiàn)意味著人們正式進(jìn)入到AI2.0時(shí)代,這背后是大模型的涌現(xiàn)性使然。
涌現(xiàn)是人工智能領(lǐng)域經(jīng)常會(huì)被提及到的概念,代表一種從量變到質(zhì)變的過程,當(dāng)數(shù)據(jù)規(guī)模足夠大,參數(shù)達(dá)到千億級(jí),即使在沒有專門訓(xùn)練過的領(lǐng)域,AI也能涌現(xiàn)出知識(shí)理解和邏輯推理能力,華東政法大學(xué)人工智能與大數(shù)據(jù)指數(shù)研究院將“涌現(xiàn)性”定義為一個(gè)“多種技術(shù)融合的結(jié)果”:“(大模型)有效集成自然語言處理等多個(gè)人工智能核心研究領(lǐng)域的多項(xiàng)技術(shù),實(shí)現(xiàn)1+1>;2的融合式涌現(xiàn)。”
換言之,大模型有望解決“人工智能如何理解世界”的問題,實(shí)則提供了一條可能邁向AGI(通用人工智能)的可能性。
另一方面,大模型的通用性也在激發(fā)更多的商業(yè)圖景,解決了AI1.0時(shí)代的諸多問題。
在上一波AI創(chuàng)業(yè)潮中,總結(jié)AI企業(yè)所面臨的問題主要兩點(diǎn):一是成本問題,清洗與標(biāo)注海量的數(shù)據(jù)需要耗費(fèi)巨大的成本,商湯科技聯(lián)合創(chuàng)始人、副總裁楊帆曾表示,對于每一個(gè)新場景,公司都要重新收集新數(shù)據(jù),搭建定制化模型。
這種開發(fā)模式很像“小作坊”,不但解決問題的成本極高,開發(fā)模式也十分低效。
在實(shí)際落地過程中,應(yīng)用場景的復(fù)雜性導(dǎo)致AI應(yīng)用的“孤島化”,李開復(fù)曾提到一個(gè)例子:“如果今天一家銀行想做AI應(yīng)用,但沒有任何數(shù)據(jù)可以用來冷啟動(dòng),還要收集、清洗、標(biāo)注數(shù)據(jù),再去做模型,整個(gè)過程代價(jià)都很大?!?/span>
而當(dāng)大模型已成為上層應(yīng)用的技術(shù)底座,可以實(shí)現(xiàn)在AI1.0時(shí)代無法實(shí)現(xiàn)的跨領(lǐng)域部署,支撐終端、平臺(tái)、系統(tǒng)等產(chǎn)品應(yīng)用落地。這種像搭積木一樣“組合創(chuàng)新”的可能性,以及商業(yè)化的能力就像ChatGPT一樣,人們不僅發(fā)現(xiàn),它可以深夜聊天,撫慰人心,還會(huì)寫程序和講故事。
成本問題之外,并不具備通用能力的小模型,由于無法向行業(yè)進(jìn)行推廣與復(fù)用,難以形成規(guī)模效應(yīng),也就更難言盈利。
這種“通用性”激發(fā)出諸多新的商業(yè)圖景,可以將其理解為AI時(shí)代的“操作系統(tǒng)”,在降低開發(fā)成本的同時(shí),人人都可以是開發(fā)者,由此發(fā)現(xiàn)與生產(chǎn)出新的產(chǎn)品與應(yīng)用場景。
大模型競賽的槍響之后,創(chuàng)投行業(yè)又復(fù)現(xiàn)“元宇宙”的熱潮。
有大模型企業(yè)1個(gè)月見的投資人相當(dāng)于去年一整年。一級(jí)市場關(guān)于大模型的投融資熱度攀升,不少FA們甚至跑去B站開始惡補(bǔ)AI知識(shí),生怕錯(cuò)過一個(gè)好項(xiàng)目。
但搶到這張通往新世界的“船票”并非容易,區(qū)別于AI1.0時(shí)代,找錢、找人與找應(yīng)用場景的焦慮,在這一波競逐中,體現(xiàn)的尤為明顯。
首先是找錢。參考多位創(chuàng)業(yè)者的觀點(diǎn),2億美元是行業(yè)普遍認(rèn)為的啟動(dòng)資金。拆解來看,以硬件成本為例,研究機(jī)構(gòu)TrendForce在一份報(bào)告中指出,要處理1800億參數(shù)的GPT-3.5大型模型,需要的GPU芯片數(shù)量高達(dá)2萬顆,未來GPT大模型商業(yè)化所需的GPU芯片數(shù)量甚至?xí)^3萬顆。
僅在算力門檻上,很多創(chuàng)業(yè)企業(yè)便無力與大廠抗衡。
因此,表面上熱火朝天的大模型賽道,風(fēng)大“魚”貴,但實(shí)際投資人們心里也知道,僅靠幾張PPT創(chuàng)新的時(shí)代過去了,投資既是要投靠譜的人,也要考慮賽道與具體的商業(yè)路徑,畢竟,錢也一定要投在刀刃上。
云啟資本合伙人陳昱在接受《甲子光年》采訪時(shí)就表示:“做大模型創(chuàng)業(yè)的公司要融到大錢不容易了?!?/span>
英諾天使基金合伙人王晟曾表示,“我們也經(jīng)?!⒄撐摹?,看到AI領(lǐng)域里很棒的論文,直接就去找作者了,看他是一個(gè)學(xué)霸,還是有創(chuàng)業(yè)潛質(zhì)、業(yè)務(wù)沒有商業(yè)化的潛力,如果合適,我們也會(huì)建議他創(chuàng)業(yè)并考慮投資?!?/span>
比起AI1.0時(shí)代的純科學(xué)家創(chuàng)業(yè),AI2.0時(shí)代更像是一場互聯(lián)網(wǎng)大佬與科學(xué)家們的“集體二次創(chuàng)業(yè)”。
能夠融到“大錢”的要么是有創(chuàng)始人經(jīng)歷或個(gè)人魅力背書,要么就是此前長期跟蹤孵化,雙方一直保持著良好的合作關(guān)系。
比如,目前融資總額已達(dá)數(shù)億元的瀾舟科技是創(chuàng)新工場從0到1孵化出的企業(yè),而由前京東技術(shù)委員會(huì)主席周伯文創(chuàng)立的銜遠(yuǎn)科技,背后的參投方啟明創(chuàng)投等均是AI領(lǐng)域的長期捕手。
其次,找到合適的人也并不容易,在這一點(diǎn)上,科技巨頭與創(chuàng)業(yè)公司面臨相同的處境。在一檔播客節(jié)目中,已宣布加入光年之外的北京智源人工智能研究院副院長劉江曾發(fā)出呼吁:“所有的同學(xué),如果你是AI的頂級(jí)人才,或者有這樣的人,歡迎來到光年之外?!?/span>
“大數(shù)據(jù)+強(qiáng)算法+大算力”被視為支撐大模型落地的重要公式,大廠有算力,也有數(shù)據(jù),能夠提供標(biāo)準(zhǔn)化的產(chǎn)品,但算法背后對應(yīng)的則是人才。大廠很難留住強(qiáng)算法人才的原因在于,大模型投入是一件長期主義的事,必定會(huì)面臨與既有業(yè)務(wù)之間的沖突,從大廠出走的諸多大模型創(chuàng)業(yè)者的經(jīng)歷已然說明了這一點(diǎn)。
而對創(chuàng)業(yè)公司而言,即便有首席科學(xué)家的支撐,找到合適的人也并不容易。
聆心智能創(chuàng)始人、清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系長聘副教授黃民烈認(rèn)為,如OpenAI這種技術(shù)見長的公司需要很多特別牛的工程技術(shù)人才。
對創(chuàng)業(yè)企業(yè)而言,回到前述的融資環(huán)境下,無論是基于創(chuàng)始人的背景背書,抑或是資源合作,都需要長期積淀。
同時(shí),在強(qiáng)調(diào)生態(tài)的大模型賽道,創(chuàng)業(yè)型企業(yè)勢必要面臨來自投資方、合作方乃至競對間的博弈,一個(gè)合適的伙伴不僅要在自己的細(xì)分領(lǐng)域內(nèi)做到頂尖(懂技術(shù)+懂產(chǎn)品),還有隨時(shí)保持戰(zhàn)略的獨(dú)立性,不輕易站隊(duì)。
最后,能否找到合適的應(yīng)用場景,另辟賽道,并迅速建立護(hù)城河壁壘,這一問題也同樣拷問著入局者。
百度李彥宏將當(dāng)前的大模型生態(tài)分為三類,他最看好應(yīng)用層的市場機(jī)遇。
第一類是新型云計(jì)算公司,云計(jì)算主流商業(yè)模式將會(huì)從IaaS變?yōu)镸aaS(模型即服務(wù))。
第二類是進(jìn)行行業(yè)模型精調(diào)的公司,介于通用大模型和企業(yè)之間的中間,這類企業(yè)可以基于對行業(yè)的洞察,調(diào)用通用大模型能力,為行業(yè)客戶提供解決方案。
第三類是應(yīng)用層的企業(yè),基于通用大語言模型開發(fā)應(yīng)用服務(wù),這可能才是真正的機(jī)會(huì)。
區(qū)別于國外專業(yè)化的分工,當(dāng)前,國內(nèi)的大模型賽道的創(chuàng)業(yè)模式主要分類是三類:一類是聚焦基礎(chǔ)層,對標(biāo)OpenAI,發(fā)揮基礎(chǔ)設(shè)施的作用。一類是錨定中間層,不需要如OpenAI一樣花大錢做底層,掌握通用化能力,可以通過開源大模型做精調(diào),讓模型具備差異化能力,最終可以形成垂直類模型。還有一類就是調(diào)用大模型API的企業(yè),專注開發(fā)大模型具體場景的應(yīng)用,如Jasper。
如果將大模型比喻成AI時(shí)代的電,那么基礎(chǔ)層與中間層擔(dān)任的都是“發(fā)電廠”的角色,需要極高的門檻,對資金、技術(shù)以及資源有嚴(yán)格的準(zhǔn)入壁壘,大多也是大公司間的競逐。
百度、阿里、華為頭部企業(yè)均采取“模型+工具平臺(tái)+生態(tài)”三層共建模式的模式,推動(dòng)業(yè)務(wù)的正向循環(huán)。
大廠的競逐中,也涌現(xiàn)出一些創(chuàng)業(yè)公司,既做大模型,又將其能力輸出至垂直行業(yè),形成定制化模型,雖然避開了與有錢有勢的大廠們的直接競爭,但也面臨三大難題。
一是數(shù)據(jù)如何才能做專做細(xì),很多行業(yè)定制化模型依舊難以形成數(shù)據(jù)飛輪與場景飛輪。二是大廠極容易摘低垂的果實(shí),垂直大模型實(shí)現(xiàn)復(fù)用的前提是必須要在該行業(yè)建立壁壘與護(hù)城河,即“人無我有”的競爭優(yōu)勢。三是通用化往往是歷史的趨勢,因此“未來垂直大模型是否會(huì)最終被通用大模型取代”這一問題也值得思考。
人工智能專家侯世達(dá)的學(xué)生梅拉妮·米歇爾在《AI3.0時(shí)代》里認(rèn)為,研究人工智能與賽道中的創(chuàng)業(yè)者們都熟悉了一種模式——先是“人工智能的春天”,緊接著是過度的承諾和媒體炒作,接下來便是“人工智能的寒冬”。從某種程度上來說,這種模式以5~10年為周期在不斷上演。
正在興起的“大模型熱”也必定會(huì)經(jīng)歷從繁榮到擠去泡沫的過程。
對中國的科技公司而言,“能不能做出一個(gè)中國版GPT”“中國創(chuàng)業(yè)公司里是否會(huì)出現(xiàn)一個(gè)OpenAI”。對上述大模型行業(yè)的叩問,從業(yè)者們看法不一。
李彥宏在被問到“中國創(chuàng)業(yè)公司里會(huì)不會(huì)再出一個(gè)OpenAI?”時(shí),他直接回答“基本不會(huì)了”,“沒有必要再重新發(fā)明一遍輪子。”
但另一種觀點(diǎn)也認(rèn)為,中國攻堅(jiān)大模型依舊難以繞開OpenAI,這種危機(jī)感越發(fā)強(qiáng)烈。曠視科技聯(lián)合創(chuàng)始人印奇在接受鈦媒體采訪時(shí)表示,中國攻堅(jiān)AI大模型要先把GPT-3.5復(fù)現(xiàn)出來,但面臨長期技術(shù)創(chuàng)新與短周期商業(yè)化兩重壓力:
“未來的一段時(shí)間,能不能有一個(gè)公司首先把大模型真的做出來,且性能真的是達(dá)到GPT-3.5,這是所有事情的起點(diǎn)。就像菜你沒有炒過,不知道鹽和味精怎么放,而且GPT所消耗的資源、門檻都非常高。”
是崇尚“大算力+大數(shù)據(jù)+強(qiáng)算法”的暴力美學(xué),還是專注將一個(gè)垂直模型做透做專?中國企業(yè)的機(jī)會(huì)又在哪里?又可以在哪些方面深耕與挖掘?
這些問題的答案都亟待解決。
與此同時(shí),人們也關(guān)注大模型行業(yè)未來的市場格局演進(jìn)。未來究竟是兩三家企業(yè)間的競爭,還是百花齊放?“大船票”和“小船票”或牽引企業(yè)走向不一樣的結(jié)局。
在關(guān)于大模型的這場游戲中,盡管尚未看到終局,但對入局者而言,有兩大方向是確定的:
一個(gè)是應(yīng)用與場景先行的邏輯。國產(chǎn)大模型極為強(qiáng)調(diào)產(chǎn)業(yè)側(cè)的價(jià)值,一方面當(dāng)前中國智能化浪潮下,產(chǎn)業(yè)側(cè)數(shù)字化實(shí)踐本就有廣闊的市場需求,另一方面在2B生態(tài)下,基于垂直應(yīng)用的實(shí)踐本身也有利于形成數(shù)據(jù)飛輪與場景飛輪。
以金融業(yè)為例,BloombergGPT的誕生已說明了這一領(lǐng)域既有數(shù)據(jù)基礎(chǔ),也有多元化場景需求。但在此前的實(shí)踐中,存在的問題一是數(shù)據(jù)量龐大,AI專家培養(yǎng)成本高,因此只有頭部銀行機(jī)構(gòu)愿意嘗試。二是金融機(jī)構(gòu)對業(yè)務(wù)的連續(xù)性與數(shù)據(jù)的準(zhǔn)確性有著嚴(yán)苛要求,因此也對大模型廠商對行業(yè)的理解能力提出了高要求。
換言之,回到業(yè)務(wù)本質(zhì),需要什么就用什么。
通用意味著泛化,這為能夠輸出精準(zhǔn)能力的企業(yè)提供了機(jī)會(huì)窗口。如果能將一個(gè)垂直領(lǐng)域做專做透,用高質(zhì)量的數(shù)據(jù)持續(xù)優(yōu)化模型,將價(jià)值鏈做長。對創(chuàng)企而言,金融、醫(yī)療、教育等領(lǐng)域都有市場空間。
二是先行者已提供了路線參照。如周鴻祎所言,差距并非是天壤之別,路線已經(jīng)明確。周鴻祎指出:“發(fā)展大語言模型,別人已經(jīng)指明了技術(shù)路線,剩下的就是長期主義指導(dǎo)下的時(shí)間問題?!?/span>
很難回答,此輪的大模型競逐是否是人工智能競賽浪潮最后的哨聲,但幾乎每個(gè)從業(yè)者都害怕自己會(huì)成為“最后的一個(gè)”??萍即蠊緜兛謶直活嵏?,創(chuàng)業(yè)公司恐懼被大公司們顛覆,更大的恐懼則來自于大模型超越摩爾定律的技術(shù)迭代速度。
而在商業(yè)世界里,危機(jī)與恐懼往往是最好的原動(dòng)力。