2017年,圖靈獎(jiǎng)獲得者JohnHennessy與DavidPatterson在其“計(jì)算機(jī)體系架構(gòu)的黃金年代”主題演講中指出,由于目前通用計(jì)算的性能瓶頸,需要面向不同應(yīng)用場(chǎng)景開發(fā)針對(duì)性優(yōu)化的架構(gòu),他們給出的解決方案是DSA。
所謂DSA(domainspecificarchitecture,特定領(lǐng)域架構(gòu)),是一種針對(duì)特定領(lǐng)域定制的可編程處理器,能夠用于加速某些應(yīng)用程序,實(shí)現(xiàn)更好的性能和性價(jià)比。
尤其是在當(dāng)前摩爾定律放緩的趨勢(shì)下,DSA更是成為一種持續(xù)提升處理器性能的重要技術(shù)理念,即采用可編程的專用集成電路去加速特定的高強(qiáng)度的處理器負(fù)載,比如加速圖形渲染、加速AI神經(jīng)網(wǎng)絡(luò)的前向推理計(jì)算、提高巨量網(wǎng)絡(luò)數(shù)據(jù)的吞吐等。
可以簡(jiǎn)單理解為,以CPU為代表的通用計(jì)算芯片架構(gòu),已經(jīng)無(wú)法很好地匹配和滿足當(dāng)前的市場(chǎng)需求,所以在AI、云計(jì)算、自動(dòng)駕駛等各類新技術(shù)和應(yīng)用層出不窮的同時(shí),“通不如精”成為處理器架構(gòu)的演進(jìn)趨勢(shì),智能計(jì)算需求激增的背后,是從傳統(tǒng)的通用芯片向?qū)S妙I(lǐng)域處理器芯片的轉(zhuǎn)變。
基于這個(gè)趨勢(shì),很多公司開啟了DSA的實(shí)踐,推出了針對(duì)特定領(lǐng)域應(yīng)用的DSA處理器,于是包括NPU、TPU、DPU、DSP等在內(nèi)的各種“XPU”應(yīng)運(yùn)而生,盡管這些芯片類別不同,適用領(lǐng)域有所差異,但其作為專門為AI任務(wù)和特定領(lǐng)域需求而生的新芯片,它們都有著比通用計(jì)算功耗低、計(jì)算性能高、成本更低等優(yōu)勢(shì)。
不難判斷,定制化和異構(gòu)化DSA作為整個(gè)系統(tǒng)的算力中堅(jiān),將成為未來(lái)處理器架構(gòu)的趨勢(shì),有望在下一代計(jì)算平臺(tái)中發(fā)揮更大的價(jià)值。
DSA大行其道,EDA亟待革新
不難理解,DSA的目標(biāo)就是提升計(jì)算的能效比,更好地滿足特定領(lǐng)域SoC設(shè)計(jì)的差異化、能效比以及推向市場(chǎng)的時(shí)效性。
然而,AI時(shí)代在為DSA處理器應(yīng)用場(chǎng)景提供了更多可能性的同時(shí),也對(duì)芯片研發(fā)的效率提出了更高的挑戰(zhàn)。
在DSA芯片公司實(shí)際的開發(fā)過程中,傳統(tǒng)的EDA工具存在費(fèi)人、費(fèi)時(shí)、費(fèi)錢且風(fēng)險(xiǎn)大等問題。尤其在芯片行業(yè)如此“卷”的后摩爾時(shí)代,在專用處理器規(guī)模指數(shù)式上升和面市時(shí)間快速縮短的雙重壓力下,如何快速生成專用處理器,成倍提升處理器設(shè)計(jì)效率,加速產(chǎn)品迭代已然成為市場(chǎng)制勝的關(guān)鍵。
這也對(duì)EDA工具提出了新的要求。對(duì)此,芯易薈通過對(duì)行業(yè)需求的深刻理解以及專業(yè)知識(shí)和經(jīng)驗(yàn)的長(zhǎng)期累計(jì),推出了一款賦能專用計(jì)算、具有顛覆性創(chuàng)新的EDA軟件工具——FARMStudio。
據(jù)芯易薈聯(lián)合創(chuàng)始人徐勇介紹,F(xiàn)ARMStudio是一款以C語(yǔ)言描述,基于RISC-V基礎(chǔ)指令集的專用處理器生成工具,針對(duì)密集計(jì)算和復(fù)雜數(shù)據(jù)處理的應(yīng)用場(chǎng)景,賦能工程師自由探索計(jì)算架構(gòu),優(yōu)化PPA,快速收斂至最佳設(shè)計(jì)。
該工具基于FARM設(shè)計(jì)方法學(xué),參考DSA設(shè)計(jì)范式,可方便的針對(duì)不同應(yīng)用,進(jìn)行不同架構(gòu)下處理器的性能探索,用戶僅需在軟件中輸入基礎(chǔ)核、超級(jí)指令、預(yù)置模板三項(xiàng)數(shù)據(jù),便可分鐘級(jí)自動(dòng)生成符合使用者功能、性能描述的處理器硬件及軟件工具鏈,并提供相關(guān)FPGA開發(fā)驗(yàn)證平臺(tái)。RTOS、相關(guān)數(shù)學(xué)庫(kù)及應(yīng)用層軟件包也可一并交付,可最大程度縮短產(chǎn)品上市時(shí)間,提高競(jìng)爭(zhēng)力。
作為自動(dòng)生成專用處理器的EDA平臺(tái),F(xiàn)ARMStudio擁有諸多優(yōu)勢(shì):
加速進(jìn)程:分鐘級(jí)自動(dòng)生成DSA處理器和配套工具鏈,可最大程度縮短產(chǎn)品上市時(shí)間,提高競(jìng)爭(zhēng)力;
FARM多層級(jí)驗(yàn)證:用C語(yǔ)言實(shí)現(xiàn)快速芯片設(shè)計(jì),并全方位保障CtoRTL的正確性和一致性;
靈活高效:探索“左移”、決策“右移”,讓架構(gòu)探索和硬件設(shè)計(jì)更靈活,獲取最符合特定需求的DSA處理器;
自主可控:FARMStudio擁有完整的技術(shù)儲(chǔ)備和開放的生態(tài)圈,實(shí)現(xiàn)國(guó)產(chǎn)化、自主可控。
資源復(fù)用:自定義指令和預(yù)制指令資源復(fù)用
如徐勇所言,隨著芯片規(guī)模和芯片制造成本的指數(shù)級(jí)上升,芯片項(xiàng)目的決策不能等到芯片開發(fā)生產(chǎn)完成后再去做,而是需要在預(yù)研階段就能根據(jù)應(yīng)用需求做好軟硬件劃分和驗(yàn)證,去實(shí)際評(píng)估最終能否達(dá)到性能需求。
相較于傳統(tǒng)設(shè)計(jì)流程中的決策往往伴隨著較大的不確定性,芯易薈升級(jí)設(shè)計(jì)流程,基于FARMStudio的設(shè)計(jì)并行化,通過將“軟硬協(xié)同、設(shè)計(jì)優(yōu)化、驗(yàn)證”等流程左移,以及該工具分鐘級(jí)的快速響應(yīng),以此來(lái)幫助客戶降低決策風(fēng)險(xiǎn),加快客戶研發(fā)速度。
而之所以能夠取得上述顛覆性優(yōu)勢(shì)的原因,徐勇在接受半導(dǎo)體行業(yè)觀察采訪時(shí)表示,首先我們是以創(chuàng)新為出發(fā)點(diǎn),迫切的想要進(jìn)行創(chuàng)新;此外,公司研發(fā)團(tuán)隊(duì)實(shí)力強(qiáng),由40多年行業(yè)經(jīng)驗(yàn)的科學(xué)家領(lǐng)頭,團(tuán)隊(duì)碩士及以上學(xué)歷人才占比達(dá)80%,且非常了解行業(yè)痛點(diǎn)和發(fā)展趨勢(shì)。
在此基礎(chǔ)上,芯易薈通過思維方法的整合,進(jìn)行深度技術(shù)創(chuàng)新融合,實(shí)現(xiàn)了一系列技術(shù)的突破:
基于RISC-V基礎(chǔ)指令,無(wú)需微架構(gòu)知識(shí),自主可控
基于C語(yǔ)言,軟硬件設(shè)計(jì)語(yǔ)言統(tǒng)一,全球首創(chuàng)
分鐘級(jí)自動(dòng)生成DSA處理器和配套工具鏈
高性能編譯器,支持自動(dòng)VLIW,自動(dòng)流水線排布
多層次驗(yàn)證環(huán)境,指令級(jí)別驗(yàn)證在X86平臺(tái)實(shí)現(xiàn),世界唯一
周期精確仿真器,仿真速度達(dá)到MHz級(jí)別,業(yè)界最快
FPGA云開發(fā)測(cè)試環(huán)境,即插即用
嵌入式OS,自動(dòng)配置
在諸多突破性技術(shù)和優(yōu)勢(shì)的加持下,F(xiàn)ARMStudio工具內(nèi)嵌面向豐富應(yīng)用場(chǎng)景的DSA設(shè)計(jì)范式,便于客戶快速集成、優(yōu)化和驗(yàn)證DSA處理器,可廣泛應(yīng)用于定制針對(duì)視覺、AI、通信、音頻、DPU、工業(yè)控制等領(lǐng)域的處理器解決方案,助力芯片設(shè)計(jì)公司突破傳統(tǒng)IP能效上限,并以更低的成本適應(yīng)算法與產(chǎn)品的持續(xù)迭代。
對(duì)此,芯易薈市場(chǎng)總監(jiān)徐明以DSP和NPU兩個(gè)典型應(yīng)用方向?yàn)槔?,展現(xiàn)了使用FARM方法學(xué)研發(fā)DSA處理器的優(yōu)勢(shì)和靈活性。
其中,DSP作為目前芯片市場(chǎng)比較典型的處理器,特別適合快速地實(shí)現(xiàn)各種數(shù)字信號(hào)的處理和運(yùn)算,己成為AI、計(jì)算機(jī)視覺、音頻等領(lǐng)域的關(guān)鍵核心。在研發(fā)DSP方面,F(xiàn)ARM方法學(xué)具有較大優(yōu)勢(shì),使用FARMStudio工具,通過非標(biāo)數(shù)據(jù)類型、個(gè)性化小數(shù)標(biāo)定以及提煉典型應(yīng)用場(chǎng)景的算法需求,聚焦不同應(yīng)用方向提供靈活的可選組件來(lái)加速DSP的設(shè)計(jì)、開發(fā)及驗(yàn)證流程。這其中也包括專用的加速指令,依托于強(qiáng)大的編譯器可以顯著提升性能和資源利用率。
徐明表示,相較于傳統(tǒng)的DSPIP,使用FARMStudio平臺(tái)能以更少的面積和功耗,更小的codesize,獲得更極致的性能,以滿足數(shù)字化時(shí)代處理密集型應(yīng)用的數(shù)據(jù)計(jì)算需求。
此外,通過FARM方法學(xué)研發(fā)NPU同樣存在諸多優(yōu)勢(shì),包括應(yīng)用需求驅(qū)動(dòng)NPU設(shè)計(jì)、不同架構(gòu)范式適配復(fù)雜應(yīng)用需求、支持非標(biāo)數(shù)據(jù)類型、支持內(nèi)存架構(gòu)定制等,進(jìn)而可以在幫助NPU芯片追求極致性能的同時(shí),大幅縮減人力和時(shí)間成本。
“綜合來(lái)看,F(xiàn)ARM方法學(xué)靈活高效,降低數(shù)量級(jí)級(jí)別處理器開發(fā)成本;顛覆功能,突破傳統(tǒng)處理器IP能力邊界;自主可控,多種合作方式解決客戶處理器需求。”徐明總結(jié)道。
伴隨技術(shù)創(chuàng)新而來(lái)的,還有芯易薈對(duì)其商業(yè)模式的思考和重新定義。
據(jù)介紹,F(xiàn)ARMStudio工具分為企業(yè)版和個(gè)人版兩種類型,企業(yè)版支持軟件工具鏈、仿真器、SDK/OS、RTL下載、專家技術(shù)支持等功能;個(gè)人版則在企業(yè)版基礎(chǔ)上減少了RTL下載功能,專家技術(shù)支持調(diào)整為在線技術(shù)支持。
“相較于其他EDA/IP廠商動(dòng)輒幾百上千萬(wàn)的授權(quán)費(fèi)用以及1%-2%甚至更高比例的版稅,F(xiàn)ARMStudio企業(yè)版采用1+1的定價(jià)模式,即EDA授權(quán)費(fèi)100萬(wàn)人民幣每年+1%的ASP版稅;更是發(fā)布個(gè)人版,僅需每年299人民幣,但不可用于商業(yè)用途。”徐勇補(bǔ)充道。
對(duì)于推出個(gè)人版的原因,徐勇強(qiáng)調(diào),EDA核心是用戶使用量,個(gè)人版一方面可以提高用戶使用量,解鎖個(gè)人對(duì)行業(yè)的了解,為生態(tài)培養(yǎng)貢獻(xiàn)力量;另一方面,可以借此來(lái)加速收集用戶反饋,為自身軟件的后續(xù)更新迭代做基礎(chǔ)。
綜合來(lái)看,作為一款以C語(yǔ)言描述,基于RISC-V基礎(chǔ)指令集的專用處理器生成工具,F(xiàn)ARMStudio知識(shí)產(chǎn)權(quán)自主,助力客戶高效積累自研IP是其核心競(jìng)爭(zhēng)力所在。借此優(yōu)勢(shì),F(xiàn)ARMStudio得以降低工程師使用門檻,提升工程師技能樹能級(jí),自由探索架構(gòu),分鐘級(jí)優(yōu)化硬件,進(jìn)而成倍提高芯片設(shè)計(jì)效率,為中國(guó)半導(dǎo)體事業(yè)添磚加瓦。
計(jì)算架構(gòu)黃金年代,國(guó)產(chǎn)EDA迎來(lái)拐點(diǎn)
眾所周知,隨著芯片設(shè)計(jì)的復(fù)雜程度不斷提升,EDA已經(jīng)滲透到芯片設(shè)計(jì)生產(chǎn)的各個(gè)環(huán)節(jié),EDA與產(chǎn)業(yè)鏈結(jié)合愈加緊密,已經(jīng)成為提高設(shè)計(jì)效率、加速技術(shù)進(jìn)步的關(guān)鍵推手。
同時(shí)EDA杠桿效應(yīng)顯著,根據(jù)SEMI數(shù)據(jù),2021年全球EDA市場(chǎng)規(guī)模僅為132億美元,卻撬動(dòng)著數(shù)千億美元的集成電路產(chǎn)業(yè),以及背后數(shù)十萬(wàn)億規(guī)模的數(shù)字經(jīng)濟(jì),其屬性和重要性可見一斑。
近年來(lái),受地緣政治關(guān)系的影響,我國(guó)在包括EDA在內(nèi)的多個(gè)半導(dǎo)體領(lǐng)域面臨關(guān)鍵核心技術(shù)卡脖子的危機(jī)。因此,如何盡快打破壟斷,實(shí)現(xiàn)相關(guān)領(lǐng)域的“自主可控”成為全社會(huì)的廣泛共識(shí)。
2021年,工信部出臺(tái)的《“十四五”軟件和信息技術(shù)服務(wù)業(yè)發(fā)展規(guī)劃》中提出要重點(diǎn)突破工業(yè)軟件,EDA作為工業(yè)軟件的皇冠明珠,是短板所在,也是未來(lái)重點(diǎn)發(fā)力方向。
在此背景下,國(guó)產(chǎn)EDA廠商正卯足力氣、加緊追趕,芯易薈也是在這個(gè)過程中成立并逐步壯大,在專用計(jì)算領(lǐng)域?qū)崿F(xiàn)技術(shù)突破,解決了行業(yè)客戶在芯片實(shí)際開發(fā)過程中的一系列復(fù)雜挑戰(zhàn)和難題,顛覆了國(guó)外巨頭對(duì)EDA領(lǐng)域的長(zhǎng)期壟斷。
FARMStudio工具目前已由國(guó)內(nèi)外多家IC廠商進(jìn)行實(shí)踐測(cè)試及使用,應(yīng)用市場(chǎng)涵蓋手機(jī)、安防、汽車、通信、消費(fèi)電子、工業(yè)控制等諸多領(lǐng)域,正在發(fā)展成為我國(guó)自主研發(fā)集成電路產(chǎn)業(yè)生態(tài)的重要部分。
徐勇表示,近年來(lái),隨著更多政策加碼,相關(guān)技術(shù)正日益成熟,國(guó)產(chǎn)EDA企業(yè)正迎來(lái)發(fā)展的黃金期。我們也十分期待看到EDA產(chǎn)業(yè)日益加劇的市場(chǎng)競(jìng)爭(zhēng)中,催生更多、更先進(jìn)的國(guó)產(chǎn)EDA工具,共同助推中國(guó)集成電路產(chǎn)業(yè)的進(jìn)一步發(fā)展。
作為芯片設(shè)計(jì)行業(yè)的賦能者,芯易薈自主研發(fā)專用處理器設(shè)計(jì)與驗(yàn)證自動(dòng)化的前瞻性技術(shù),提供處理器開發(fā)的一站式平臺(tái),針對(duì)豐富的應(yīng)用場(chǎng)景,自動(dòng)產(chǎn)生最佳匹配的軟硬件協(xié)同方案,為中國(guó)乃至全球范圍日益增長(zhǎng)的芯片設(shè)計(jì)需求提供新型設(shè)計(jì)方法學(xué)、工具軟件和最佳實(shí)踐。
正如在文章開頭JohnHennessy和DavidPatterson提到的,計(jì)算機(jī)架構(gòu)正在迎來(lái)一個(gè)新的黃金時(shí)代。
對(duì)于芯易薈來(lái)說,這也是他們的一個(gè)機(jī)會(huì)。