隨著DeepSeek引領(lǐng)的AI訓(xùn)練成本大幅下降,以及推理端Token成本驟減,AI代理以及生成式AI軟件有望向各行各業(yè)加速滲透,從微軟、Meta以及阿斯麥等西方世界科技巨頭們的回應(yīng)來(lái)看,他們紛紛贊嘆了DeepSeek的創(chuàng)新,但并未因此動(dòng)搖大規(guī)模投資AI的決心。他們認(rèn)為DeepSeek引領(lǐng)的新技術(shù)路線有望帶來(lái)AI成本的整體下降態(tài)勢(shì),對(duì)于AI應(yīng)用端來(lái)說(shuō),必然存在更多的機(jī)遇和規(guī)模大得多的AI應(yīng)用與推理端算力需求。
關(guān)于2025年支出計(jì)劃,亞馬遜管理層預(yù)計(jì)將達(dá)到1000億美元,并且亞馬遜認(rèn)為DeepSeek橫空出世意味著未來(lái)推理端AI算力需求將大幅擴(kuò)張,因此加大支出支持AI業(yè)務(wù)發(fā)展。首席執(zhí)行官賈西表示:“我們不會(huì)在沒(méi)有看到顯著需求信號(hào)的情況下進(jìn)行采購(gòu)。當(dāng)AWS擴(kuò)大其資本支出,尤其是在像AI這樣千載難逢的商業(yè)機(jī)會(huì)中時(shí),我認(rèn)為這對(duì)AWS業(yè)務(wù)的中長(zhǎng)期發(fā)展是一個(gè)相當(dāng)好的信號(hào)。”
在上周,谷歌、微軟和Meta這三大巨頭堅(jiān)持向人工智能領(lǐng)域投入巨額資金。盡管面臨DeepSeek所帶來(lái)的低成本沖擊波,但科技巨頭們堅(jiān)信,大規(guī)模投資將為未來(lái)無(wú)比龐大的推理端AI算力需求奠定重大基礎(chǔ)。

根據(jù)Visible Alpha的預(yù)測(cè),微軟2025年的資本支出預(yù)計(jì)將超過(guò)900億美元,占其營(yíng)收的30%以上。Facebook母公司Meta也大幅提升投資計(jì)劃,Meta最近宣布計(jì)劃將2025年資本支出提高60%以上,最高達(dá)650億美元,同樣占其營(yíng)收的30%以上,計(jì)劃用于與人工智能密切相關(guān)的項(xiàng)目,意味著繼2024年瘋狂砸錢(qián)超380億美元投向人工智能等最前沿科技領(lǐng)域之后,Meta今年將繼續(xù)砸重金加碼布局AI。谷歌計(jì)劃2025年投入750億美元用于與AI等項(xiàng)目相關(guān)的資本支出,較去年525億美元的支出大幅增長(zhǎng),遠(yuǎn)高于過(guò)去十年平均不到13%的水平。

市場(chǎng)開(kāi)始定價(jià)科技大廠們“燒錢(qián)狂潮”的最大贏家:AI ASIC
隨著美國(guó)科技巨頭們堅(jiān)定向人工智能領(lǐng)域砸巨資,受益最大的贏家勢(shì)力可能是兩大AI ASIC巨頭——博通與Marvell,憑借在芯片間互聯(lián)通信以及芯片間數(shù)據(jù)高速傳輸領(lǐng)域的技術(shù)領(lǐng)導(dǎo)地位,近年來(lái)博通和Marvell乃AI ASIC市場(chǎng)最核心力量。
微軟、亞馬遜、谷歌以及Meta,乃至生成式AI領(lǐng)軍者OpenAI,無(wú)一例外都在聯(lián)手博通或者M(jìn)arvell自研AI ASIC芯片,用于海量推理端AI算力部署。因此AI ASIC未來(lái)市場(chǎng)份額擴(kuò)張之勢(shì)有望大幅強(qiáng)于AI GPU,進(jìn)而趨于份額對(duì)等,而不是當(dāng)前AI GPU一家獨(dú)大局面——占據(jù)AI芯片領(lǐng)域高達(dá)90%份額,這也是為何近日博通與Marvell股價(jià)漲勢(shì)強(qiáng)于英偉達(dá)與AMD。
摩根士丹利近日發(fā)布的研報(bào)顯示,AI ASIC市場(chǎng)規(guī)模將從2024年的120億美元增長(zhǎng)至2027年的300億美元,年復(fù)合增長(zhǎng)率達(dá)到34%。不過(guò)大摩表示,AI ASIC的崛起并不意味著英偉達(dá)AI GPU前景斷崖式下滑,該機(jī)構(gòu)認(rèn)為這兩種芯片體系將長(zhǎng)期共存,為終端需求場(chǎng)景提供結(jié)合兩者優(yōu)勢(shì)的解決方案。另一華爾街大行花旗表示,AI ASIC最終可能更多地與推理密切相關(guān),隨著推理端AI算力需求不斷增加,AI ASIC市場(chǎng)份額將不斷擴(kuò)大。
此外,大摩通過(guò)TCO模型對(duì)比了AI ASIC和AI GPU在AI訓(xùn)練和推理任務(wù)中的成本效益,結(jié)果顯示ASIC的初始成本較低,尤其適合預(yù)算有限的云服務(wù)提供商們,因此大摩看好博通與Marvell股價(jià)前景,認(rèn)為它們受益于“DeepSeek沖擊波”帶來(lái)的推理算力需求激增。
在谷歌與Meta業(yè)績(jī)電話會(huì)議上,皮查伊以及扎克伯格均表示將加大力度攜手芯片廠商博通推出自研AI ASIC,這兩大巨頭的AI ASIC技術(shù)合作伙伴都是定制化芯片領(lǐng)域領(lǐng)軍者博通,比如谷歌聯(lián)手博通打造的TPU(Tensor Processing Unit)就是一種最典型的AI ASIC。Meta此前與博通共同設(shè)計(jì)了Meta的第一代和第二代AI訓(xùn)練/推理加速處理器,預(yù)計(jì)Meta與博通將在2025年加快研發(fā)Meta下一代AI芯片 MTIA 3。獲得微軟巨額投資以及達(dá)成深度合作的OpenAI去年10月表示,將攜手博通開(kāi)發(fā)OpenAI首款A(yù)I ASIC芯片。
亞馬遜管理層則表示將以更大規(guī)模來(lái)部署AI ASIC算力基礎(chǔ)設(shè)施,Marvell為亞馬遜AWSAI ASIC技術(shù)合作伙伴,去年12月Marvell宣布同亞馬遜AWS達(dá)成一份為期五年的協(xié)議,進(jìn)一步擴(kuò)展AI ASIC戰(zhàn)略合作關(guān)系,Marvell將在5年內(nèi)攜手亞馬遜推出多代數(shù)據(jù)中心AI芯片產(chǎn)品。
展望未來(lái)AI算力前景,DeepSeek R1橫空出世也重磅宣告隨著訓(xùn)練/推理步入“極致壓縮+高效強(qiáng)化訓(xùn)練+AI推理算力大幅簡(jiǎn)化”的低成本新范式,屬于AI ASIC的時(shí)代降臨。DeepSeek R1重磅出爐之后,全球科技股投資者以及推崇AI的科技界粉絲們對(duì)于英偉達(dá)高性能AI GPU(Hopper架構(gòu)與Blackwell架構(gòu)GPU)的信仰可謂出現(xiàn)重大裂痕,投資者們不禁懷疑:大廠們聯(lián)手博通/Marvell推出自研AI ASIC(即定制化AI芯片)豈不是性?xún)r(jià)比高得多?
隨著大模型架構(gòu)逐漸向幾種成熟范式收斂(例如標(biāo)準(zhǔn)化的 Transformer 解碼器、Diffusion 模型流水線),ASIC可以更容易地吃下主流推理端算力負(fù)載。并且某些云服務(wù)商或行業(yè)巨頭會(huì)深度耦合軟件棧,讓 ASIC兼容常見(jiàn)的網(wǎng)絡(luò)算子,并提供優(yōu)秀的開(kāi)發(fā)者工具,這將加速 ASIC 推理在常態(tài)化/海量化場(chǎng)景中的普及。
展望未來(lái)算力前景,英偉達(dá)AI GPU可能更多專(zhuān)注在超大規(guī)模前沿探索性的訓(xùn)練、變化極快的多模態(tài)或新結(jié)構(gòu)快速試驗(yàn),以及 HPC、圖形渲染、可視分析等通用算力。AI ASIC則聚焦于深度學(xué)習(xí)特定算子/數(shù)據(jù)流做極致優(yōu)化,也就是擅長(zhǎng)穩(wěn)定結(jié)構(gòu)推理、批量高通量、高能效比。比如,如果一家云平臺(tái)的AI工作負(fù)載中大量使用針對(duì) CNN/Transformer 中常見(jiàn)算子(比如矩陣乘法、卷積、LayerNorm、Attention等),大多AI ASIC會(huì)針對(duì)這些算子做深度定制;圖像識(shí)別(ResNet系列、ViT)、基于Transformer的自動(dòng)語(yǔ)音識(shí)別(Transformer ASR)、Transformer Decoder-only、部分多模態(tài)流水線固定化后,都可以基于ASIC進(jìn)行極致優(yōu)化。
ASIC通常采用數(shù)據(jù)流架構(gòu) (Dataflow) 或張量處理單元等方式,對(duì)矩陣乘法、卷積、激活函數(shù)、注意力層等進(jìn)行高度優(yōu)化。一旦某些大模型架構(gòu)在商用場(chǎng)景中趨于穩(wěn)定,且推理調(diào)用量極大,則基于ASIC的專(zhuān)用定制硬件可以將單位能耗與單位成本做到大幅優(yōu)于通用 GPU(通?蛇_(dá) 2~10 倍不等能效提升)。因此隨著推理端越來(lái)越聚焦成本與能效,AI ASIC 具備更大規(guī)模的配置前景,特別是在神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)逐漸固化的常態(tài)化、批量化AI推理任務(wù)上。
就像大摩預(yù)測(cè)的那樣,長(zhǎng)遠(yuǎn)來(lái)看,兩者將和諧共存,中期左右AI ASIC市場(chǎng)份額有望大幅擴(kuò)張。英偉達(dá)通用GPU將聚焦于復(fù)雜多變場(chǎng)景與前沿研究,ASIC 聚焦高頻穩(wěn)定、大規(guī)模的AI推理負(fù)載以及一部分成熟穩(wěn)定的固化訓(xùn)練流程。
來(lái)源:智通財(cái)經(jīng)APP
共2頁(yè) 上一頁(yè) [1] [2]