數(shù)字金融
網(wǎng)絡(luò)營銷推廣
電商服務(wù)
源自:GPLP
這兩天,“黃仁勛穿東北大花熱舞”上了熱搜。
英偉達(dá)創(chuàng)始人兼CEO黃仁勛,在公司中國區(qū)年會上,頂著一頭干練利落的花白短發(fā),黑色體恤外,套著一件東北大花馬甲,兩手各頂一只紅手帕,投入地跳起了東北二人轉(zhuǎn)。這一熱舞的視頻、照片,于1月20日晚間開始在社交媒體廣泛流傳。
黃仁勛熱舞搶鏡前,英偉達(dá)的市值再創(chuàng)新高。截至美東時間1月22日,英偉達(dá)收報596.54美元/股,總市值高達(dá)1.47萬億美元。4天前,Meta首席執(zhí)行官扎克伯格稱,2024年底前將獲得約35萬塊來自英偉達(dá)的H100 GPU。2024年以來,英偉達(dá)股價累計漲幅已超過20%。
然而,處于巔峰的英偉達(dá),卻是喜憂參半。AI芯片市場,英偉達(dá)的王者地位,雖短期難以撼動,但除了老對手AMD緊追不舍,微軟、谷歌、亞馬遜、華為等諸多超級科技公司試圖分羹。受美國越來越收緊的對華芯片出口限制政策影響,中國市場由此成為其最大變量,在此背景下,英偉達(dá)面臨著化解中國市場流失的難題。
黃仁勛已有數(shù)年未進(jìn)入中國大陸,2023年6月曾有來中國大陸傳言,但未成行。直到2024年1月,才真正得以實現(xiàn)。
黃仁勛這次到訪“保密工作”非常到位,他的到來與離開,都顯得“靜悄悄”。
直到1月20日晚間,他的一些熱舞視頻傳出,才被媒體證實,而彼時他已離開。
據(jù)第一財經(jīng)報道,黃仁勛此行未涉及與政府官員的會面,也沒有重大的商業(yè)發(fā)布,最主要的目的是與中國員工“歡度美好時光”。
流出的視頻顯示,除了穿東北大花馬甲熱舞,黃仁勛在年會上還作了演講,并主持了抽獎。
對此,IDC亞太區(qū)研究總監(jiān)郭俊麗表示,黃仁勛近期對北京、上海、深圳三大城市辦公室進(jìn)行訪問,參與了中國區(qū)年會活動,和團(tuán)隊進(jìn)行面對面的溝通和交流,共商中國區(qū)市場戰(zhàn)略。
公開資料顯示,英偉達(dá)在中國大陸擁有近3000員工,涉及市場、銷售、研發(fā)等職能部門,在北京、上海、深圳等地均設(shè)有辦公室。
“黃仁勛一直非常重視中國市場,面對國際地緣政治,其想方設(shè)法服務(wù)中國市場?!?IDC亞太區(qū)研究總監(jiān)郭俊麗分析說,“此次行程不僅強化了中國市場在英偉達(dá)全球戰(zhàn)略布局中的重要性,更增強了該公司對中國市場未來布局的信心。”
2023年12月6日,黃仁勛曾公開透露,中國市場占了英偉達(dá)總營收的20%。可見,中國市場是英偉達(dá)一個至關(guān)重要的市場。
“中國市場是全球數(shù)一數(shù)二的消費市場,包括計算機(jī)、通信等等領(lǐng)域,消費和購買體量非常龐大,英偉達(dá)重視中國市場是毫無疑問的?!辟Y深產(chǎn)業(yè)經(jīng)濟(jì)觀察家梁振鵬表示。
眾所周知,近兩年美國對華芯片出口限制一再收緊,英偉達(dá)因此面臨在中國市場份額流失的難題。
2023年底,英偉達(dá)發(fā)布了H200芯片,計劃2024年第二季度正式供貨,H200因推理速度比H100提高近2倍,能耗卻降低了一半的優(yōu)異表現(xiàn),被稱為“史上最強”芯片。
不僅H200無緣中國公司,英偉達(dá)其他產(chǎn)品也都將面臨該命運。
2022年10月,受美國一系列AI芯片出口限制措施影響,英偉達(dá)A100和H100兩款A(yù)I處理器,無法向中國市場提供,英偉達(dá)只能通過“減量不減價”的A800和H800芯片,實現(xiàn)對中國市場的特供。
2023年10月,美國進(jìn)一步收緊對華芯片出口管制,A800和H800芯片無法繼續(xù)向中國市場出售,面向“發(fā)燒級”電腦游戲玩家的RTX 4090芯片,也在中國市場被下架,新規(guī)于2023年10月23日便開始生效。
美國新對華芯片限售政策實施之后,中國科技公司紛紛提及其影響。
2023年11月15日,騰訊總裁劉熾平在騰訊控股(00700.HK)財報電話會議上稱,目前,騰訊擁有最大的 AI 芯片庫存之一,有足夠的籌碼支持騰訊混元大模型,未來至少幾代的更新發(fā)展。不過,管制確實影響到騰訊將AI芯片資源作為云服務(wù)對外租賃的能力。
第二天晚間,阿里巴巴集團(tuán)發(fā)布的2024財年第二季度(即2023自然年第三季度)財報提及,阿里不再推進(jìn)云智能集團(tuán)的完全分拆,主要原因則是,美國擴(kuò)大先進(jìn)計算芯片出口管制,給阿里云智能集團(tuán)前景帶來不確定性。
這一次,英偉達(dá)的策略還是進(jìn)一步算力“大減量”,而價格僅是“略降”。英偉達(dá)開發(fā)出符合美國最新出口規(guī)則的三款“改良版”芯片,即HGX H20、L20 PCle和L2 PCle,預(yù)計2024年第一季度開始量產(chǎn)。
半導(dǎo)體研究機(jī)構(gòu)Semianalysis調(diào)研報告顯示,用于AI模型訓(xùn)練的H20提供96GB內(nèi)存、4TB/s內(nèi)存帶寬和296 teraFLOPS FP8性能。理論上,其整體算力比英偉達(dá)H100 GPU芯片下降80%左右。
價格略降,但整體算力卻下降了80%,這導(dǎo)致中國企業(yè)熱情不高。
英偉達(dá)2023年11月22日發(fā)布了2023年第三季度財報,財報提及,美國新規(guī)實施后,預(yù)計第四季度在中國的銷售額將大幅下降。
TrendForce分析師認(rèn)為,中國云計算公司目前80%的高端芯片來自英偉達(dá),未來5年可能會降到50%-60%。
黃仁勛此次來訪,雖然未有商業(yè)會見,“穩(wěn)人心”的戰(zhàn)略意義凸顯。
近幾天,英偉達(dá)的兩個大客戶,OpenAI和Meta,上演了“向左走,向右走”。
OpenAI不再滿足于向英偉達(dá)購買GPU,將手伸向GPU上游生產(chǎn)端。1月20日,據(jù)彭博社報道,OpenAI首席執(zhí)行官山姆·奧特曼 (Sam Altman)正在籌集資金建設(shè)半導(dǎo)體生產(chǎn)設(shè)施,生產(chǎn)用于人工智能 (AI) 應(yīng)用的處理器 。
另一科技巨頭Meta則選擇了繼續(xù)加碼搶購英偉達(dá)的GPU。美東時間2024年1月18日,Meta首席執(zhí)行官扎克伯格宣布,Meta計劃在2024年底前獲得約35萬塊來自英偉達(dá)的H100 GPU。再算上其他GPU,擁有的算力總和將接近于60萬塊H100所能提供的算力。
據(jù)Raymond James的分析師估計,英偉達(dá)H100的售價在2.5萬美元至3萬美元之間,而在eBay等平臺上,其售價甚至可能超過4萬美元。購買35萬塊H100的話,需要Meta掏出大概90億美金的巨資。
奧特曼曾擔(dān)憂GPU的短缺以及帶來的巨大費用,這或許是他選擇籌建GPU工廠的主要原因之一,同時,試圖盡量降低英偉達(dá)對其的“卡脖子”風(fēng)險。
選擇涉足GPU上游領(lǐng)地的英偉達(dá)客戶,不止有OpenAI,還有谷歌、亞馬遜、特斯拉、阿里、百度、微軟等一長串名字,它們都宣布將自研AI芯片。
“互聯(lián)網(wǎng)大廠紛紛下水親自造芯,我們認(rèn)為,短期內(nèi)對整體行業(yè)的競爭格局影響不大,因為英偉達(dá)具有技術(shù)、產(chǎn)品、生態(tài)、經(jīng)驗等全方位的領(lǐng)先優(yōu)勢,”郭俊麗表示,“長期來看,隨著各大公司能夠不斷增加自給自足的份額,可能會對AI芯片的競爭格局產(chǎn)生一定影響。”
而受英偉達(dá)產(chǎn)能限制,包括H100在內(nèi)等產(chǎn)品交付周期比較漫長。Omdia的統(tǒng)計數(shù)據(jù)顯示,英偉達(dá)在2023年第三季度大概售出了50萬塊A100和H100計算卡。基于H100構(gòu)建的服務(wù)器交付周期大概需要36周到52周不等。
這無疑讓英偉達(dá)的競爭對手們看到了機(jī)會。英偉達(dá)多年來的老對手是AMD,在GPU領(lǐng)域,英偉達(dá)與AMD兩者幾乎瓜分了全球市場份額,前者占八成左右,后者占二成左右。
2023年12月6日,AMD推出MI300x,宣稱表現(xiàn)優(yōu)于英偉達(dá)的H100,試圖打一個翻身仗。不過風(fēng)頭被英偉達(dá)一周后發(fā)布的H200搶走。
英特爾也宣布,將在2024年上市一款GPU產(chǎn)品,名叫Gaudi 3,性能超過英偉達(dá)的H100。
梁振鵬認(rèn)為,AI芯片涉及范圍非常廣,各個企業(yè)擅長的領(lǐng)域也各有不同。英偉達(dá)擅長的自然是GPU,也就是圖形處理器;英特爾擅長的領(lǐng)域是CPU,即中央處理器等等,企業(yè)間并非一味的競爭關(guān)系,而是“競爭與合作”的關(guān)系,上下游產(chǎn)業(yè)鏈合作,互相采購是很正常的事情。
OpenAI締造的ChatGPT,是這波生成式AI浪潮的引領(lǐng)者。
生成式人工智能的核心三要素是數(shù)據(jù)、算法、算力。而算力這一項,正是英偉達(dá)走向巔峰的武器。
2023年10月發(fā)布的一份報告顯示,OpenAI目前在其流行的ChatGPT服務(wù)中主要使用的是英偉達(dá)的A100和H100 GPU。
ChatGPT-4、Gemini、Llama 2和其他型號等大模型訓(xùn)練,都離不開英偉達(dá)的H100 GPU。這便是英偉達(dá)所向披靡的關(guān)鍵之一。
“搶英偉達(dá)的GPU”,是過去1年全球各大科技公司的常態(tài)。
研究機(jī)構(gòu)Omdia最新報告給出一組數(shù)據(jù),2023年,微軟和Meta兩家公司各搶走了15萬塊英偉達(dá)H100 GPU,谷歌、亞馬遜和甲骨文等分別購入5萬塊,騰訊購入5萬塊H800 GPU,百度和阿里巴巴分別搶到3萬塊、2.5萬塊A100 GPU。
目前,全球數(shù)據(jù)中心AI加速市場份額的82%由英偉達(dá)占據(jù),同時,英偉達(dá)在全球 Al訓(xùn)練領(lǐng)域的市場份額高達(dá)95%。
英偉達(dá)在中國市場也是獨占鰲頭。IDC調(diào)研顯示,2022年,中國AI加速卡(即AI訓(xùn)練芯片)出貨量約為109萬張,其中,英偉達(dá)市場份額為85%。
可以說,OpenAI憑借一己之力,成功引爆人工智能革命,為多年“賣鏟子”的英偉達(dá)扭轉(zhuǎn)了乾坤。2023年是英偉達(dá)獨占鰲頭的一年。2023年英偉達(dá)股價暴漲了234%,市值也沖上萬億美金。
人工智能革命引爆了上游GPU的需求空間。根據(jù)測算,2023-2027年全球大模型訓(xùn)練端峰值算力需求量的年復(fù)合增長率為78%。2023年全球大模型訓(xùn)練端所需全部算力換算成的A100總量超過200萬張。
中國市場受美國限售政策影響,恐將成為英偉達(dá)此時最大的變量。若英偉達(dá)無法化解供應(yīng)難題,華為恐將成為最大的潛在受益者。
黃仁勛2023年12月6日也公開表示,在生產(chǎn)“最好的”人工智能芯片的競賽中,華為是英偉達(dá)“非常強大”的競爭對手之一。
黃仁勛強調(diào),華為、英特爾和不斷壯大的半導(dǎo)體初創(chuàng)公司,對英偉達(dá)在人工智能芯片市場的主導(dǎo)地位構(gòu)成了嚴(yán)峻挑戰(zhàn)。
百川智能創(chuàng)始人兼CEO王小川曾透露,目前大模型行業(yè),分為訓(xùn)練算力和推理算力,兩者合計成本占大模型總成本四成以上。
華為昇騰等幾家公司是國產(chǎn)GPU芯片公司當(dāng)中少有做 AI 訓(xùn)練芯片的,尤其是華為昇騰910B對標(biāo)的便是英偉達(dá)A100。此前科大訊飛董秘、副總裁江濤曾表示,當(dāng)前華為昇騰910B能力已經(jīng)基本做到可對標(biāo)英偉達(dá)A100。
對于挑戰(zhàn)者來說,一個好消息是,大模型的訓(xùn)練成本占比正在逐漸減小,而推理成本則在不斷蠶食訓(xùn)練成本的占比。
2023年12月7日,AMD公司CEO蘇姿豐提及,2027年,全球數(shù)據(jù)中心AI加速器的市場將達(dá)到4000億美元規(guī)模,在這4000億美元當(dāng)中,將有50%以上的市場來自推理需求。
360公司董事長兼CEO周鴻祎也發(fā)現(xiàn)了硅谷的一種趨勢,他稱,OpenAI、微軟、Meta、亞馬遜、高通等科技廠商,都在做推理芯片,“未來一到兩年,大模型推理過程,將不再需要借助昂貴的GPU,就可以實現(xiàn)技術(shù)迭代,把算力成本降下來。我個人覺得,這個成本很快不是問題”。
英偉達(dá)另一個護(hù)城河則是CUDA(Compute Unified Device Architecture),從CUDA編程框架發(fā)展出的一系列軟硬件及擴(kuò)展體系。英偉達(dá)從2012年起便開始構(gòu)建這一系統(tǒng)。
華為昇騰910B便受制于CUDA,因只能兼容CUDA舊的版本,導(dǎo)致下游客戶產(chǎn)生猶豫態(tài)度,延緩了大規(guī)模應(yīng)用周期。
不過,更多力量開始有意減少CUDA的應(yīng)用。近期英特爾CEO基辛格公開表示,MLIR、谷歌和OpenAI等都在轉(zhuǎn)向一個“以Python語言為基礎(chǔ)的編程層”,以使AI訓(xùn)練更加開放。
正是由于有諸多的潛在風(fēng)險,雖然處于GPU領(lǐng)域的頂端,黃仁勛的危機(jī)感也無處不在。黃仁勛在2023年11月的演講中表示:“我們不需要假裝公司一直處于危險之中。我們(確實)一直處于危險之中?!?/p>
玫瑰與荊棘如影隨形,這恐怕將成英偉達(dá)未來很長一段時間的生存處境,也成為其掌舵者黃仁勛的新考題。