不只是Nvidia發大財: 人工智慧產業鏈點將錄-焦點媒體深讀 #13
前言:五月的最後一周,輝達的共同創辦人兼CEO黃仁勳先在台灣各種場合的風趣、紳士言行舉止成為焦點,然後輝達的股價在一天大漲後市值衝破了一兆美金,成為首家突破此門檻的半導體公司。那麼輝達最近的一飛衝天到底只是曇花一現還是有穩固的產業基本面支撐,整個AI產業的現況和前景又如何?除了輝達之外那些公司會因為這波熱潮水漲船高,整個產業的隱憂何在?本文綜合《經濟學人》的兩篇報導和一篇《華爾街日報》的報導對這些重要問題做出解答。三文的連結如下:
一、輝達的強項與挑戰
創新的浪潮中會產生新巨頭。微軟搭者桌上型電腦的浪潮崛起,蘋果是靠智慧型手機。人工智慧很可能是新一波的科技大浪,改變企業經營和社會運行的方式。那麼AI 相關的軟硬體公司都會受惠,不過這其中準備的最好要搭上這股浪潮的就是輝達(Nvidia),在5月的最後一周輝達的股價首度突破一兆美元,那輝達會成新的科技巨頭龍頭嗎?
輝達成為目光焦點是從去年11月ChatGPT問世後開始的。之後各類型的公司都推出了有AI概念的產品,加大了這股熱潮的熱度。的確輝達的老闆黃仁勳對此熱潮也信心十足,預告一個”新計算時代”即將到來。的確輝達的股價從2023年開始到現在已經漲了2倍多。
那麼這些樂觀的情緒背後有基本面支撐嗎? 的確是有的。輝達在產業中處於一個讓人羨慕的位置:它的核心事業是設計高效能晶片。最早是賣這類晶片給狂熱電動玩家,不過後來這類晶片被用到訓練人工智慧模型時效率也很高。當然輝達的沖天並非只是恰好跟上熱潮,它推出的每一代晶片效能都提升了好幾倍。今天輝達佔特殊性AI晶片市場的市佔率超過80﹪。
此外輝達在兩個領域中早已大舉投資,鞏固了它今日的霸主地位:第一個就是先進網路連結(Advanced Networking)。畢竟訓練AI模型需要巨量的資料處理能力,有時會同時用上數以千計的晶片。這些晶片會在一個高效能、針對AI 特製的網路中交換資料。今天在這個市場中輝達佔有78﹪的市場,這是得力於它在2019年收購專長此網路的公司Mellanox。
輝達的另一個強項是它的軟體-CUDA,它的AI平台。這平台廣受程式設計師歡迎但只能在輝達的晶片上跑。透過提供免費晶片和軟體給一些AI研究者。輝達在對手想吸引軟體開發者之前就已經把他們輝達的生態系中。
當然輝達是否之後都會一帆風順長期維持霸主地位還很難說。首先是對AI的狂熱也許會退潮。其次是當這行前景看好時,會吸引更多的競爭者例如像是微軟、超微(AMD)等新創和大晶片商進入市場搶奪輝達的網路和晶片事業。其他公司會設法弄出開源或是專利軟體來削弱CUDA的市佔率。不過最大的挑戰來自輝達自己的客戶:亞馬遜和谷歌的雲計算事業部都在設計自己的AI專屬晶片,這兩大巨頭口袋和規模都夠深足以成為可怕的對手。
政府的監管也是另一個風險。擔心AI給社會和國家安全帶來的危險讓政府正在找方法控制這種科技。去年美國限制販賣高效能晶片和晶片製造設備給某些中共公司,讓輝達第三季的收益打了折扣。若輝達持續獨大會比較成為政治人物下手的目標。
不過總體來說,輝達的前途還是光明。第一是即使AI熱潮稍微冷卻,AI相關的科技還是比起比特幣-上一個讓輝達大發利市的領域-有用。監管可能會抑制成長,但不到把AI毀掉的地步。而且沒有任何一個輝達的對手能把軟體、晶片和生態網路都打包結合的如此之緊密,這就是輝達主要的強項所在,而這種強項其實和蘋果、微軟非常類似!
二、AI掏金熱下的晶片大缺貨
那麼到底輝達的市值在突破一兆美元,成為史上第一家達到這個里程碑的半導體公司後,再來股價會如何變化有很多因素影響,但從產業供需的基本面來看,應該是保持可以樂觀的。因為目前這類AI所需要的先進晶片正處於ChatGPT的熱潮而嚴重缺貨中。
所以Lamini-一家輔導企業開發如聊天機器人AI模型的新創公司-的創辦人兼CEO Sharon Zhou就表示在這種時刻,你認識誰很關鍵,而AI晶片變得像是疫情期間的衛生紙一樣稀缺。在晶片缺貨下,雲計算供應商如亞馬遜和微軟能提供客戶,例如推出ChatGPT的OpenAI的運算處理能力便受到限制。AI的開發商需要夠力的伺服器來開發、運行越來越複雜的模型並幫助其他公司打造AI服務。
現在就連關係最好的科技公司想確保有足夠強大的伺服器也很困難。5月16在國會聽證會上,OpenAI的 CEO Sam Altman便表示受限於處理器不夠,現在如果少一點人使用ChatGPT會更好。馬斯克在5月23號的《華爾街日報》的CEO高峰論壇上還說現在GPU根本比毒品還難到手。
不過馬斯克還是馬斯克,今年稍早和甲骨文抱怨運算能力不夠的新創客戶都被很突兀地告知,甲骨文剩下的多餘伺服器都被買走了,正是馬斯克為了打造能和OpenAI對抗的X.AI把剩餘的空間都買走了。如果缺少先進的圖形晶片,進行和大型語言模型有關的工作跑起來會慢很多。輝達的先進繪圖晶片非常善於同步進行很多計算,這對運行AI智慧至關緊要。
UBS的分析師估計ChatGPT比較早的版本需要大概一萬片圖形晶片,但馬斯克估計更新版需要三到五倍數量的輝達處理器。輝達最近表示正在擴展來應付更大的需求。CEO黃仁勳五月底時表示正在提高最新旗艦晶片、用在生成式AI的H100的產量。他在台灣的Computex上說現在幾乎全世界都想訂貨。
而今年對輝達晶片的需求到五月底為止把它的股價推升了167﹪。晶片的成本各自有別,但輝達的高階AI晶片某些零售商可以賣到大約33000美金。然而在需求旺盛下在二手市場輝達晶片的賣價更高!
有些投資人只好想辦法從網路系統中清出一些多餘的運算能力出來。還有出手下大單訂購處理器和伺服器再分配給旗下的AI新創公司。新創公司也正在把AI模型以增強效率、買進專屬的實體伺服器配上相關的圖形晶片或是轉用比較沒那麼熱門的雲端服務如甲骨文公司來度過這段晶片短缺期。還有些新創公司的老闆只能拼命哀求亞馬遜、微軟提供更多運算空間。不少AI公司的創辦人預期短缺會至少持續到明年。
還有些公司乾脆直接續約購買雲端空間以免之後想用時沒空間可用,即使他們沒有馬上用到。有些已經買到足夠運算力的公司還是有可能要等上好幾周才能實際用上,畢竟付款買的GPU可不是隔天或下周就到貨。還有的伺服器廠商和它們的客戶表示要等超過半年才能拿到輝達最新的圖形晶片。伺服器製造商大廠之一Supermicro CEO表示該公司還在等交貨的圖形晶片數量是史上最高但它們的工廠正在急者擴充產能。因為這種情況一個高階晶片的二手市場便應運而生,賣家是在虛擬貨幣挖礦熱潮時買下晶片的大虛擬貨幣公司,現在該產業進入不景氣因此不需要這些晶片。
與此同時,OpenAI的Sam Altman和公司員工都在處理來自在它們公司平台上打造AI服務的客戶的抱怨。如Nabla-一家開發醫生AI助理公司-的CEO Alex Lebrun說OpenAI的軟體有時候要等兩分鐘才會回應。Nabla是用AI來自動產生病歷、轉診單和臨床建議,而他們的客戶是要這些文件馬上都弄出來的。
Nabla只好打造一個比較簡單的模型先快點弄出東西的草稿當作替代方案,在用最新版的ChatGPT做最後的調整。CEO LeBrun覺得一個好的新創公司要懂得應變,不過他也把這些問題和Altman直接反應了。而Altman和其他該公司的員工對這些投訴的回應是他們正和最大的投資人以及資料中心供應商微軟一起處理這些問題。
三、AI供應鏈點將錄
從上面的業界現況描述可知,除了輝達之外,其他的晶片公司像同樣的晶片設計公司的超微(AMD)和製造晶片的台積電都從這股熱潮中受惠。其他和運算能力有關的基礎設施供應商也是,包括五顏六色的電纜、嘎嘎作響的空調系統、資料中心所需的空間還有運行AI模型和編列資料所需的軟體。
當然不斷湧現的需求中最明顯的贏家是晶片製造商。讓AI得以運行的雲計算服務商對輝達、超微和台積電有不斷增加的需求。UBS估計未來一到兩年AI會讓圖形處理晶片(GPU)的需求增加100-150億美金。輝達的目前佔銷售額56﹪的資料中心業務可望翻倍。超微今年會推出一款新的GPU,雖然它的分量比輝達小很多,但只要吃下市場剩餘的部分也是可觀的利潤。
另外聚焦於AI的晶片設計公司如Cerebras和Graphcore也正準備趁這一波大顯身手。而類似的公司,根據資料數據公司Pitchbook的估計約有300家。除了台積電會明顯受惠外,專長把更多晶片封裝在單一處理器上的公司一樣會是贏家。荷蘭公司Besi是製造把晶片接在一起的工具的廠商,控制了高精度晶片連結市場的3/4,該公司的股價今年已經上漲了超過五成。
UBS估計GPU大概佔AI專屬伺服器成本的一半,在一般的伺服器中,GPU只佔成本的1/10。但GPU不只是唯一的部件。要像一部電腦一樣的運轉,這些GPU必須要和彼此溝通,這就需要一些高階的開關、路由器和特殊晶片。這類部件的市場在未來幾年有望每年成長40﹪,在2027年達到大約90億美金。輝達也銷售這類部件,目前的全球市佔率是78﹪。但輝達這一塊的競爭對手在加州的Arista Networks正得到投資人的關注,去年的股價上漲了七成。製造讓網路得以連結晶片的博通(Broadcom)也表示今年這類部件的銷售額會翻四倍,來到八億美金。
這股AI熱潮對組裝資料中心所需伺服器的廠商也是好消息。研究機構DellOro預估全球的資料中心AI專屬伺服器的比例會在五年內從現在的不到10﹪增加到20﹪左右。對這類伺服器的支出佔資料中心的資本支出比例也會從20﹪上升到45﹪。這會讓專門為大型雲端服務如商亞馬遜的AWS和微軟的Azure訂製伺服器的製造商如台灣的緯創和英業達受惠。
比較小型的製造商也會有很好的表現。另一家台廠緯穎就表示AI相關的訂單佔了訂單超過一半。前面提到的美國公司SuperMicro表示四月的前三個月,AI產品佔了銷售額的29﹪,在更早的12個月中佔銷售額平均只有20﹪。
上述這些AI硬體都需要特別的軟體才能運行。有些軟體是硬體公司製造的。輝達的軟體平台CUDA能讓輝達GPU使用者達到最佳效益。其他公司則創造AI公司管理資料的應用軟體如Datagen、Pinecone、Scale AI或是發展大型語言模型如HuggingFace、Replicate。Pitchbook指出有大約80家這樣的新創公司。有20多家今年都募集了新資金。知名創投Anderson Horowitz和Tiger Global都投了Pinecone。
就和硬體的情況一樣,雲計算的巨頭也是很多這類軟體的用戶。亞馬遜、谷歌和微軟一共打算花1200億美金在資本支出上,去年的資本支出總額是780億美金。這些新增的支出很多都是用於擴增它們的雲計算能力。但即使都做到這樣了,對人工智慧計算的需求是如此之大所以這些巨頭都正在很吃力跟上。
這就為挑戰者開了一扇門。這幾年IBM、輝達和美國電信公司(Equinix)都開始把讓客戶能夠使用GPU當成一種”服務”來提供。以AI為重心的雲服務新創也如雨後春筍。Lambda,從谷歌所屬的一家投資公司Gradient Ventures還有OpenAI的共同創辦人Greg Brockman拿到4400萬美元的資金並讓公司的估值來達到2億美金。另一家估值20億美金的類似公司CoreWeave四月從包括輝達在內募到了2億2千1百萬美金。該公司的共同創辦人Brannin McBee強調聚焦於客戶服務和圍繞AI所設計的基礎建設有助於該公司和雲計算巨頭競爭。
最後一種AI基礎建設贏家最像實際上過去掏金熱中提供鏟子的人:資料中心地主。當雲計算需求湧現時,他們的物業變得愈來越滿。2022年下半年,資料中心的空屋率來到史上最低的3%。像美國電信和其對手Digital Realty這種專門的公司需要和急者把資料中心納入房地產投資組合的大資產管理公司經理人火拼。2021年私募基金巨頭黑石付了100億美金給QTS Realty Trust,其中一家美國最大的資料中心營運商。今年四月黑石的加拿大籍對手、一直很大量投資資料中心的Brookfield買下了法國的資料中心公司Data4。
這樣的AI基礎建設不斷膨脹有可能會有撞牆的一天。第一個限制是能源。是否有充足的電力以供耗電量大的AI基建消耗會是資料中心集中地如矽谷和北維吉尼亞的隱憂。但若是從很大的AI模型和雲計算為基礎的推導轉移到比較迷你的系統便會降低對AI基建的需求,因為如此一來訓練所需要的計算能力就小很多而且可以用手機便能進行推導,谷歌最近發布的迷你版PLM模型情況就是如此。
當然最大的問號還是在這波AI熱潮到底實際的功效如何。雖然ChatGPT廣受歡迎,這樣的科技到底是否能營利還看不出來。在矽谷,狂熱變成失望是轉瞬間的事。2021年輝達的市值曾經飆過一次,受惠於它的GPU是挖比特幣和其他加密貨幣的最佳工具,但加密貨幣由盛轉衰時期市值便跟者大跌。如果AI發揮不了宣稱的革命性轉變威力,監管機構可能便緊接者出手。世界各地擔心生成式AI可能會影響就業或式散播假訊息的政府官員已經在考慮對AI設下護欄。今年5月11號歐盟的國會議員提出了一套法案對聊天機器人加以限制。
上述這些因素都可能放慢AI的發展,連帶讓AI基建公司的前景黯淡,但程度應該不會太大。即使生成式AI並沒有像期擁護者說的那麼有革命性,可以確定的是它會比加密貨幣用處來的大。而且還有很多非生成式AI一樣需要很多的運算力。除非有個現在連影子都沒有的全球性生成式AI禁令才有可能止住這波掏金潮。而只要大家都還在拼命衝,叫賣十字鎬和鏟子的販子就會轉得盤滿缽滿。