AI繁荣遇“芯荒”瓶颈,引发算力争夺战
谷歌(Google)首席执行官将AI革命与人工取火相提并论。要是这个行业现在能够获得数字火种作为发展动力就好了。
作为全新生成式AI系统命脉的先进制程芯片面临短缺,引发了一场锁定计算能力和寻找变通方法的竞赛。用于AI的图形处理器(GPU)几乎都是由英伟达(Nvidia, NVDA)制造的。但随着ChatGPT的爆火,对这些芯片的需求大增,已经远超供应。ChatGPT是一款聊天机器人,能够模拟人类的口吻回答问题。
“因为存在短缺,所以人脉很重要,”Lamini的联合创始人兼首席执行官Sharon Zhou说。“就像是疫情期间人们疯狂抢购卫生纸那样。”Lamini是一家初创企业,帮助公司搭建聊天机器人等AI模型。
“缺芯”局面限制了亚马逊公司(Amazon.com, AMZN)和微软(Microsoft, MSFT)等云服务提供商能够向ChatGPT的开发商OpenAI等客户提供的处理能力。AI开发者需要服务器容量来开发和运行他们日益复杂的模型,并帮助其他公司构建AI服务。
即使是世界上人脉最强大的科技创业者也难以获得充足的服务器容量。在5月16日美国国会AI听证会上,OpenAI的首席执行官Sam Altman说,由于处理器瓶颈,如果使用ChatGPT的人少一点会好一些。
5月23日,马斯克(Elon Musk)在《华尔街日报》CEO理事会峰会(WSJ CEO Council Summit)上说:“眼下获得GPU比获得毒品要难得多了。”
不过,马斯克毕竟不是常人,可以享受特别待遇。据知情人士透露,今年早些时候,一些争夺甲骨文(Oracle, ORCL)计算能力的初创公司突然被告知,有一个买家已经抢购了甲骨文的大部分闲置服务器空间。知情人士说,这些初创企业被告知,这个买家是马斯克。马斯克正在打造自己的AI项目,名为X.AI,对标OpenAI。
对于那些正在训练能够生成原创文本和分析的AI大模型的企业而言,获得数以万计的先进制程图形芯片至关重要。公司创始人说,若没有这些芯片,AI背后的大语言模型的工作运行就会慢得多。英伟达的先进制程图形芯片擅长同时进行大量计算,这对AI工作至关重要。
瑞银(UBS)分析师估计,较早期版本的ChatGPT需要大约1万块图形芯片。马斯克估计,升级版ChatGPT需要的先进制程芯片数量是这数字的三到五倍。
英伟达最近表示,正在扩大供应,以满足不断增长的需求。英伟达首席执行官黄仁勋(Jensen Huang)周日表示,已提高H100的产量。这是英伟达推出的用于生成式AI的新款旗舰芯片。他在台湾的一个行业展会上表示,需求几乎来自世界的每一个角落。他还宣布了一系列新的AI相关计划。
对英伟达产品的需求已推动该公司股价上涨约167%。芯片成本各不相同,但英伟达的先进制程AI芯片在一些零售商处的售价约为33,000美元,不过,在需求旺盛之际,这种芯片在二级市场上的价格会更高。
一些投资者正在梳理他们的网络,寻找空闲的计算能力,另一些投资者则在安排批量订单购买处理器和服务器容量,可以在他们的AI初创公司之间共享。据AI投资者和初创企业称,初创企业正在缩小他们的AI模型以提高效率,购买自己的带有相关图形芯片的物理服务器,或转向甲骨文等不太热门的云服务商,直到“缺芯”问题得到解决。
其他公司创始人完全是在恳请亚马逊和微软的销售人员提供更多处理能力。
Zhou说,Lamini拥有所需的芯片。她和接受《华尔街日报》采访的许多其他创始人均不予透露他们是如何获得这些芯片的。Zhou与一位前英伟达工程师共同创办了Lamini。
OpenAI发言人表示:“业界对GPU的需求旺盛。”这位发言人还称,该公司致力于确保客户拥有所需的服务器容量。
甲骨文和马斯克没有回应记者的置评请求。微软和亚马逊不予置评。
许多AI创始人预计,这种“缺芯”局面至少会持续到明年。
一些公司正在锁定云计算资源,因为担心以后可能无法获得。“人们现在还是要继续为云计算资源付费,即使他们并不需要,”Arthur的首席执行官Adam Wenchel说。该公司的业务是打造保护公司免受数据泄露等AI风险的工具。
创始人和投资者表示,能够获得算力的公司仍可能要等待数周才能使用。“即使你已经付了预付款,也不意味着就能在第二天或未来一周内拿到GPU,”Perplexity AI的首席执行官Aravind Srinivas说。“你只能等。”该公司构建了一个AI驱动的对话式搜索工具。
服务器制造商及其直接客户表示,他们得等待六个月以上才能拿到英伟达的最新图形芯片。服务器制造大厂Supermicro的首席执行官说,该公司采用图形芯片的系统的未交货订单达到有史以来最高水平,该公司正急于增加产能。
上述一切都为这些先进制程芯片创造了一个二级市场,部分涉及到大型加密货币公司,这些公司在繁荣时期购买了芯片用于挖矿,如今数字货币市场低迷,就不需要这些芯片了。
AI研究公司Generally Intelligent的首席执行官Kanjun Qiu自去年以来一直在为自己的服务器购买先进制程图形芯片,这才得以从容应付目前的短缺局面。不久前,一位风投人士给她发来信息,询问她是否有多余的计算资源可以租给其他初创企业。Qiu还没有决定是否要出让她的芯片。
与此同时,OpenAI首席执行官Altman和其他员工一直在应对在其平台之上构建AI服务之公司的抱怨。
Nabla首席执行官兼创始人Alex Lebrun说,OpenAI的软件可能需要两分钟来回应查询。Nabla为医生开发了AI助手,该公司使用AI自动生成病情记录、转诊信和临床建议,其客户希望这些笔记能即时生成。
Lebrun称,作为一种变通方法,Nabla建立了一些更简单的模型,以更快地生成材料的初稿,然后依靠最新版本的ChatGPT进行最终调整。Lebrun表示,好的初创公司是那些学会如何绕过所有这些限制的公司。他补充说,他已经直接向Altman提出了这些问题。
Altman和OpenAI的其他代表已告诉创业者们,该公司正在与微软合作解决这个问题。微软是OpenAI最大的投资者和数据中心供应商。