英伟达,会不会成为一家云计算厂商?

TechForWhat 2024-03-11 19:58:13

作者 | 万泉河

编辑 | 葛覃

“天下苦英伟达久矣”。

随着AI的爆火和算力需求的猛增,英伟达GPU目前是云服务商的不二之选,英伟达手持屠龙刀,号令群雄,莫敢不从。

各云服务商既要挤破头地争抢,又苦于其高昂的价格和断供的风险,从减少成本、避免“卡脖子”等角度出发,云服务商们纷纷加快自研AI芯片的脚步。

这厢昔日客户纷纷“掀桌”,准备自立山头,那厢英伟达也早就想好了对应之策。原因无他,以AI算力为核心的云基础设施,代表着新时代的算力霸权,英伟达随时准备向云计算领域迈进。

做云的野心,不加掩饰

“我真的相信英伟达会收购一家云厂商。”两年前,一家芯片厂商高管对TechForWhat表示。彼时大模型还未席卷世界,技术人基于朴素的逻辑判断,英伟达有必要,也有动力成为一家云厂商。

如果我们复习下IT产业的历史,CPU的全称是中央处理器(Central Processing Unit),用于描述计算机系统的运算和控制核心,CPU是信息处理、程序运行的最终执行单元。

那么问题来了,当越来越多的负载变为AI任务,如果GPU成为新的计算核心呢?这就是英伟达的野心。

英伟达的思路是成为AI时代的“CPU(中央处理器)”,与此同时,过去以传统CPU为中心的计算架构,控制的是单个服务器,云基础设施控制的是成千上万的服务器,尤其在面对大型AI任务时,云计算有天然的规模优势。

另外一个重要因素是成本,CPU的普及受益于摩尔定律和使用门槛的大幅降低,当下GPU的价格依旧高昂,只有少部分企业和个人才能使用,尽管英伟达GPU还处在供不应求的阶段,但只有更广泛的使用,才能带来海量的市场。

英伟达必须将AI算力的价格打下来,那么云计算就成为一条现实可行的道路。

大模型让英伟达看到了触手可及的机会,当OpenAI推出ChatGPT之后,AI软件开发商对英伟达GPU的需求激增,云服务商供应短缺,这是一个微妙的节点,英伟达看到了可以从云厂商争夺客户的方式,从产品到最终客户的链条越短,端到端的把控力也就越强,利润空间也就越大,英伟达的战略也就得以实现。

在2023年3月的GTC大会上,英伟达推出了自己的云服务DGX CLOUD,黄仁勋甚至不加掩饰地推出了英伟达自己的云服务,尽管规模尚小,但相当于直接与云客户竞争,在大模型火热的阶段,英伟达此举的战略作用并没有引起圈外人士的关注。

DGX CLOUD的逻辑是将英伟达的服务器托管在云厂商的数据中心,相当于云厂商的托管业务,英伟达只需要将精力放在自己的软硬件层面,数据中心层面的基础设施都由云厂商来提供。

以英伟达和甲骨文的合作为例,Oracle Cloud Infrastructure(OCI)提供专门构建的 RDMA 网络、裸金属计算以及高性能本地块存储,企业可以通过浏览器,就能访问自己的 AI 超级计算机,免除了购置、部署和管理本地基础设施的复杂性。

DGX Cloud的优点不在于有一个经过认证的本地和云堆栈,来运行英伟达的人工智能硬件和软件,而是让客户以一种SaaS模式向英伟达付费,然后英伟达借此实现AI算力的普及。

本质上,英伟达DGX CLOUD就是一门云计算生意,英伟达还不必投入以数亿乃至数十亿美金建设自己的数据中心,利用自己GPU的议价权直接有了开展云计算业务的基础,此举不可谓不妙。

云巨头与英伟达:爱恨交织

英伟达和云巨头此前有着漫长的蜜月期。云巨头是英伟达的“金主”,随着AI浪潮几次沉浮,GPU在云巨头采购清单上的重要性也愈发靠前,大模型让云巨头和英伟达地位扭转,英伟达处于绝对的主导地位,他就像《西游记》里的太上老君,炼制的仙丹能使服用者变得强大。

当英伟达开始进军云服务之后,其与云巨头的关系开始变得微妙起来。以AWS为例,AWS是对英伟达进军云服务最谨慎的云巨头,也是最后一个同意与英伟达在DGX云服务领域合作的云巨头,作为交易的一部分,AWS获得了GH200芯片的购买权,并且采用NVLink网络,足以显现出英伟达的诱惑,让AWS也只能暂时低头。

英伟达在人工智能领域雄心勃勃,它希望超越仅销售芯片,而是向最终客户提供完整的人工智能解决方案,这包括提供广泛的软件工具,甚至是自己的云服务。

DGX CLoud不止是简单的将芯片放在云数据中心,英伟达为此做出的软件工作尤为值得关注。例如NVIDIA Base Command Platform和NVIDIA AI Enterprise,前者是一个管理与监控软件,可以提供高效的AI训练服务,还能让用户直接通过浏览器访问DGX Cloud。

后者则是英伟达AI平台中的软件层,包含几千款软件,提供各种训练模型、AI框架和配套工具,简化端到端的开发和部署成本。DGX Cloud的软硬件配置体现了英伟达两方面的优势:丰富的AI生态和强大算力,也是英伟达与传统云服务商相比的特色化优势。

目前,英伟达DGX云服务已经获得了一些大买家的青睐,例如IT软件巨头ServiceNow、生物制药公司Amgen和保险公司CCC Intelligence Solutions。

“谁掌握了算力,谁就掌握了未来”,在英伟达看来,与其让云厂商使用英伟达的芯片,成为AI云服务的主导者,不如凭借自己的软硬件堆栈天然优势,博得一个更好的产业身位。

除了与云巨头合作外,2023年4月,英伟达投资了CoreWeave公司,这家由以太坊挖矿转型成云计算的小公司迅速一夜成名,许多大公司甚至微软都甘愿花费巨资购买其服务,究其原因,是它有英伟达充足的GPU芯片供应。

英伟达“恩威并施”,做足了两手准备,迫使云巨头不得不朝着英伟达希望的方向前进。

另一方面,云巨头们也在公开自己的芯片计划,先行者早在大模型火热之前就有所行动。谷歌自2016年就推出了AI处理器,即张量处理单元TPU,亚马逊向客户提供AWS Trainium等芯片,去年年底,微软也发布了首款AI芯片Azure Maia 100。

此外,芯片领域并不缺少强有力的玩家,英特尔等传统巨头,Groq等新锐厂商并存,也许某一天,英伟达在GPU领域将迎来真正的挑战者,削弱英伟达在云计算领域的地位。

AI云将成为新时代的大生意,谁将主导下一个计算纪元,可能是未来十年最有意思的商业竞争。

0 阅读:1

TechForWhat

简介:数字时代,技术当立。关注行业数字化转型实践与案例。