英伟达业绩再创新高,这个AI大赢家还能赢多久?

5月22日,英伟达发布了截止4月28日的2025财年第一季财报。英伟达不负众望,业绩超出业界预期,再创新高。英伟达财报显示,第一财季营收为260.44亿美元,较上一财季的221亿增长18%,较去年同期的71.92亿美元增长262%;净利润为148.81亿美元,较上年同期的20.43亿美元增长628%。尤其值得关注的是,数据中心业务从上一季的184亿美元增长到现在的226亿美元,环比增长23%,同比更是暴涨427%。

英伟达股价在盘后交易中上涨6%。去年一年英伟达股价增长240%,今年股价也已经翻倍。目前,英伟达市值已经超过2.6万亿,远超英特尔(约1300亿)和AMD(约2600亿),直逼微软和苹果。

英伟达是AI芯片市场无可争议的霸主,占据AI芯片80%以上的市场份额,其财报直接影响AI概念股(如AMD、ARM、超微、台积电等)甚至是股市大盘的表现,是科技行业AI投资和需求能否延续的关键检验指标。在生成式AI风潮的推动下,人们对AI芯片的热度不断高涨,帮助英伟达不断创出业绩新高,但人们越来越担心英伟达的这种大幅增长能持续多久,或者生成式AI是不是一个泡沫?随着英伟达业绩不断攀上新高,人们的这种疑问越来越强烈。

众多对手已经进场

人们对英伟达很红多久的疑问首先来自云服务器和超大规模互联网厂商纷纷自研AI芯片。

目前,英伟达的数据中心业务45%来自云服务商和大型互联网厂商,包括Meta、微软、谷歌、亚马逊、苹果、特斯拉和中国阿里、腾讯、百度等,尤其是前四家可能占英伟达销售额的40%。以H100为例,有推测称,英伟达去年H100的产量大约50-70万片,其中仅Meta和微软去年就购买了15万片,Meta声称到今年年底其拥有的H100将达到35万块。另外,亚马逊和谷歌也购买了5万片以上。

然而,这些大客户对英伟达并不专一。由于英伟达的芯片价格昂贵,同时还无法保证供货,云服务商们纷纷走向自研AI芯片的道路。谷歌早就有自己的TPU,亚马逊的推理芯片Inferentia和训练芯片Trainium都已经是第二代,微软去年年底也发布了名为Maia 100的AI芯片。Meta去年曾发布自主研发芯片MTIA,今年也推出了第二代。

虽然这些自研的AI芯片在性能上可能无法赶上英伟达的Blackwell,但搭配它们自己的软件进行优化以后也一定不会太差,同时也可以减少成本压力。

除了云服务商的“背刺”外,英伟达GPU还需要应对直接的竞争对手。其中,最有实力挑战英伟达的还是其老对手AMD和英特尔。

过去,AMD的GPU性能和英伟达有着明显差距,市场份额不高,但AMD产品一直在改进。去年6月份,AMD发布了新一代GPU MI300系列,这是AMD 迄今为止制造的最大芯片,采用众多领先的半导体技术。根据AMD的说法,MI300X 在人工智能推理工作负载中的性能比英伟达 H100高出1.6倍,在训练工作中的性能与 H100相当。尽管英伟达对此数据进行了反驳,但MI300X的性能强大应该是毋庸置疑的。MI300已经上市,AMD预计今年将带来40亿美元的销售额。

英特尔现在有GPU Max和Gaudi两条GPU产品线。英特尔不久前已经宣布放弃GPU Max,而着力开发下一代GPU Max。因此,现在新发布的Gaudi3才是英特尔主打GPU,预计今年第三季度会上市。与上一代产品 Gaudi 2 相比,Gaudi 3性能提高了4倍,内存带宽增长1.5 倍。英特尔称,该芯片的平均能效比英伟达同类芯片H100芯片高出 40%。

除了英特尔、AMD这些老对手外,还有一批新势力的加入,比如Arm、高通等。Arm宣布成立一个AI部门研发AI芯片,高通也在悄悄发力。

不久前,Arm架构服务器CPU厂商Ampere联合高通推出了一款2U服务器,在一个功率12.5kw的机架上部署了192个Ampere CPU核和8个高通 A1 100 Ultra。Cloud AI 100 Ultra是高通去年发布的一款为生成式 AI 和大模型而设计的加速器,可以在单张 150瓦的卡上部署 100亿参数的模型,在两张卡上部署 1750亿参数,尽管性能上不如英伟达的GPU,但对于推理场景却有更高的能效比,也有不小的吸引力。

以CUDA护城河为突破口

众所周知,CUDA是英伟达构筑的GPU生态的基石,从2006年以来英伟达持续投入超过100亿美元。CUDA已经成为英特尔、AMD超越英伟达的一大障碍,英特尔CEO Pat Gelsinger就曾公开抨击英伟达的CUDA技术,称其是一种“封闭和专有的”平台,限制了人工智能的发展和创新。

“打不过就兼容它”,仿照英伟达的CUDA生态,AMD也在打造ROCm 。ROCm支持多种加速器,为之提供了可移植性和互操作性,当然最为重要的是兼容CUDA。

也有人选择直接绕过CUDA,Triton的研发就是出于此目的。Triton于2021年由OpenAI首次发布,目的是让代码在各种人工智能芯片上运行。Triton是开源的,这意味着任何人都可以查看、调整或改进其代码。支持者认为,与 Nvidia 专有的 CUDA 相比,开源的Triton 对开发者天生具有吸引力。

除了OpenAI外,Triton得到了英伟达的竞争对手,如英特尔、AMD和高通的支持,它们希望利用Triton来帮助吸引客户远离英伟达,同时,Meta、微软和谷歌等在为Triton做出贡献。

除了Triton之外,去年英特尔、谷歌、Arm 和高通还成立了一个“反CUDA联盟”——UXL 基金会,该基金会计划基于英特尔开源 OneAPI 平台开发 CUDA 替代方案。另外,苹果、特斯拉和谷歌的前高级工程师 Chris Lattner 推出了 Mojo,这是一种面向人工智能开发人员的编程语言,其宣传语就是“不需要 CUDA”。

对生成式AI的信心最重要

不过,到目前为止,无论是AMD和英特尔的GPU产品还是云服务商自研的AI芯片,或者是业界针对CUDA的替代行动都很难阻止英伟达不断攀升的业绩,也很难在短时间内撼动英伟达目前如日中天的行业地位。相反,人们对生成式AI的信心可能对英伟达近期业绩影响更大一些。

有业内人士指出,目前很多企业实际上处于一个恐慌驱动的构建时期,因为看到微软、Meta、苹果、特斯拉等豪掷千金构建AI基础设施,深恐在这场人工智能大战中落后了,匆匆忙忙地做出了跟进决策,这种情况不会永远持续下去。

另外,现在对生成式AI的宣传都是“所有这些对人工智能的投资都将在未来的某个地方获得回报”,以及云服务商不停地给人们灌输“所有的应用都值得用大模型重做一遍”,实际上,人们对这一宣传并非没有怀疑。

更为重要的是,目前生成式AI的回报并不如预期。据投资机构红杉资本估计,去年人工智能行业在英伟达芯片上花费了500亿美元来训练先进的人工智能模型,但迄今为止,这只带来了30亿美元的收入。英国《金融时报》最近也指出:“生成性人工智能的不确定性与支持它所需的技术基础设施投入的资金形成鲜明对比。”

一旦人们对生成式AI的信心不足,势必动摇投资生成式AI的决心,进而影响英伟达的业绩。另外,从现实地角度说,英伟达显然无法一直保持如此高的增幅,从长期来看,它总将恢复到全行业的平均水平,回归正常只是时间问题。

当然,英伟达CEO黄仁勋一直试图打消人们的这种担心。他在财报发布的电话会议上告诉分析师,“目前,数据中心对GPU的需求令人难以置信,需求超过了我们的供应,我们每天都在赛跑,客户需要我们尽快交货。”

英伟达给出了2025财年第二季度的预测,收入将再次增长,达到280亿美元,正负2%,这低于上一季度和本季度23%的增幅。不过,随着H200和基于Blackwell架构的B100、B200的出货,英伟达再次超出预期并非不可能。

原创文章,作者:速盾高防cdn,如若转载,请注明出处:https://www.sudun.com/ask/77710.html

(0)
速盾高防cdn's avatar速盾高防cdn
上一篇 2024年5月27日 下午4:43
下一篇 2024年5月27日 下午4:53

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注