全城7x24小时免费上门,您的生活服务帮手

当前位置: 首页 >> 地板打蜡

华为“凶猛”, 黄仁勋没有退路|深度

发布日期:2025-05-30 05:05:45 浏览:37375

就在全球AI龙头英伟达(NVIDIA)财报发布数小时前,华为再度隔空“硬碰硬”。

5月29日凌晨,华为技术团队在Gitcode平台上发布PanguUltraMoE万亿规模大模型技术报告,其拥有约7180亿参数规模的结构,首次全流程在昇腾Ascend910上进行训练,显著提升推理吞吐并降低延迟,并且融合大算子和通信优化有效提升了NPU利用率,从而有效提高训练过程的稳健性。

而昨天,华为盘古还发布基于分组混合专家模型(MoGE)架构构建的盘古ProMoE大模型,参数规模720亿,基于昇腾300IDuo和800IA2实现了更优专家负载分布与计算效率(321tokens/s和1528tokens/s)。

更早之前,华为技术团队称昇腾在MoE模型的推理部署性能已全面超越了基于英伟达Hopper架构的推理部署性能,而DeepSeek基于国产芯片的部署方案,性能也已超越英伟达H100系列芯片。另外,华为“CloudMatrix384超节点”技术在算力规模和推理性能上也全面超越英伟达NVL72。

因此,面对华为的“凶猛”进击AI算力赛道,身价1173亿美元的黄仁勋似乎也感受到全球AI市场的快速变化,并开始放缓新产品迭代速度,而转向网络架构。

5月29日凌晨,英伟达发布2026财年第一季度(2025自然年第二季度)业绩报告,收入利润仍在上涨。

财报显示,英伟达当季营收441亿美元,环比增长12%,同比增长69%;净利润187.75亿美元,市场预期207.67亿美元;调整后每股收益为0.96美元,市场预期0.93美元。其中,关键的数据中心业务营收同比增长73%,达到391亿美元,略低于市场预期的393亿美元。

值得注意的是,财报中披露,4月美国政府宣布H20对中国禁售,英伟达在2026财年第一季度因H20产品过剩库存和采购义务产生了45亿美元的费用,因为对H20产品的需求下降。在新的出口许可要求之前,2026财年第一季度英伟达H20产品的销售额为46亿美元。英伟达在第一季度无法发货导致额外的25亿美元H20收入。此外,预计英伟达Q2受此损失80亿美元。

近期有消息称,英伟达即将在6月开始对华出货B20“特供版”芯片,以取代H20。

谈到B20的进入对中国AI算力格局看法,Gartner研究副总裁盛陵海(RogerSheng)近期对笔者表示,AI芯片到底是否适用、到底能不能受到欢迎,在于它能否支持最新AI大模型,且效率要高,从而要得到市场的认同,如果竞争力不高,可能没人去使用。然而,即便英伟达AI卡有更好的性能表现,同时也不放弃中国市场,但中国需要发展国产AI算力,一旦美国断供很难让企业信任。“不能把所有的东西放在一个篮子里,我们要多元化(发展)。”

受财报影响,英伟达(NASDAQ:NVDA)股价盘后大涨4.89%,最新市值3.29万亿美元。

数据中心收入持续暴涨,资本市场已不再“震惊”

事实上,自2025年初DeepSeek热潮下,最受瞩目的就是英伟达。

华尔街质疑,DeepSeek“现象级”的崛起,对美国科技巨头3000多亿美元的算力支出是否有用,动摇了推动美国AI行业发展预期。就在美股今年1月27日,英伟达股价暴跌17%,收于118.58美元,市值蒸发近6000亿美元(约合4.3万亿元)。

CNBC称,这是“美国公司有史以来的最大跌幅”。

到了5月,华为又“助力”了。5月中旬,华为发布CloudMatrix384超节点技术,利用多宽带高速网络连接AI加速卡,用网络的“量”弥补显卡性能上的“质”,以此算力训练更大规模的AI模型。

如今,英伟达已感受到了压力。

黄仁勋近期多次表示,中国AI竞争确实非常激烈,初创企业众多,大概有五十多家相关GPU算力公司迅速崛起,其中华为无疑是全球最具实力的科技公司之一。他提到华为昇腾CloudMatrix384超节点和910C,部分性能上甚至超过英伟达的产品。

“这是一个我们必须高度重视、充分尊重的对手,我们也必须全力以赴,持续创新,才能在这样的竞争中保持领先地位。”黄仁勋指出,华为目标就是将5G与AI深度融合,这一战略方向非常有前瞻性,也完全正确,而英伟达也在推进同样的工作。

财报显示,英伟达收入来源于数据中心、游戏、专业可视化、汽车等业务方向。

具体来看,数据中心业务上,英伟达当季营收为391亿美元,同比增长73%,环比增长10%。微软、谷歌等大型云服务平台仍然是英伟达最大的客户群体,占数据中心收入的近50%。Blackwell在该季度贡献了近70%的数据中心计算收入,Hopper的迁移工作已接近完成。

其中,计算业务收入为342亿美元,同比增长76%;网络收入为50亿美元,同比增长56%。

英伟达CFO克雷斯(ColetteKress)表示,AI工作负载已强势转向推理,AI工厂的建设正在带来可观的收入,其对客户的承诺坚定不移。GB200NVL的引入是一项根本性的架构变革,旨在支持数据中心规模的工作负载,并实现最低的单位推理令牌成本。虽然这些系统的构建过程很复杂,但英伟达已经看到制造良率的显著提升,机架出货量也正在向最终客户稳步增长。

本季度,游戏方面营收38亿美元,同比增长42%,环比增长48%,增长主要得益于Blackwell架构GPU的销售;专业可视化业务营收5.1亿美元,同比增长19%,环比持平;汽车业务营收为5.8亿美元,同比增长72%,环比下降1%。

黄仁勋表示:“我们突破性的BlackwellNVL72AI超级计算机——一款专为推理而设计的‘思考机器’——现已在系统制造商和云服务提供商中全面投入生产。全球对NVIDIAAI基础设施的需求异常强劲。AI推理代币的产量在短短一年内就激增了十倍,随着AI代理成为主流,对AI计算的需求也将加速增长。世界各国都已将AI视为与电力和互联网一样重要的基础设施,而英伟达正处于这一深刻变革的中心。”

展望2026财年第二季度(2025自然年三季度),英伟达指出,预计公司收入为450亿美元,上下浮动2%。这一预期反映了近期出口管制限制导致的H20收入约80亿美元的损失;预计GAAP和非GAAP毛利率分别为71.8%和72.0%,上下浮动50个基点,并力争在今年下半年将毛利率提高到70%左右;预计GAAP和非GAAP运营费用分别约为57亿美元和40亿美元。预计2026财年全年运营费用增长率将在30%左右。

对于英伟达来说,中国市场无疑是本季市场最为关注的事件。

黄仁勋近期表示,美国对华AI芯片出口管制是失败的。他说道,“事实证明,最初制定AI扩散规则的那些基本假设存在根本性缺陷。”黄仁勋表示,英伟达在中国的市场份额已从美国前总统拜登执政初期的95%降至目前的50%。

研究机构Emarketer分析师雅各布·伯恩(JacobBourne)在一份报告中表示,更广泛的担忧是,贸易紧张局势以及关税对数据中心扩张的潜在影响,可能会在未来几个季度对AI芯片的需求造成阻力。“这并不意味着英伟达的主导地位将终结,但这凸显出,英伟达要维持这种主导地位,需要应对日益复杂的地缘政治、竞争和经济挑战。”伯恩写道。

5月29日财报会议上,黄仁勋表示,中国是全球最大的AI市场之一,也是通往全球成功的跳板。全球有一半的AI研究人员在中国,赢得中国市场的平台有望在全球领先。然而,如今价值500亿美元的中国市场实际上对美国企业关闭了大门。

“H20出口禁令终止了我们在中国的Hopper数据中心业务。我们无法进一步削减Hopper的产能以遵守出口管制规定。因此,我们将对无法出售或重新利用的库存进行数十亿美元的减记。我们正在探索有限的竞争方式,但Hopper已不再是我们的选择。

无论有没有美国芯片,中国的AI都会不断发展。它必须进行计算才能训练和部署先进的模型。问题不在于中国是否会拥有AI,它已经拥有了。问题在于,作为全球最大的AI市场之一,中国是否会在美国平台上运行。保护中国芯片制造商免受美国竞争的影响,只会增强它们在海外的竞争力,削弱美国的地位。出口限制刺激了中国的创新和规模化发展。

AI竞赛不仅仅关乎芯片,而关乎世界将基于哪种技术栈运行。随着该技术栈扩展到6G和量子技术,美国的全球基础设施领导地位岌岌可危。

美国的政策建立在‘中国无法制造AI芯片’的假设之上。这一假设一直以来都备受质疑,现在显然是错误的。中国拥有巨大的制造能力。最终,赢得AI开发者的平台才能最终赢得AI。出口管制应该强化美国的平台,而不是迫使全球一半的AI人才流向竞争对手。”黄仁勋表示

克雷斯表示,虽然新加坡占英伟达第一季度账单收入的近20%,因为许多大客户都使用新加坡进行集中开票,但英伟达的产品几乎总是运往其他地方。需要注意的是,H100、H200和Blackwell数据中心计算收入中,超过99%的账单收入来自美国客户的订单。

谈到DeepSeek,黄仁勋毫不吝啬地对DeepSeek和通义千问表达了赞赏,称其是“最佳开源AI模型之一”。“就像ChatGPT一样,引入了推理AI,它思考的时间越长,给出的答案就越好。”

“来自中国的DeepSeek和Qwen是最优秀的开源AI模型之一。它们免费发布,在美国、欧洲及其他地区都获得了广泛关注。DeepSeek-R1与ChatGPT类似,引入了推理AI,其思考时间越长,给出的答案就越好。推理AI能够逐步解决问题、规划和使用工具,将模型转化为智能代理。推理是计算密集型的,每个任务需要的令牌数量是以前一次性推理的数千倍——每个任务需要的令牌数量是以前的一次性推理的数千倍。推理模型正在推动推理需求的阶跃式增长。AIScalingLaw保持不变,不仅在训练方面,现在推理也需要大规模计算。”黄仁勋称。

克雷斯表示,英伟达在制造良率方面得到显著改善,机架出货量正以强劲速度交付。GB300也预计本季度末量产发货。

“我们的目标是在一年内在美国制造从芯片到超级计算机的整个过程。每个GB200NVLink72机架包含120万个组件,重近2吨。迄今为止,还没有人生产过如此规模的超级计算机,我们的合作伙伴正在作出非凡的贡献。”黄仁勋称。

黄仁勋强调,“美国将永远是英伟达最大的市场,也是我们基础设施最大安装基数的所在地。如今,每个国家都将AI视为下一次工业革命的核心,这是一个为每个经济体提供智能和必要基础设施的新兴产业。各国正在竞相构建国家级AI平台,以提升其数字化能力。上周,我前往瑞典,出席了该国首个国家级AI基础设施的启动仪式。日本、韩国、印度、加拿大、法国、英国、德国、意大利、西班牙等国家正在建设AI工厂,以赋能初创企业、各行各业和社会。自主AI是英伟达新的增长引擎。”

华为完成中国AI大模型推理适配部署,H20作用大大减少

黄仁勋对华为中国AI市场的渴求,已经摆在了台面上。

“DeepSeek凸显了开源AI的战略价值。当热门模型在美国平台上进行训练和优化时,它将推动其应用、反馈和持续改进,从而巩固美国在整个AI领域的领导地位。美国平台必须继续成为开源AI的首选平台。这意味着要支持与包括中国在内的全球顶尖开发者的合作,当像DeepSeek和阿里Qwen这样的模型在美国基础设施上达到最佳运行状态时,美国就将获得胜利。”黄仁勋认为中国AI大模型应该要用英伟达这样的美国AI系统进行训练,而不应该是华为。

实际上,2017年美国开始发动对华贸易战,2018年已经开始在半导体和芯片等领域围堵中国,2019年切断了对华为5G芯片的供应。

过去六年,华为“低调”处理,接连完成消费级、云服务器层面的芯片部署。当前,基于高达100%国产化率的昇腾芯片,华为昇腾鲲鹏AI系统已经解决了大模型训练、推理问题。所以这对于黄仁勋来说,无疑是一个巨大打击。

就在5月29日一场学术活动上披露,DeepSeek模型已经在华为昇腾上进行了高效推理。通过对模型算子权重进行Int4量化优化,显著降低现存占用,首次实现单台华为8卡服务器上的DeepDeek-R1的推理,同时在DeepSeekV2推理性能比vLLM昇腾版本在不同请求下平均提升88%以上。

上述是一套自主可控的推理优化方案。

据Gartner最新报告显示,截至目前,消费者业务全球份额高达21%,国产芯片自给率高达42%,模拟芯片、无线通讯相关产业芯片达到27%的自给率。

盛陵海对笔者指出,随着自研芯片趋势,自给率份额会逐渐提升。比如,预期今年由于AI市场的投资持续增加,国产AI芯片自给率会有进一步提升。中国芯片企业把眼光不应该仅局限于国产替代,而且要建立相关标准、要去国际市场做新的竞争。

不过,目前国产AI芯片依然存在很多不足。

中国科学院院士、清华大学计算机系教授胡事民表示,国产芯片格局已基本明朗,高端芯片与美国仍有较大差距。算法和模型优化能够实现卓越的性能提升,弥补国产算力不足,原始创新仍然需要加强。

近期华为发布的CloudMatrix384超节点,通过全面架构创新,在算力、互联带宽、内存带宽等方面实现全面领先。而目前,华为开发者规模超1200万,伙伴数量超4.5万,云商店应用数量超1.2万。

目前,黄仁勋也在追赶华为384超节点,部署多个网络平台。他在财报会上表示,目前英伟达有四个网络扩展平台:NVLink、InfiniBand、Spectrum-X和BlueField。

黄仁勋也透露了公司对全球AI基础设施建设的宏伟愿景:“我们可以预见到在不远的将来,需要数十吉瓦的英伟达AI基础设施的项目。”

他指出,AI是一种基础设施。就像电力和互联网成为基础设施一样,AI将成为每个国家、每个行业必不可少的基础设施。我们正处于这种基础设施建设的初期阶段。

展望未来,英伟达仍保持乐观。黄仁勋强调,“这是强劲新一波增长的开始。GraceBlackwell已全面投产,我们已全力以赴。我们现在有多个重要的增长引擎。”