图片来源:视觉中国
蓝鲸新闻2月27日讯(记者 朱俊熹)由于对DeepSeek模型的需求激增,国内公司正在大幅增加对英伟达H20 AI芯片的订单的消息,受到广泛关注。H20是英伟达特供中国市场的一款GPU芯片,主要用于大模型的推理阶段,即模型训练完成后进行部署的过程。
蓝鲸新闻从一位英伟达代理商处获悉,英伟达GPU芯片的销售确实受到DeepSeek高曝光度的提振,同时显卡价格“一路猛涨”。
其中一位从业者表示,他们会主推用RTX 4090显卡来部署DeepSeek模型。虽然显存和算力不及H20,但用于小模型推理训练的话,性价比会更高。其所在的服务器厂商暂未出现供货紧张的情况,“其实现在只是观望阶段,真正需要采购的需求还是挺少的。”
不过,具体主推产品型号或也与各家库存有点关系,有从业者表示,其目前在卖H20。
DeepSeek模型开发未绕开英伟达CUDA框架
今年1月底,因DeepSeek以低成本实现了对OpenAI的追赶,引发市场对算力投入的质疑,英伟达遭受了美股历史上规模最大的单日个股蒸发,但是凭借高性能GPU芯片及CUDA开发生态组成的护城河,英伟达仍是本轮AI浪潮的最大受益者,股价在两年多的时间里飙升了近800%。
对于分析师有关DeepSeek是否会影响英伟达强劲需求的提问,黄仁勋在最新的Q4电话会上回应称,许多创新且极具潜力的初创公司正在崭露头角,每一家公司都需要大量的计算资源和基础设施。
不可否认的是,虽然DeepSeek的V3模型展现了对算力的极致利用,但它仍然是在英伟达H800 GPU集群上训练出来的。
有从业者曾对蓝鲸新闻分析称,DeepSeek在模型开发过程中并没有绕开英伟达的CUDA框架,只是采用更低层次的编程语言,对底层硬件实现更精细的控制。
此外,DeepSeek本周启动了“开源周”计划,接连开源了多项基于英伟达Hopper架构GPU的优化项目,或进一步彰显出其与英伟达生态的深度关联。
以周四开源的三个代码库为例,双向流水线并行算法DualPipe能优化计算和通信的重叠,专家并行负载均衡EPLB可优化多GPU之间的计算负载,此外还有分析V3/R1模型计算-通信重叠情况的项目。这些都旨在减少GPU的空闲和无效计算,提升整体利用率。值得注意的是,DualPipe的开发者名单中还出现了DeepSeek创始人梁文锋的名字。
持续押注AI基础设施建
在Q4业绩会上,黄仁勋也表示,无论是从短期、中期还是长期信号来看,“我们相当有信心”,软件未来的发展方向将基于机器学习和人工智能。其中,黄仁勋称“中期信号”指的是与往年相比,基础设施建设和资本支出的扩展规模。
英伟达的主要客户包括微软、谷歌、Meta等科技巨头,而这些企业都宣称今年的资本支出将上涨至600亿美元到800亿美元不等,主要用于投入AI基础设施的建设。
上周,一份分析师报告指出,微软取消了至少两个在美国的数据中心租赁合同,引发市场对AI基建是否已供应过剩的担忧。微软回应称,本财年在AI数据中心方面投资超800亿美元的计划仍在进行中,虽然可能会在某些领域战略性地调整建设进度,但将在所有地区继续保持强劲增长。
英伟达截至2025年1月26日的四季度财报显示,当季营收为393亿美元,同比增长78%,高于分析师预期的380亿美元。调整后每股收益为0.89美元,超出预期的每股0.84美元。涵盖GPU芯片、AI服务器等产品在内的数据中心业务录得356亿美元的收入,同比增长93%,是英伟达最主要的营收来源。
英伟达执行副总裁兼首席财务官Colette Kress在电话会上表示,Blackwell芯片的销售情况超出预期,实现了110亿美元的收入,成为英伟达“历史上最快的产品增长”。但同时,Blackwell芯片的产量提升也对英伟达的利润造成了压力。下一季度毛利率预计将降至71%左右,不及市场预期。
“目前我们的重点是加快制造进程,确保能够完全满足客户需求。随着我们逐步达产,我们有信心改善成本和毛利率。预计今年晚些时候毛利率可能会回升至75%左右。”Colette Kress称。
财报发布后,英伟达盘后股价涨跌交替。但电话会结束后,跌幅达近1.5%。