数据是宝
数据宝库
减少股票交易的后顾之忧
随着最新AI芯片GB200的订单量上升,英伟达的股价也随之上涨。但这场AI盛宴的背后,AI算力市场却呈现出“冰与火”的一幕。
自从今年3月份发布GB200架构芯片以来,这款产品就备受外界关注。近日,天风证券分析师郭明池在研报中表示, GB200芯片订单激增。微软是该芯片的最大客户。其第四季度订单量增长了3-4倍,超过了所有其他云服务提供商。和。
尽管新一代AI芯片的需求爆发式增长,但曾经炙手可热的H100芯片却显得有些平淡。算力租赁市场价格已从高峰时期的8美元/小时降至2-3美元/小时。证券时报记者从业内人士处获悉,从今年上半年开始,国内算力价格呈现下降趋势。在大模型训练需求下降、早期“囤卡”导致相对过剩的背景下,一些规模较大的小型算力供应商可能面临亏损,正在加速被市场“洗牌”。
值得注意的是,在大AI模式浪潮下,不少A股上市公司此前已布局算力服务,其中不乏不少跨境玩家。在汹涌的人工智能浪潮中,算力供给和市场需求正在快速变化,相关投资能否获得理想回报正成为越来越不确定的问题。
明年GB200芯片订单已满
摩根士丹利分析师最近与英伟达首席执行官黄仁勋、首席财务官和管理团队其他成员举行了会议。根据会议上了解到的信息,分析师摩尔表示,英伟达下一代GPU芯片的生产已“步入正轨”,未来12个月左右的供应量已经售罄。
天风国际证券分析师郭明錤发布的最新英伟达GB200芯片产业链订单信息也显示,芯片产能扩张预计将于2024年第四季度初启动,预计2024年第四季度出货介于 150,000 至 150,000 之间。 20万元至20万元之间,2025年第一季度出货量将大幅增长200%至250%,达到50万至55万元。郭明池还指出,微软目前是 GB200芯片的全球最大客户。今年第四季度订单量将激增3至4倍,其订单量将超过所有其他云服务提供商的总和。
作为新一代AI旗舰芯片,GB200芯片包含2080亿个晶体管,采用台积电N4P工艺。它采用双芯片架构,AI算力高达FP4,是上一代的5倍。国海证券研报显示,与上一代AI旗舰芯片H100相比,旗舰服务器可将大型AI模型(如1.8T参数GPT-MoE)的训练速度提升30倍。
高性能AI芯片在手,大客户订单纷至沓来。黄仁勋曾在CNBC专栏采访中提到,微软、Meta等科技公司对芯片的需求非常强劲。 “每个人都想拥有最多,并成为第一。”
“GB200芯片需求的爆发,不仅预示着在AI硬件领域的领先地位进一步巩固,也表明全球AI发展正在加速进入由更高效、更强大的计算能力支撑的新阶段。”天使投资人、资深人工智能专家郭涛在接受证券时报记者采访时表示,GB200如果成功量产出货,将对全球AI生态产生深远影响,推动复杂模型训练和推理的提升效率,推动人工智能在多个行业的深度应用。加快人工智能技术普及和创新。
H100芯片已遇冷,租赁价格较高峰期下降50%以上。
与GB200芯片的爆发式需求相比,曾经火热的上一代旗舰芯片H100在算力租赁市场已经从“一卡难求”变成了“供过于求”。
时间回到2023年3月,推出了H100系列GPU。与上一代芯片A100相比,H100基于该架构,拥有18432个CUDA核心。支持更先进的内存技术和更高的带宽,性能提升3倍。它尤其在人工智能训练和推理任务中表现出色。这也是H100成为近两年来最强大、最受欢迎的GPU产品。
在大模型热潮中,GPU的性能很大程度上决定了模型训练的效果,因此各大公司纷纷投入巨资购买H100。证券时报记者从一位从事计算资源池工作的业内人士处了解到,搭载H100的服务器一般以8卡的形式出售或租赁。去年,8卡机的销售价格普遍在300万元以上。现在,价格已降至230万元至240万元左右,“每周一价”。至于英伟达专门向中国供应的H20芯片,8卡机的价格也从之前的140万元左右下降到了110万元以内。
在算力租赁市场,价格下降更为明显。据了解,H100芯片的初始租赁价格为4.7美元/小时,在需求高峰期一度涨至8美元/小时以上。记者查看算力租赁网站发现,目前租赁价格在每小时2至3美元之间,价格较高峰期已下降50%以上。
“现在算力价格大幅下降,我们都在观望。”业内人士告诉记者,算力价格下降并不是GB200芯片推出后出现的现象。他感觉今年上半年以来市场一直在下滑。水温越来越冷了。之前训练大型模型的需求非常强烈。另外,市场上可用的算力不多,所以大家都在囤货,这进一步推高了价格。
业内人士认为,算力价格下降的主要原因有两个。首先,需求减少。经过前期的疯狂投入,AI的收益曲线似乎并没有人们想象的那么陡峭。许多企业开始重新审视AI投资,投资放缓;其次,算力供给量增加,特别是在国产化和开源模式加速的背景下,企业逐渐从寻找大规模、高性能的算力转向能够满足小型化的更高性价比的芯片。集群训练或推理任务。
在价格下行的情况下,一些业内人士对GPU泡沫破裂表示担忧。但不少从业者认为,这种趋势是技术迭代和市场自律的正常表现。郭涛告诉记者,所谓“GPU泡沫破灭”或许过于悲观。 “当前AI算力市场处于动态平衡状态,虽然个别产品价格有所波动,但整体需求依然强劲。”
数百家上市公司已进入算力租赁行业,但盈利问题仍笼罩在神秘之中。
自从生成式AI点燃算力需求以来,不少上市公司纷纷进军算力市场。其中,算力租赁作为一种更加灵活、性价比更高的方式,成为各玩家重点赛道。通化顺数据显示,截至10月26日,已有107家上市公司涉足算力租赁业务,其中包括云服务、数据服务等领域的公司,以及房地产、建材、纺织服装、印染等行业。其他领域。的跨境进入者。
在算力租赁价格下降的背景下,算力的初期资金投入能否获得理想的回报,成为了所有玩家的谜团。英伟达曾预测,GPU每小时租赁价格将在四年内维持在4美元/小时左右。然而,一年半之内,H100的租赁价格已降至每小时2-3美元。对于囤卡的算力租赁公司来说,意味着利润的大幅下滑。
据外媒.space作者Cheah近期文章测算,当GPU租赁价格跌破1.65美元/小时时,算力提供商将面临严重的损失风险。 Cheah直言,投资新H100已经无法盈利。事实上,不仅是H100,还有英伟达另一款热门消费芯片4090,今年3月份的租赁价格普遍在每月13000元左右。现在已经降到了每月7000至8000元。相关投资的回收周期将会拉长。
一方面,算力租赁价格具有很大的不确定性;另一方面,算力租赁市场的需求也面临较大波动。经历了2023年的“百模大战”,如今硝烟似乎已经散去。许多企业逐渐放弃预训练模型,减少预训练投入,更多地从模型训练转向应用。对高性能预训练芯片的需求也随之增加。逐渐减少。考虑到大多数企业近两年才进入算力租赁业务,仍处于早期投资阶段,成本尚未收回。上述因素将对算力租赁业务的盈利能力构成较大挑战。
此外,由于国际关系等复杂的外部原因,国内厂商能否如期获得高性能计算卡也是一个问题。例如,去年“味精大王”莲花控股宣布进军算力业务。近日,莲花控股发布公告,解释算力业务转型相关进展情况。提及,公司全资子公司莲花科技去年9月与新华三信息科技签订330台GPU系列服务器采购合同,合同金额6.93亿元。不过,除了去年11月交付的12套外,其余318套尚未交付。公告还提醒,剩余318台GPU系列服务器的交付存在不确定性风险,存在交付期限不明确的风险。
“一方面,算力价格下降压缩了服务商的利润空间,运营压力加大;另一方面,也为更多企业提供了以低成本获得高性能算力的机会,推动了AI技术的广泛应用。 ”郭涛表示,技术升级速度加快会带来投资折旧问题,对于进入算力业务的企业来说,需要密切关注市场动态,合理规划投资,避免盲目跟风,同时加强技术创新和服务优化,应对潜在的市场波动和不确定性。
以上部分内容由“文心一言”整理拓展,转载请注明出处:https://www.2sg.net.cn//60487.html