国产AI大模型集体涨价

  • AI
  • 2026-04-11

4月8日,智谱公布了今年以来的第三次提价计划,发布新一代旗舰模型GLM-5.1的同时提价10%,而其距离上次调价30%起仅一个月。

但除智谱外,腾讯、阿里等也接连停止免费公测,提高API调用价格,其中,腾讯混元大模型最高涨价463%。与2025年降价、免费试用相对,目前明显的信号是,国产AI大模型正在进入集体涨价的时代。

Token变得更加紧俏。对于普通用户而言,能直观感受到的是免费额度正在收紧。大模型Chat产品开始限制提问次数以及附件识别字符,“7.9元”、“一杯奶茶钱”等尝鲜宣传的首月优惠套餐也逐步悄然下架。

对于开发人员而言,各家大模型API调用价格都在上涨,Coding Plan是更具性价比的选择,但其具体额度消耗标准也在出现变化,从以prompt次数为基准转向以模型调用次数或Token为计费基准。

Prompt意味着一次提示指令,即给AI传达的一次任务,而一次指令通常会触发多次模型调用。以阿里云百炼提供的信息作为参考,简单任务约消耗5~10次,复杂任务约10~30+次,实际消耗受任务难度、上下文及工具使用影响。

特别是在Agent场景中。智谱CEO张鹏此前在中关村论坛上表示,完成一个Agent任务所需要的Token量,可能是回答一个简单问题时的十倍甚至百倍。

大模型商们把账算得更细了,要求用户需要对更高水平的“数字员工”支付匹配的价格。1月30日,Kimi公布称Coding plan将从基于prompt请求切换至基于Token计费方式;3月20日,阿里云百炼暂停Lite套餐订购;3月23日,Minimax也将Prompt基准改为模型调用次数。

Coding plan甚至一度出现“限购”现象,智谱从1月下旬便公告称将试行限量发售GLM Coding Plan,限售后每日可销售量降为当前的20%,引发用户蹲点抢购。但这也许并不是大模型商们的饥饿营销,而是算力突发告急。

涨价潮正在向上游AI算力层蔓延。4月9日,腾讯云公告将于2026年5月9日起进行调价,AI算力相关产品服务费用上调5%;容器服务TKE-原生节点相关产品服务费用上调5%;弹性MapReduce(EMR)相关产品服务费用上调5%。

当前涨价潮首先是短期需求拥挤效应的体现。当一项技术被验证具备大规模商用潜力时,资本往往在短期内加速涌入。然而,AI芯片(GPU、内存等)生产工艺门槛极高,产能高度集中于少数几家企业,无法在短期内增加竞争者,从而在陡峭的需求曲线与刚性供给之间形成巨大的“价格剪刀差”。

随着算力扩张逐步推进,供需关系终将趋于再平衡。但在短期内,这种格局或将挤压消费电子产能,大幅抬升其制造成本,并抑制消费端换机(手机、个人电脑等)需求,导致消费电子市场总量面临收缩压力。

更深层次看,此次涨价潮折射出AI时代产业结构的“垄断性”特征。回顾以手机、电脑为核心的消费电子与互联网时代,其上游供应链涉及众多企业,整机制造、品牌、渠道、运营商等中下游环节吸纳了大量就业,并催生出规模庞大的应用开发者群体。加之消费者换机周期较短,全球每年出货量高达数十亿台,产业链的广度与长度共同释放出巨大的乘数效应,使其成为拉动经济增长的支柱性产业。

而AI算力则呈现出截然不同的资本驱动型特征。其上游硬件集中于英伟达、三星、SK海力士、台积电等少数头部企业;算力服务则主要由微软、谷歌、Meta、亚马逊、阿里、字节等科技巨头提供。这意味着,未来这些服务商有能力掌握较强的定价权。与消费电子产业相比,AI算力产业具有“少数巨头主导、产业链短且高度集中”的特点,对经济总量和就业的直接拉动作用相对有限。

从经济效果看,AI的价值主要通过下游应用向生产部门传导,体现为效率提升与创新能力的增强。然而,需关注AI的“创造性破坏”对就业市场的影响。避免造成使用AI的企业及其算力提供商获取超额红利,虽带来经济总量的增长,但分配差距却出现加大的后果。

来源:羊城晚报

作者声明:作品含AI生成内容

本文转自网络,相关版权归原作者所有。如涉及作品内容、版权及其他问题,请及时联系我们进行处理。 联系邮箱:2465845211@qq.com