MSFT AMZN META GOOG 在 AI Capex 上花的钱,大概永远回不了本了

原因很简单,大家不是不想用 AI 但是没人想用 overpriced 的 AI

美国科技公司应该是 AI Adoption 最有动力的公司了,码农工资高,美国又是人力最高的国家,代码又是 relatively LLM 做得很好的地方,如果有人要被 AI 代替,码农应该是最先被代替的

我们看到了什么呢?码农的生产力确实大幅提高,但是科技公司并没有增收,at best 降了本,然而由于 token 的价格越来越贵,降本的效果也是非常可疑

其实根本的问题在于,码农的成本对于一个 business 的成功,大概是相当不重要的部分;AI 如果只能降本不能增收,那它的上限就很低;更重要的是,很多公司发现了,与其追求更高阶更贵的模型,不如选择便宜点的让码农人肉 harness

如果连码农这个行业,AI 的 ROI 都这么可疑,其它的行业就更不用说了;如果连美国人力成本这么高的地方都这样,世界的其它地方就更不用说了。

更难受的是,Anthropic 和 OpenAI 的高价模型后面,还有追求低价高效的中国模型在追赶,这基本上给了这两家模型公司的售价设置了一个上限,如果你的同效果模型卖的比开放权重模型贵,那对不起,客户就跑了。

早些年 GPU 存储还没有这么涨价的时候,大概率还是能回本的;但是今年的情况我们看到了,半导体公司的财报增长并不是每 $ 买到的算力变便宜了所以 market 变大了,相反从数据中心整体的角度来看这个指标变得更贵了,尤其是今年才开始买的,锁的未来几年的涨价单。

另外我们从几个角度对比一下 dotcom bubble 和现在的 AI 资本开支

指标 Dotcom / Telecom 2000 当前 AI 建设 谁更像“等接盘”
1. 终端需求覆盖率:终端付费 / 上游 capex 约 55-65%;不算 PC 则 17-20% 约 6.8%;只算消费者则 1.7% AI 明显更低
2. 真实买单收入占比:终端收入 / 终端收入+上游建设收入 约 35-40%;不算 PC 则 15-20% 约 6.3%;只算消费者则 1.6% AI 明显更低
3. 循环交易 / vendor financing 占比 broad stack 8-16%;telecom equipment channel 14-26% 已披露硬循环下限 3-5%;若把 OpenAI 大额云/芯片承诺算作融资依赖型需求,约 10-15%+ 两边都有,AI 更不透明
4. capex 回本年限:capex / 终端毛利 约 5-6 年;不算 PC 则 9-11 年 约 21-30 年;只算消费者则 85-120 年 AI 严重更差
5. 融资依赖率 telecom 基建约 60-80% 靠债/外部资金 data center 总 capex 中外部融资约 52%;债/类债约 40% dotcom/telecom 债务更重,但 AI 正在追上
6. 已建产能真实利用 长途光纤产能使用率 ≤2% 物理 GPU 目前未明显闲置;但按终端付费支撑的经济利用率约 15-25%,消费者-only 4-6% dotcom 物理过剩更惨;AI 是经济回本更惨

从产能利用率来说,我们离 bubble burst 应该还很远,但是从资本开支,终端付费意愿等角度上来说,差的也不远了

13 个赞

感觉这很好的解释了为什么更靠近客户的公司最近都是半死不活的状态,真实买单收入占比明显低多了,说白了就是ai落地带来营收还是有距离。反倒是各大厂大举capex买入gpu存储让这些硬件厂商供不应求赚的盆满钵满

4 个赞

对文章的两个基本论点不太认同:

  1. token价格实际上是越来越便宜的,甚至是指数级别的变便宜
  2. 科技行业码农已经高度数字化,所以用ai其实边际效应递减严重,在传统行业金融/医疗/法律,ai创造的roi大的多
9 个赞

Token 价格的下跌主要来自于系统的优化,譬如类似Claude Code等工具对于 KV Cache的高效利用,以及各种 MoE 等稀疏模型的处理。从整个数据中心建设成本来看,去年开工的数据中心每 $ 能买到的物理算力是要比今年多的 - 这是把电力,基建等资源错配导致的成本也考虑进去

1 个赞

1 对用户的纸面价格还是在上涨,但是由于现在争抢客户给了些重置优惠所以等效于没涨或者微跌,但是token背后的成本是飞速上涨的。

2 传统行业直接和软件一样被ai斩杀了,剩下小部分内部的获益有啥用

:yaoming:

1 个赞

不要线性外推! 想下当年宽带速度和价格

3 个赞

所以Apple赢麻了?一点钱也没花在这上面?

1 个赞

什么时候老旧的破烂 h100 能按斤批发?

你说的确实是事实,去年和今年能买到的单位算力相比确实更便宜。只不过是我相信这种线性的成本上涨不太会影响优化带来的指数级效率提升

P100已经不值钱了,所以答案是10年,不算通胀都价格从6000刀跌到了100-200刀。

估计2032年可以在家里组一个机柜的H100,但估计电费会比显卡贵 :troll:

如果AI和内存泡沫破了,估计会更快

不过到了2032年,估计Mac Mini的显卡都有H100水平了

这是没上过班的人么 :yaoming:

别说tech这种轻资产行业了,医疗这种传统行业里,人力成本的管理永远是商业运营最重要的部分

算力硬件的涨价是因为供应链紧张但这是有时间限制的,高额利润率自然会导致扩产和新玩家进场进攻,除了造EUV机器这种全世界就你一家可以不然这种利润率是无法一直维持下去的。但token的价格一定是越来越低,模型和agent系统的效率一定是越来越高的。

2 个赞

别想了,现在开个A100都不一定能排上队 :distorted_face:

你这反驳的没啥道理:

  1. 并没有大规模补贴用户行为的出现,openai推理成本才7.5b,主要花钱是在R&D上
  2. 传统行业会被优化但不会被替代,实体资产,物理服务一时半会还是很难被取代吧

Tech 行业追求的是规模效应,扩展客户的速度要 >> 人力的扩张速度
核心在扩展客户的速度,控制人力速度但是客户不能加速增长,在科技行业尤其是startup 就要判死刑了

growth is everything

2 个赞

你说的问题我觉得在于生产力虽然提高了,但是需求没有变多。所以我对未来的世界非常悲观,ai提高生产力但是并不产生需求,导致大量人失业后,需求进一步下降,迟早将导致经济危机。

2 个赞

就不能生产力大解放,物质大满足,人类迈步进入共产主义吗 :troll:

h100没有nvfp4 :sweat_smile:

那时候可真是老破烂

别骂了,还在用P100做实验呢 :troll:

我觉得出现终产者的概率更高 :yaoming:

把ai换成蒸汽机,你这个观点当年也有。引发金融危机了吗?引发了。最后挺过来并且创造巨大价值了吗?创造了