Agent AI时代CPU需求爆炸, 是不是被忽悠了的说法?

Intel、AMD 现在都在吹 “Agent AI 会带来 CPU 爆炸需求”,但认真想想有点不对劲。

Agent workflow 里 CPU 干的基本是:

  • 解析 JSON
  • 调工具
  • 发 API
  • 拼字符串

大部分时间其实都在:

  • 等网络
  • 等 GPU
  • 等数据库

这是典型 I/O bound workload,不是 compute bound。

真正吃算力的是:

  • LLM inference
  • embedding
  • vector search

这些都在 GPU 上。

而且 async/event-driven 这种东西,Node.js、asyncio 十几年前就解决了。一颗 CPU 核心挂几千个协程很正常。
这是典型的 I/O bound workload,CPU大部分时间在空转等网络、等GPU、等数据库。这是服务器里CPU负载最轻的一类任务之一。
全球数据中心服务器CPU平均利用率长期在20-40%。这些CPU已经在高速网络里,已经配了大内存带宽,已经跟GPU在同一个机房。

所以我一直没太明白:
为什么 Agent 增长一定意味着 CPU 要超级周期?

更像是 AI server 总量增长带来的自然需求增长,而不是 Agent 本身突然把 CPU 变成瓶颈。真正紧张的还是 GPU、HBM、网络、电力。

CPU在整个链条里是胶水角色 ,不是主力计算。

17 个赞

是的,我也发过帖子

8 个赞

貌似inference可以用cpu节约成本

是啊,花街向来不懂技术,amd intc arm业绩增长是有的但不像gpu 光 内存这么炸裂,还能炒只能说花街没活了

3 个赞

offloading是gpu mem不够用才会上的,cpu推理速度怎么样不说,光是weight通信占用的io就慢到你崩溃了

3 个赞

cpu inference延迟太高了,不现实的。只适合个人用户

1 个赞

唯一一次因为CPU升级电脑是为了玩p社游戏,毕竟一核有难八核围观 :troll:

4 个赞

确实,但我还是买了intel,毕竟虽然我觉得技术上说不过去,但奈何人华尔街说的算

4 个赞

厉害,我算是踏空了cpu这一波,没仓位分配了,我总觉得光和内存是更好的选择没想到cpu能炒成这样

1 个赞

是的, 我也觉得情绪面大于一切

虽然是文字游戏,但也不是只靠总量。LPDDR、DPU、NIC、LPU、NAND、Switch这些都需要CPU。不能只看单个服务器,胶水也可以需要很多,当然你说卖不上价格那是对的。

update:或者未来技术走向也可以不听CEO的,听潭友的。

1 个赞

真假不知道,但现在intel的cpu卖空了是真的

就agent这个需求 来炒cpu的确是扯淡 agent能有多少cpu需求 就调用api能花多少cpu cycle

我觉得是纯扯淡 但是炒作脱离实际很正常 能做到不踏空的唯有定投大盘 任何炒作都能吃到

只要别老去看赌棍的ytd炫耀贴 做好自己的就好了

我intc拿到100出头点就卖了 钱roll进QQQ

8 个赞

集成显卡累死累活 四舍五入cpu出力 :troll:

Intel的故事是美国芯片制造不是CPU

8 个赞

我理解agent AI 时代 serial computing 变得更多更重要,而不是全部都是parallel computing. 所以single thread is more important than multi thread

而且 假如是small size 的parallel computing workload,在cpu上直接跑,比起调用gpu的延时来说更快。 现在的CPU 也在不断加强自己的并行计算能力,所以以后会有越来越多的推理直接跑在cpu上

现在是大炼钢铁时期,很多说法都一阵一阵的,关于AI的很多东西感觉要多年后才能看清准确的评判啊

7 个赞

我也这么觉得。inference的batching应该还是跑在gpu 上快且节能吧 :joy:

ai的事 不用搞的那么清楚

利好IBM?Z的IO优势?