劳动路
1
Intel、AMD 现在都在吹 “Agent AI 会带来 CPU 爆炸需求”,但认真想想有点不对劲。
Agent workflow 里 CPU 干的基本是:
大部分时间其实都在:
这是典型 I/O bound workload,不是 compute bound。
真正吃算力的是:
- LLM inference
- embedding
- vector search
这些都在 GPU 上。
而且 async/event-driven 这种东西,Node.js、asyncio 十几年前就解决了。一颗 CPU 核心挂几千个协程很正常。
这是典型的 I/O bound workload,CPU大部分时间在空转等网络、等GPU、等数据库。这是服务器里CPU负载最轻的一类任务之一。
全球数据中心服务器CPU平均利用率长期在20-40%。这些CPU已经在高速网络里,已经配了大内存带宽,已经跟GPU在同一个机房。
所以我一直没太明白:
为什么 Agent 增长一定意味着 CPU 要超级周期?
更像是 AI server 总量增长带来的自然需求增长,而不是 Agent 本身突然把 CPU 变成瓶颈。真正紧张的还是 GPU、HBM、网络、电力。
CPU在整个链条里是胶水角色 ,不是主力计算。
17 个赞
是啊,花街向来不懂技术,amd intc arm业绩增长是有的但不像gpu 光 内存这么炸裂,还能炒只能说花街没活了
3 个赞
offloading是gpu mem不够用才会上的,cpu推理速度怎么样不说,光是weight通信占用的io就慢到你崩溃了
3 个赞
cpu inference延迟太高了,不现实的。只适合个人用户
1 个赞
唯一一次因为CPU升级电脑是为了玩p社游戏,毕竟一核有难八核围观 
4 个赞
确实,但我还是买了intel,毕竟虽然我觉得技术上说不过去,但奈何人华尔街说的算
4 个赞
厉害,我算是踏空了cpu这一波,没仓位分配了,我总觉得光和内存是更好的选择没想到cpu能炒成这样
1 个赞
虽然是文字游戏,但也不是只靠总量。LPDDR、DPU、NIC、LPU、NAND、Switch这些都需要CPU。不能只看单个服务器,胶水也可以需要很多,当然你说卖不上价格那是对的。
update:或者未来技术走向也可以不听CEO的,听潭友的。
1 个赞
cxfcxf
13
就agent这个需求 来炒cpu的确是扯淡 agent能有多少cpu需求 就调用api能花多少cpu cycle
我觉得是纯扯淡 但是炒作脱离实际很正常 能做到不踏空的唯有定投大盘 任何炒作都能吃到
只要别老去看赌棍的ytd炫耀贴 做好自己的就好了
我intc拿到100出头点就卖了 钱roll进QQQ
8 个赞
我理解agent AI 时代 serial computing 变得更多更重要,而不是全部都是parallel computing. 所以single thread is more important than multi thread
而且 假如是small size 的parallel computing workload,在cpu上直接跑,比起调用gpu的延时来说更快。 现在的CPU 也在不断加强自己的并行计算能力,所以以后会有越来越多的推理直接跑在cpu上
kc46
17
现在是大炼钢铁时期,很多说法都一阵一阵的,关于AI的很多东西感觉要多年后才能看清准确的评判啊
7 个赞
我也这么觉得。inference的batching应该还是跑在gpu 上快且节能吧 