英伟达新技术翻车CUDA 生态在万卡集群中暴露调度瓶颈➡️在游戏端争议之外,英伟达在 AI 基础设施领域的底层软件生态也面临严峻的效率拷问。➡️超大规模集群利用率低迷:据外媒披露,马斯克旗下 xAI 团队部署了超过 55 万张英伟达旗舰 GPU 搭建“超节点”算力集群,但内部报告显示其实际利用率仅徘徊在 11% 左右。➡️系统级工程短板:分析指出,问题核心并非 GPU 硬件性能不足,而是英伟达的 CUDA 生态在过去十年主要针对单卡或单机训练优化,尚未做好应对成千上万张卡跨机柜、跨节点毫秒级同步的准备。➡️在超节点场景下,现有方案倾向于“无脑扩容”来弥补调度短板,导致大量算力处于闲置空转状态。这一数据被认为直接冲击了英伟达“算力即正义”的估值逻辑,并为采用系统级协同优化的竞争对手(如华为昇腾集群、Cerebras)提供了切入窗口。 英伟达新技术翻车