黄仁勋预言的灾难仅9天就成真DeepSeek V4的划时代战略意义:中国AI芯片与大模型路线图清晰了,美国AI路线末日前景可以看到了
----这个图可能是假的。不过文中的原理是通的。
1. 为什么“一块H200都没买”?
这是美国商务部长卢特尼克说的,在4月22日国会听证会上明确表示:“迄今为止,他们一块芯片也没买。”
说实在的,我有些吃惊。因为算力紧缺是肯定的,特别是用于训练的。一些头部公司据说有购买意愿。
没买,唯一的原因就是国产化路线。昨天DeekSeek V4发布,性能方面不出预料,进步巨大但不算太惊喜,没有原生多模态是个要补的短板。但是,它是国产AI芯片与大模型路线图划时代的进步,局面一下清楚了。
从技术上来说,中国确实不需要花大价钱买一堆限制的H200。也不需要英伟达CUDA系统了,坚定地走自主创新道路,所有条件都具备了。一块都不买,就是最好的决心展示。
如果买,一块H200单卡19万人民币,中国订单很可能超过200亿美元,后续可能更多。现在,这些钱都是华为和其它中国AI芯片公司的潜在收入来源,对自主体系有决定性作用。
2. 基于7nm的AI芯片、基座大模型、大模型应用自主全产业链
但是,摆脱英伟达芯片和CUDA的底气,必须是实打实的技术表现,不能喊口号。DeekSeek V4的发布,最大的战略意义就在这里,它和华为昇腾950深度绑定。
任正非罕见地转发全公司邮件给梁文锋,这事的意义确实有这么大。
Deepseek V4向华为全公司开放,万人先试用了,许多员工说,改变了工作方式。注意这是昨天公布之前,是华为率先内测福利,很可能是跑在华为芯片和架构上。这是大模型应用,华为的人用起来了。
华为昇腾芯片,应该是SMIC 7nm工艺,是ASML的DUV光刻机。即使国产光刻机还没有突破到7nm领域,还在奋战28nm量产,中国AI芯片也有办法发展。
假设SMIC 7nm产能每月7万片,其中2万片给国产AI芯片。每片良率不高只有30%,也有100个活的die,每月有200万块,一年2000万块以上。英伟达卖中国H200也就是百万块规模,就算中国芯片3块顶一块H200,总算力也够了。所以,黄仁勋着急了。
DeepSeek V4是水平足够的基座大模型,和完全国产化的华为AI芯片深度绑定,又能嵌入华为员工的工作流程中。这就是全栈闭环。
中国AI芯片是7nm,和美国基于3-5nm的有性能差距,但是制程差距其实没那么大。用于大模型的GPU,单卡性能不关键,要看系统表现,特别是计算性能重要性大幅下降。数据传输、存储的意义比计算还大,GPU大部分时间在等数据,而不是计算。而并行就是加速的最大武器,不是4nm比7nm强,而是1.6T比800G翻倍。
数据传输需要芯片先进封装,Chiplet技术等等,中国落后得不多。不需要国产光刻机突破,中国自主的AI芯片和大模型也能加速发展了。而且下定了决心,和英伟达说再见。
3. 美国芯片与大模型性能优势不可怕
美国现在完全押宝大模型了,头部公司营收有突破,Anthropic在私下股权转让时估值上万亿美元了。现在国产大模型性能上和美国三家头部还有差距。
但是,不要被这个优势吓到。没有什么物理原理能限制国产大模型追赶、超越。不需要等国产光刻机性能突破,时间已经是我们的,发展脚步没有被卡住。
美国大模型性能优势,无非就是两个基础。一个是算力,一个是应用经验。还需要开发人员,美国AI主要就是靠华人,中国顶尖研发人员数量和水平不会有问题,不够也可以培养,因为算力不足还格外需要想办法。
算力方面,中国会用并行,以及足够的国产GPU组成昇腾950超节点这种架构来解决问题。一年上千万块国产GPU芯片,集中起来算力也不小。
中国还有个绝招,大模型开源。美国一些公司会用美国芯片和服务器,跑中国大模型。这等于是美国算力帮中国大模型抢市场份额。一旦中国开源大模型性能追平、追近,对美国头部大模型公司商业模式就是毁灭性打击。
大模型应用经验,美国领先。但是这无非就是不断用,收集数据和案例不停迭代。中国公司也开始快速迭代了,也会进步。虽然说还有差距,但是没有什么物理规律说美国大模型性能一定领先,时间差距无非就是几个月。一旦美国大模型进入瓶颈期,很快就追上了。
那时,我都敢宣布美国AI路线图完了,巨额投资赚不回来了,被中国开源大模型打死了。这会是美国AI的末日。
