铭鸿体育资讯网

谁能想到,那个搞出DeepSeek的梁文锋,直接把桌子给掀了。 他带人干了件最

谁能想到,那个搞出DeepSeek的梁文锋,直接把桌子给掀了。

他带人干了件最狂的事,花五个月把底层代码全迁到了华为昇腾上,彻底不要英伟达的CUDA了。

难怪黄仁勋在采访里急得直跳脚,连“芯片又不是浓缩铀”这种话都喊出来了。这哪是卖不卖芯片的事,这是咱们自己把路给铺好了,以后不看他们脸色了。

这事儿得从2026年4月底说起。当时DeepSeek V4正式发布,外界都盯着它那百万级的上下文窗口看,可圈内人一眼就瞅见了真正的核弹——发布公告里轻描淡写的那句“全面适配华为昇腾950PR芯片”。

翻译过来就是,中国最顶尖的AI大模型,从今往后训练和推理,再也不需要英伟达的显卡了。

你可能会说,不就是换个芯片吗,有啥大惊小怪的?

这可不是给电脑换个显卡那么简单。这好比给一架正在万米高空飞行的波音客机,把整个发动机系统从美国普惠的,换成咱们国产的太行,还得保证飞机不颠簸、不掉高度、稳稳当当地继续飞。

大模型的底层代码,那动辄上百万行,里边的算子、内存管理、集群通信,每一个螺丝钉都跟英伟达的CUDA生态焊得死死的。

过去十几年,全球AI开发者都活在这个生态里,就像鱼离不开水。

梁文锋带着他平均年龄不到30岁的139人团队,硬是用了五个月,一行一行地把代码从美国标准“翻译”成了中国标准。

最难的还不是重写代码,而是“精度对齐”。简单说,就是必须保证同一个模型,在英伟达GPU上跑出来是什么结果,在华为昇腾芯片上跑出来就得一模一样,分毫不差。

这活儿精细得像在芯片上绣花,差一点,模型就“学歪了”。

为了啃下这块硬骨头,DeepSeek连V4模型的发布都推迟了,就为了确保国产化迁移万无一失。

结果呢?性能不降反升!迁移到昇腾平台后,DeepSeek V4的推理速度最高提升了35倍,训练和推理的综合算力成本直接下降了40%。

以前因为硬件限制没法跑的高级算法,现在全解封了。

这哪是简单地换个零件,这简直是给赛车换了个量身定制的、动力更强的引擎。

这下你明白黄仁勋为啥着急了吧。他那句“芯片又不是浓缩铀”,是在一次播客采访里被主持人逼问时脱口而出的。

当时主持人质问他向中国出售高端芯片是不是等于“卖浓缩铀资敌”,把这位芯片巨头气得连说“荒谬”、“幼稚”。

老黄的憋屈我们懂,英伟达被美国的出口管制政策卡得死死的,特供中国的“阉割版”芯片性能打折不说,研发成本还涨了30%,结果在中国市场的份额从巅峰时的95%暴跌。

他当然想卖,但更让他心惊肉跳的是,像DeepSeek这样的中国顶级玩家,竟然真的能抛开他的CUDA,另起炉灶了。

梁文锋这一“掀桌”,掀掉的不仅是英伟达的技术依赖,更是中国AI头顶上那把“卡脖子”的达摩克利斯之剑。

长期以来,国内AI公司每年都得花天价从英伟达买芯片,还得被动接受各种技术限制和条款,发展的命脉攥在别人手里。

现在DeepSeek用行动证明,离开CUDA,咱们不仅能活,还能活得更好。

更狠的是,DeepSeek宣布把迁移过程中积累的所有技术文档和培训体系全部开源。

这意味着什么?意味着国内几十万AI开发者可以近乎无成本地获取在昇腾平台上开发的经验。

以前那座高不可攀的生态壁垒,现在被炸开了一个大口子。

一个从芯片(昇腾)、框架(CANN)到模型(DeepSeek)的完整国产AI技术链条,第一次在高端领域形成了闭环。

所以,这根本不是一次简单的技术切换,这是一场从根子上开始的“独立宣言”。

它向世界宣告,中国AI的算力底座,正在从“依赖进口”全面转向“自主可控”。

当美国想用芯片当“浓缩铀”一样来封锁我们时,我们的回应是埋头苦干,自己造出一条更宽敞、更自主的新路。

黄仁勋的焦虑,恰恰印证了我们这条路走对了。他担心的不是少卖几块芯片,而是CUDA那个看似固若金汤的生态帝国,出现了第一道深刻的裂痕。

这道裂痕,是一个名叫梁文锋的中国工程师,带着一群年轻人,用五个月时间,一锤一锤凿出来的。

从此,太平洋两岸的AI竞赛,有了另一套完全不同的游戏规则。

而我们,终于拿到了制定规则的一部分权力。这场无声的战役,胜负已现端倪。

参考:DeepSeek华为腾全国产AI 生态突围——中国经营网