铭鸿体育资讯网

V4 出来这天,DeepSeek 没开发布会。只发了一份技术报告。封面上印了两行

V4 出来这天,DeepSeek 没开发布会。

只发了一份技术报告。封面上印了两行字:英伟达 GPU,华为昇腾 NPU。

注意这两行字的顺序。这是中国大模型公司第一次,把英伟达和华为放在同一张技术报告的封面上。

更狠的是后面那一句:模型 1.6 万亿参数,100 万 token 上下文,全栈跑通昇腾。

也就是说,这个万亿参数的大模型,可以彻底不依赖英伟达。

先看一组数据,事情就清楚了

去年 5 月,DeepSeek R1 横空出世,硅谷开会研究中国人怎么做到的。一年过去,国际同行进度是这样的:

OpenAI GPT-5 已经迭代到 5.4。 Anthropic Claude 4.7 出了。 Gemini 3.1 Pro 上线了。

DeepSeek 这边呢?V3.2 原地不动。

整整 5 个月没出新模型。同期业内 11 家头部公司平均每 2.8 天发一次迭代。第三方榜单上,V3.2 综合成绩跌到全球第 16,代码生成第 17。

外面已经在传一个判断:DeepSeek 沦为二流了。

这就是题面。

但谁也没想到,沉默 5 个月不是技术不行。是梁文锋自己关了门,干一件比追榜单更难的事。

把 1.6 万亿参数的大模型,从英伟达 CUDA 整套搬到华为昇腾 CANN。

这件事到底有多难?

得讲一点背景,不绕。

你今天用的所有大模型,几乎都跑在英伟达 GPU 上。CUDA 是英伟达自家的开发语言,2007 年到现在,全球几乎所有 AI 工程师都是在 CUDA 生态里长大的。所有快、所有省、所有稳定的诀窍,都沉淀在这套工具链里。

华为昇腾也是 AI 芯片,但它用自己的语言,叫 CANN。

让一个万亿参数模型在英伟达上跑通,已经够难。让同一个万亿参数模型同时在昇腾上跑通,性能不能差太多,相当于让一个写惯了汉语的作家,临时学德语,再把《红楼梦》翻译重写一遍,还要让德国读者觉得好看。

DeepSeek 把这件事做了。技术细节不难懂:

V4 用了 FP4 精度。这个精度,恰好是华为今年 3 月新发布的昇腾 950PR 原生支持的。

MoE 专家权重、稀疏注意力索引器,全部按昇腾的硬件特性设计。

整个工程总共重写了 40 万行算子,全栈架构重做,精度对齐误差控制在 0.5% 以内。

翻译成大白话:DeepSeek 直接给昇腾量身定做了一个万亿参数模型。

代价是 484 天没出新版本。

这 484 天里,GPT、Gemini、Claude 在英伟达上各自把版本号往前推了好几代。DeepSeek 主动把自己最锋利的那把刀放下,去打磨另一把还没开刃的刀。

一道反商业直觉的题

这就有意思了。

按所有商学院的逻辑,企业要先保自己。R1 那波之后,DeepSeek 的局面其实非常硬:

第一,全栈跑在英伟达上,CUDA 用了多少年,所有优化都是熟手。

第二,量化基金幻方做爹,2025 年收益率 56.6%,一年抽五十亿现金不缺钱。

第三,技术口碑天花板,融资排队的人能从知春路排到中关村。

最聪明的选择,是接着按英伟达这条路猛冲。把模型做到全球第一,把品牌做到顶。R2 踩 OpenAI,V4 跨过 Gemini,整个 2026 年的中国 AI 故事可以由 DeepSeek 一个人写。

梁文锋偏偏没这么做。

他选的是反过来。先做生态,再保自己。

为什么?因为他看到一个谁都不愿意承认的真相。

中国 AI 整个行业都在赌一件事:什么时候,国产芯片能跑万亿参数大模型。

这个赌局,谁都不敢押。

万亿参数模型一旦在国产芯片上跑挂,损失的是几亿美元算力账单加半年研发周期。没有哪家公司的 CFO 敢签这个字。阿里不签,字节不签,腾讯不签。

DeepSeek 签了。

签字那个人是梁文锋。注册资本从 10 万元变成 510 万元,他个人持股从 1% 涨到 34%。把身家全压上去,让 V4 同时跑通昇腾和英伟达。

跑通的那一刻,整个游戏的规则变了。

一夜之间,盟友全跟上来了

V4 发布当天,8 家国产 AI 芯片公司同时宣布完成适配。

华为昇腾 950 超节点、寒武纪、海光、燧原、摩尔线程,一个不少。

阿里、字节、百度,都在自己的云上线了 V4。

更扎眼的是后面这条消息:阿里、字节、腾讯已经向华为下单数十万颗昇腾 950PR。

中国 AI 圈很少出现这个画面。平时大家是竞争对手,互相挖人,互相压价。这一次罕见地朝同一个方向使劲。

为什么?

因为 DeepSeek 把那块最难搬的石头,自己一个人搬开了。

万亿参数模型在昇腾上跑通这件事,相当于一份公开的合格证。证书一出,所有国产芯片厂商都可以走同一条技术路径去适配。所有云厂商都敢把国产算力推给客户,因为有 V4 这个标杆站在那里。

英伟达 CEO 黄仁勋去年说过一句话,被反复引用:中国如果让 DeepSeek 这种公司用上华为昇腾,那就是英伟达的灾难。

他没想到这一天来得这么快。

这才是梁文锋真正干的事。

他要的不是榜单第一名的模型。要的是能让国产芯片跑得动的最强模型。

冲榜单,是为自己。把行业抬起来,是给中国 AI 整体蹚雷。

代价是真的

但代价不是嘴上说说。

第一个代价,人才。

V3 模型最重要的贡献者罗福莉,去了小米。 核心研究员郭达雅,去了字节。 多模态核心阮翀、第一代大语言模型核心王炳宣,去了腾讯。

每一个名字,背后都是几百万年薪和股权。DeepSeek 给不出市场最高的价。

第二个代价,市场。

阿里通义千问把 V3 阶段 DeepSeek 占的那部分用户场景,慢慢做了回去。豆包靠字节的流量入口,把日活拉到第一。Kimi 在长上下文这条赛道,已经走在 DeepSeek 前面。

DeepSeek 月活从 1.38 亿涨到 1.60 亿,看起来还在增长,但增长曲线明显平了。

第三个代价,原则。

去年梁文锋斩钉截铁说过:DeepSeek 暂时不融资。

2026 年 4 月 20 日,DeepSeek 被曝寻求百亿美元估值,至少 3 亿美元战略融资。阿里、腾讯都在沟通名单。

永不融资这条铁律,在 V4 出来前一周,破了。

底层原因不复杂。R1 当年训练成本是 587 万美元,V4 单轮训练成本飙到约 5 亿美元。涨了快 100 倍。昇腾这条路要烧的钱,比英伟达多得多。芯片产能不够,工程师要重新培训,工具链要从头建。

幻方那点钱,撑不住一个万亿模型时代的全产业链投入。

梁文锋低头了。

低头的姿势,是为了把整个国产 AI 算力产业链拽起来。

圈内的新评价

V4 发布后,圈内最准的一句评价是这样的:

V4-Pro 比 GPT-5.4、Gemini 3.1 Pro 落后 3 到 6 个月。

3 到 6 个月,听起来不长。在 AI 这个行业,足够把一家公司从第一梯队拉到第二梯队。

落后是梁文锋自己选的。

V4 是不是 DeepSeek 最强的模型?不是。

V4 是不是 2026 年中国 AI 公司最重要的一次发布?我倾向于是。

因为它做的事情,是把整个国产 AI 生态抬起一截,不是把自家排名再往上挪一格。

第一梯队的位置可以再争。算力的底子如果没打牢,争到也站不住。

跟普通人有什么关系

绕了这么大一圈,跟普通人有什么关系?

第一件,AI 应用价格还会接着掉。

V4 把 API 压到每百万 token 0.3 美元。这个价格一出来,国内所有大模型都得跟着降。意味着你以后用的所有 AI 工具,写文档、做翻译、改代码、生成图片,成本都要再低一档。最直接的体感,是各种 AI 会员包月降价。

第二件,国产芯片产业链开始转起来了。

华为昇腾、寒武纪、海光,这些名字以前主要是 A 股投资者关心。现在是真有大模型在用,订单是看得见的。这条产业链上下游几百家公司,包括服务器、内存、散热、电源,都跟着进入新一轮订单周期。

第三件,AI 这件事不再被一根线绑住。

过去三年,业内一直担心一件事:如果美国把英伟达完全断供,中国 AI 是不是要原地停摆。V4 跑通昇腾这件事,把这个最坏假设的概率往下打了一截。还谈不上彻底安全,但至少有了第二条腿。

第四件,离你的工作更近了一步。

价格便宜的大模型,意味着越来越多公司开始把 AI 接入业务流程。客服、文案、设计、初级编程、报表分析,这些岗位被替代的速度只会更快。这不是好消息,但是该提前知道的事。

一句话收束

梁文锋这次的选择,可能让 DeepSeek 在未来一年里看起来不那么耀眼。模型评测榜单上的名次会往下掉,融资估值会被国际同行甩开,明星光环会被分给其他公司。

这都是真实的代价。

但如果两年后回头看,会发现 2026 年 4 月这周,是中国 AI 从「跟在英伟达后面跑」切换到「能靠自己跑」的一个分水岭。

切这一刀的人,是梁文锋。

你觉得他这步棋,赌对了吗?

来源:有知识青年