V4 出来这天，DeepSeek 没开发布会。只发了一份技术报告。封面上印了两行

V4 出来这天，DeepSeek 没开发布会。

只发了一份技术报告。封面上印了两行字：英伟达 GPU，华为昇腾 NPU。

注意这两行字的顺序。这是中国大模型公司第一次，把英伟达和华为放在同一张技术报告的封面上。

更狠的是后面那一句：模型 1.6 万亿参数，100 万 token 上下文，全栈跑通昇腾。

也就是说，这个万亿参数的大模型，可以彻底不依赖英伟达。

先看一组数据，事情就清楚了

去年 5 月，DeepSeek R1 横空出世，硅谷开会研究中国人怎么做到的。一年过去，国际同行进度是这样的：

OpenAI GPT-5 已经迭代到 5.4。 Anthropic Claude 4.7 出了。 Gemini 3.1 Pro 上线了。

DeepSeek 这边呢？V3.2 原地不动。

整整 5 个月没出新模型。同期业内 11 家头部公司平均每 2.8 天发一次迭代。第三方榜单上，V3.2 综合成绩跌到全球第 16，代码生成第 17。

外面已经在传一个判断：DeepSeek 沦为二流了。

这就是题面。

但谁也没想到，沉默 5 个月不是技术不行。是梁文锋自己关了门，干一件比追榜单更难的事。

把 1.6 万亿参数的大模型，从英伟达 CUDA 整套搬到华为昇腾 CANN。

这件事到底有多难？

得讲一点背景，不绕。

你今天用的所有大模型，几乎都跑在英伟达 GPU 上。CUDA 是英伟达自家的开发语言，2007 年到现在，全球几乎所有 AI 工程师都是在 CUDA 生态里长大的。所有快、所有省、所有稳定的诀窍，都沉淀在这套工具链里。

华为昇腾也是 AI 芯片，但它用自己的语言，叫 CANN。

让一个万亿参数模型在英伟达上跑通，已经够难。让同一个万亿参数模型同时在昇腾上跑通，性能不能差太多，相当于让一个写惯了汉语的作家，临时学德语，再把《红楼梦》翻译重写一遍，还要让德国读者觉得好看。

DeepSeek 把这件事做了。技术细节不难懂：

V4 用了 FP4 精度。这个精度，恰好是华为今年 3 月新发布的昇腾 950PR 原生支持的。

MoE 专家权重、稀疏注意力索引器，全部按昇腾的硬件特性设计。

整个工程总共重写了 40 万行算子，全栈架构重做，精度对齐误差控制在 0.5% 以内。

翻译成大白话：DeepSeek 直接给昇腾量身定做了一个万亿参数模型。

代价是 484 天没出新版本。

这 484 天里，GPT、Gemini、Claude 在英伟达上各自把版本号往前推了好几代。DeepSeek 主动把自己最锋利的那把刀放下，去打磨另一把还没开刃的刀。

一道反商业直觉的题

这就有意思了。

按所有商学院的逻辑，企业要先保自己。R1 那波之后，DeepSeek 的局面其实非常硬：

第一，全栈跑在英伟达上，CUDA 用了多少年，所有优化都是熟手。

第二，量化基金幻方做爹，2025 年收益率 56.6%，一年抽五十亿现金不缺钱。

第三，技术口碑天花板，融资排队的人能从知春路排到中关村。

最聪明的选择，是接着按英伟达这条路猛冲。把模型做到全球第一，把品牌做到顶。R2 踩 OpenAI，V4 跨过 Gemini，整个 2026 年的中国 AI 故事可以由 DeepSeek 一个人写。

梁文锋偏偏没这么做。

他选的是反过来。先做生态，再保自己。

为什么？因为他看到一个谁都不愿意承认的真相。

中国 AI 整个行业都在赌一件事：什么时候，国产芯片能跑万亿参数大模型。

这个赌局，谁都不敢押。

万亿参数模型一旦在国产芯片上跑挂，损失的是几亿美元算力账单加半年研发周期。没有哪家公司的 CFO 敢签这个字。阿里不签，字节不签，腾讯不签。

DeepSeek 签了。

签字那个人是梁文锋。注册资本从 10 万元变成 510 万元，他个人持股从 1% 涨到 34%。把身家全压上去，让 V4 同时跑通昇腾和英伟达。

跑通的那一刻，整个游戏的规则变了。

一夜之间，盟友全跟上来了

V4 发布当天，8 家国产 AI 芯片公司同时宣布完成适配。

华为昇腾 950 超节点、寒武纪、海光、燧原、摩尔线程，一个不少。

阿里、字节、百度，都在自己的云上线了 V4。

更扎眼的是后面这条消息：阿里、字节、腾讯已经向华为下单数十万颗昇腾 950PR。

中国 AI 圈很少出现这个画面。平时大家是竞争对手，互相挖人，互相压价。这一次罕见地朝同一个方向使劲。

为什么？

因为 DeepSeek 把那块最难搬的石头，自己一个人搬开了。

万亿参数模型在昇腾上跑通这件事，相当于一份公开的合格证。证书一出，所有国产芯片厂商都可以走同一条技术路径去适配。所有云厂商都敢把国产算力推给客户，因为有 V4 这个标杆站在那里。

英伟达 CEO 黄仁勋去年说过一句话，被反复引用：中国如果让 DeepSeek 这种公司用上华为昇腾，那就是英伟达的灾难。

他没想到这一天来得这么快。

这才是梁文锋真正干的事。

他要的不是榜单第一名的模型。要的是能让国产芯片跑得动的最强模型。

冲榜单，是为自己。把行业抬起来，是给中国 AI 整体蹚雷。

代价是真的

但代价不是嘴上说说。

第一个代价，人才。

V3 模型最重要的贡献者罗福莉，去了小米。核心研究员郭达雅，去了字节。多模态核心阮翀、第一代大语言模型核心王炳宣，去了腾讯。

每一个名字，背后都是几百万年薪和股权。DeepSeek 给不出市场最高的价。

第二个代价，市场。

阿里通义千问把 V3 阶段 DeepSeek 占的那部分用户场景，慢慢做了回去。豆包靠字节的流量入口，把日活拉到第一。Kimi 在长上下文这条赛道，已经走在 DeepSeek 前面。

DeepSeek 月活从 1.38 亿涨到 1.60 亿，看起来还在增长，但增长曲线明显平了。

第三个代价，原则。

去年梁文锋斩钉截铁说过：DeepSeek 暂时不融资。

2026 年 4 月 20 日，DeepSeek 被曝寻求百亿美元估值，至少 3 亿美元战略融资。阿里、腾讯都在沟通名单。

永不融资这条铁律，在 V4 出来前一周，破了。

底层原因不复杂。R1 当年训练成本是 587 万美元，V4 单轮训练成本飙到约 5 亿美元。涨了快 100 倍。昇腾这条路要烧的钱，比英伟达多得多。芯片产能不够，工程师要重新培训，工具链要从头建。

幻方那点钱，撑不住一个万亿模型时代的全产业链投入。

梁文锋低头了。

低头的姿势，是为了把整个国产 AI 算力产业链拽起来。

圈内的新评价

V4 发布后，圈内最准的一句评价是这样的：

V4-Pro 比 GPT-5.4、Gemini 3.1 Pro 落后 3 到 6 个月。

3 到 6 个月，听起来不长。在 AI 这个行业，足够把一家公司从第一梯队拉到第二梯队。

落后是梁文锋自己选的。

V4 是不是 DeepSeek 最强的模型？不是。

V4 是不是 2026 年中国 AI 公司最重要的一次发布？我倾向于是。

因为它做的事情，是把整个国产 AI 生态抬起一截，不是把自家排名再往上挪一格。

第一梯队的位置可以再争。算力的底子如果没打牢，争到也站不住。

跟普通人有什么关系

绕了这么大一圈，跟普通人有什么关系？

第一件，AI 应用价格还会接着掉。

V4 把 API 压到每百万 token 0.3 美元。这个价格一出来，国内所有大模型都得跟着降。意味着你以后用的所有 AI 工具，写文档、做翻译、改代码、生成图片，成本都要再低一档。最直接的体感，是各种 AI 会员包月降价。

第二件，国产芯片产业链开始转起来了。

华为昇腾、寒武纪、海光，这些名字以前主要是 A 股投资者关心。现在是真有大模型在用，订单是看得见的。这条产业链上下游几百家公司，包括服务器、内存、散热、电源，都跟着进入新一轮订单周期。

第三件，AI 这件事不再被一根线绑住。

过去三年，业内一直担心一件事：如果美国把英伟达完全断供，中国 AI 是不是要原地停摆。V4 跑通昇腾这件事，把这个最坏假设的概率往下打了一截。还谈不上彻底安全，但至少有了第二条腿。

第四件，离你的工作更近了一步。

价格便宜的大模型，意味着越来越多公司开始把 AI 接入业务流程。客服、文案、设计、初级编程、报表分析，这些岗位被替代的速度只会更快。这不是好消息，但是该提前知道的事。

一句话收束

梁文锋这次的选择，可能让 DeepSeek 在未来一年里看起来不那么耀眼。模型评测榜单上的名次会往下掉，融资估值会被国际同行甩开，明星光环会被分给其他公司。

这都是真实的代价。

但如果两年后回头看，会发现 2026 年 4 月这周，是中国 AI 从「跟在英伟达后面跑」切换到「能靠自己跑」的一个分水岭。

切这一刀的人，是梁文锋。

你觉得他这步棋，赌对了吗？

来源：有知识青年

铭鸿体育资讯网

V4 出来这天，DeepSeek 没开发布会。只发了一份技术报告。封面上印了两行

热门分类