今年 4 月份,DeepSeek V4 正式发布。全球 AI 圈的目光却不在它的万亿参数上,而是它做了件让硅谷沉默的事:DeepSeek 首次把华为昇腾 NPU 和英伟达 GPU 并列写入同一份官方硬件验证清单,底层代码从英伟达 CUDA 全面迁移到了华为 CANN 框架,前后适配花了数周时间。
这件事的含金量,黄仁勋比任何人都清楚。V4 发布前他就公开说过:" 如果 DeepSeek 最新大模型率先在华为芯片上发布,对英伟达将是灾难性的。"
他的担忧事出有因。华为昇腾工程师在 V4 发布前数周就提前拿到了 DeepSeek 的底层代码,直接在实验室里协同调试。发布当天,华为昇腾超节点全系列就完成了首发适配,高吞吐、低延迟的推理部署一战告捷。
随后短短几天内,寒武纪、海光信息、摩尔线程、沐曦股份等共 8 家国产芯片品牌集体宣布完成对 DeepSeek V4 的同步适配。这不是一次常规的技术合作,是国产大模型第一次在国产芯片上完成从训练到推理的全栈跑通,从根本上证实了万亿参数模型在纯国产算力架构下落地的可行性。

所以问题是:DeepSeek 为什么非要冒这个险,而且是第一时间?
01 DeepSeek 的算盘:从 " 能买到什么 " 到 " 敢用什么 "
很多人觉得 DeepSeek 选华为是被迫的——美国芯片禁令收紧,高端 GPU 进不来,只能退而求其次。这个解释没错,但远远不够。
DeepSeek V4 发布前,英伟达 CEO 黄仁勋亲口承认了一个极其扎心的数字:英伟达在中国 AI 加速器市场的份额已降至零。从曾占据中国云服务商绝大多数训练与推理芯片供应到完全归零,只用了不到 18 个月。不是中国企业不想买,是华盛顿不让卖,阉割版 H20 性能被砍一刀,附带条件苛刻——每笔交易还得把 25% 销售收入上缴美国政府。
对 DeepSeek 来说,继续绑在英伟达这条随时可能被掐断的供应链上,意味着下一次禁令收紧时模型迭代就得停摆。华为昇腾不仅能稳定供货——即便产能已被阿里、字节、腾讯排队疯抢,华为仍然确保了对 DeepSeek 的优先适配资源,而且华为高层事后放话 " 只要 DeepSeek 需要,我们会优先保证他们的算力供应 "。选择华为,首先是一道供应链生存题。
但更深层的逻辑藏在成本公式里。据测试数据,DeepSeek V4 在昇腾 950PR 上的推理速度较初期版本提升 35 倍,能耗降低 40%,单卡推理性能达到英伟达特供版 H20 的 2.87 倍。同期中国 AI 大模型 API 价格已降至每百万 token 约 0.28 美元,对比海外竞品高达 15 美元,成本优势高达 50 倍以上。在 AI 产业从 " 训练为王 " 切换到 " 推理为重 " 的 2026 年,推理成本已经成为决定大模型生死的关键变量——模型再强,跑一次推理的价格不能比对手高,而华为昇腾正是在性价比这个维度上给了 DeepSeek 打价格战的底气。

02 华为的算盘:从 " 有人买吗 " 到 " 先让 DeepSeek 跑起来 "
华为比 DeepSeek 更迫切需要这次合作。
2025 年华为昇腾全年 AI 芯片出货量约 81.2 万颗,贡献了国产总出货量近五成的份额;2026 年计划出货约 75 万颗昇腾 950PR 芯片。字节跳动一家就锁了约 25 万颗,阿里锁了 15 万颗,合计金额高达 475 亿元。但订单排队归排队,华为最缺的不是订单,是 " 标杆 "。
过去国产芯片最大的尴尬是 " 造出来了没人敢用 "。大模型厂商的顾虑非常现实:英伟达 CUDA 生态上有数百万开发者、上千预训练模型,出了任何问题都有成熟的技术社区兜底;用华为 CANN 框架,出了问题只能跟华为自己的工程师死磕。迁移成本和技术风险,让绝大多数企业选择观望。
DeepSeek 就是华为一直在等的那个 " 破局者 "。当中国最顶尖的大模型不再把华为当备胎、而是当成首发平台时,它释放的信号比任何技术白皮书都更强烈:这条技术路线是通的。DeepSeek 前脚适配,后脚阿里云、腾讯云、百度智能云、三大运营商——全部宣布与华为昇腾云服务全面合作。华为 CANN 框架实现超 95% 的 CUDA 代码兼容性,新模型迁移适配最短只需 6 小时。而华为拒绝 " 模仿 CUDA" 的技术选择——坚持走自己的底层指令集路线——在这一刻显露出战略远见:仿一个 CUDA 只能当替代品,建自己的生态才能做主选。

03 八家国产芯片集体适配之后:从单点突破到生态联盟
更耐人寻味的是 DeepSeek 的态度。
V4 适配绝非 " 华为专属 "。发布首日,寒武纪、海光信息、摩尔线程、沐曦股份等 8 家国产芯片品牌全部完成同步适配,模型发布即适配上线,芯片厂商不再需要调试周期。DeepSeek 的站位非常清晰:适配华为不是终点,而是中国 AI 产业走向 " 开放多芯 " 生态的起点。
DeepSeek 总部所在地杭州拱墅区,已率先提出要建 " 开源生态先导区 ",围绕 DeepSeek 打造国产芯片适配与模型开源的试验基地。与此同时,上海 AI 实验室基于 DeepLink 框架,已在同一架构下实现华为昇腾、沐曦、阿里平头哥、壁仞四大国产芯片的混合算力调度,让不同架构的 AI 芯片在同一任务中协同推理成为现实。
当八家国产芯片在同一个开源大模型上完成同一水平线的适配,当不同厂商的算力资源能够被统一编排、统一调度、统一对外提供服务——这张 " 芯片地图 " 就不再是一个个孤立的硬件,而是一个完整的、有弹性、可替换的计算生态。这恰恰是过去十年英伟达 CUDA 最坚固的护城河——不是某一颗 GPU 有多强,而是你一旦入了 CUDA 的门,就很难再走出去。而现在,中国 AI 产业正在用一套全新的 " 模型定义芯片 " 的逻辑,把护城河从硅谷搬到了自己的家门口。

DeepSeek 适配华为,看似是一次技术切换,实则是中国 AI 产业战略重心从 " 单点替代 " 转向 " 生态共建 " 的分水岭。
过去,中国大模型公司习惯用英伟达芯片、跑在 CUDA 上、对标 OpenAI,本质上是在美国定义的 AI 赛道上跑美国定的规则。DeepSeek 这次做了一件完全不同的事:它率先把国产大模型和国产算力芯片焊接在一起,用行动宣告中国 AI 产业已经不再满足于 " 能用 " 美国技术,而是要建立一套完全自主可控的 " 中国 AI 操作系统 "。
黄仁勋说那是灾难,但对中国 AI 产业而言,这恰恰是一个新时代的开端。当八家国产芯片围绕同一个开源大模型组成联盟,当混合算力调度让不同厂商的芯片协同运转,当从芯片设计、模型训练到商业应用的全链条实现自主闭环。中国 AI 正在做的不是追赶,而是重新定义一场比赛的规则。而 DeepSeek 和华为的这次联手,只是这场重构中落下的第一枚棋子。


登录后才可以发布评论哦
打开小程序可以发布评论哦