强强联合,DeepSeek第一时间适配华为昇腾芯片,共建中国AI生态

今年 4 月份，DeepSeek V4 正式发布。全球 AI 圈的目光却不在它的万亿参数上，而是它做了件让硅谷沉默的事：DeepSeek 首次把华为昇腾 NPU 和英伟达 GPU 并列写入同一份官方硬件验证清单，底层代码从英伟达 CUDA 全面迁移到了华为 CANN 框架，前后适配花了数周时间。

这件事的含金量，黄仁勋比任何人都清楚。V4 发布前他就公开说过：" 如果 DeepSeek 最新大模型率先在华为芯片上发布，对英伟达将是灾难性的。"

他的担忧事出有因。华为昇腾工程师在 V4 发布前数周就提前拿到了 DeepSeek 的底层代码，直接在实验室里协同调试。发布当天，华为昇腾超节点全系列就完成了首发适配，高吞吐、低延迟的推理部署一战告捷。

随后短短几天内，寒武纪、海光信息、摩尔线程、沐曦股份等共 8 家国产芯片品牌集体宣布完成对 DeepSeek V4 的同步适配。这不是一次常规的技术合作，是国产大模型第一次在国产芯片上完成从训练到推理的全栈跑通，从根本上证实了万亿参数模型在纯国产算力架构下落地的可行性。

所以问题是：DeepSeek 为什么非要冒这个险，而且是第一时间？

01 DeepSeek 的算盘：从 " 能买到什么 " 到 " 敢用什么 "

很多人觉得 DeepSeek 选华为是被迫的——美国芯片禁令收紧，高端 GPU 进不来，只能退而求其次。这个解释没错，但远远不够。

DeepSeek V4 发布前，英伟达 CEO 黄仁勋亲口承认了一个极其扎心的数字：英伟达在中国 AI 加速器市场的份额已降至零。从曾占据中国云服务商绝大多数训练与推理芯片供应到完全归零，只用了不到 18 个月。不是中国企业不想买，是华盛顿不让卖，阉割版 H20 性能被砍一刀，附带条件苛刻——每笔交易还得把 25% 销售收入上缴美国政府。

对 DeepSeek 来说，继续绑在英伟达这条随时可能被掐断的供应链上，意味着下一次禁令收紧时模型迭代就得停摆。华为昇腾不仅能稳定供货——即便产能已被阿里、字节、腾讯排队疯抢，华为仍然确保了对 DeepSeek 的优先适配资源，而且华为高层事后放话 " 只要 DeepSeek 需要，我们会优先保证他们的算力供应 "。选择华为，首先是一道供应链生存题。

但更深层的逻辑藏在成本公式里。据测试数据，DeepSeek V4 在昇腾 950PR 上的推理速度较初期版本提升 35 倍，能耗降低 40%，单卡推理性能达到英伟达特供版 H20 的 2.87 倍。同期中国 AI 大模型 API 价格已降至每百万 token 约 0.28 美元，对比海外竞品高达 15 美元，成本优势高达 50 倍以上。在 AI 产业从 " 训练为王 " 切换到 " 推理为重 " 的 2026 年，推理成本已经成为决定大模型生死的关键变量——模型再强，跑一次推理的价格不能比对手高，而华为昇腾正是在性价比这个维度上给了 DeepSeek 打价格战的底气。

02 华为的算盘：从 " 有人买吗 " 到 " 先让 DeepSeek 跑起来 "

华为比 DeepSeek 更迫切需要这次合作。

2025 年华为昇腾全年 AI 芯片出货量约 81.2 万颗，贡献了国产总出货量近五成的份额；2026 年计划出货约 75 万颗昇腾 950PR 芯片。字节跳动一家就锁了约 25 万颗，阿里锁了 15 万颗，合计金额高达 475 亿元。但订单排队归排队，华为最缺的不是订单，是 " 标杆 "。

过去国产芯片最大的尴尬是 " 造出来了没人敢用 "。大模型厂商的顾虑非常现实：英伟达 CUDA 生态上有数百万开发者、上千预训练模型，出了任何问题都有成熟的技术社区兜底；用华为 CANN 框架，出了问题只能跟华为自己的工程师死磕。迁移成本和技术风险，让绝大多数企业选择观望。

DeepSeek 就是华为一直在等的那个 " 破局者 "。当中国最顶尖的大模型不再把华为当备胎、而是当成首发平台时，它释放的信号比任何技术白皮书都更强烈：这条技术路线是通的。DeepSeek 前脚适配，后脚阿里云、腾讯云、百度智能云、三大运营商——全部宣布与华为昇腾云服务全面合作。华为 CANN 框架实现超 95% 的 CUDA 代码兼容性，新模型迁移适配最短只需 6 小时。而华为拒绝 " 模仿 CUDA" 的技术选择——坚持走自己的底层指令集路线——在这一刻显露出战略远见：仿一个 CUDA 只能当替代品，建自己的生态才能做主选。

03 八家国产芯片集体适配之后：从单点突破到生态联盟

更耐人寻味的是 DeepSeek 的态度。

V4 适配绝非 " 华为专属 "。发布首日，寒武纪、海光信息、摩尔线程、沐曦股份等 8 家国产芯片品牌全部完成同步适配，模型发布即适配上线，芯片厂商不再需要调试周期。DeepSeek 的站位非常清晰：适配华为不是终点，而是中国 AI 产业走向 " 开放多芯 " 生态的起点。

DeepSeek 总部所在地杭州拱墅区，已率先提出要建 " 开源生态先导区 "，围绕 DeepSeek 打造国产芯片适配与模型开源的试验基地。与此同时，上海 AI 实验室基于 DeepLink 框架，已在同一架构下实现华为昇腾、沐曦、阿里平头哥、壁仞四大国产芯片的混合算力调度，让不同架构的 AI 芯片在同一任务中协同推理成为现实。

当八家国产芯片在同一个开源大模型上完成同一水平线的适配，当不同厂商的算力资源能够被统一编排、统一调度、统一对外提供服务——这张 " 芯片地图 " 就不再是一个个孤立的硬件，而是一个完整的、有弹性、可替换的计算生态。这恰恰是过去十年英伟达 CUDA 最坚固的护城河——不是某一颗 GPU 有多强，而是你一旦入了 CUDA 的门，就很难再走出去。而现在，中国 AI 产业正在用一套全新的 " 模型定义芯片 " 的逻辑，把护城河从硅谷搬到了自己的家门口。

DeepSeek 适配华为，看似是一次技术切换，实则是中国 AI 产业战略重心从 " 单点替代 " 转向 " 生态共建 " 的分水岭。

过去，中国大模型公司习惯用英伟达芯片、跑在 CUDA 上、对标 OpenAI，本质上是在美国定义的 AI 赛道上跑美国定的规则。DeepSeek 这次做了一件完全不同的事：它率先把国产大模型和国产算力芯片焊接在一起，用行动宣告中国 AI 产业已经不再满足于 " 能用 " 美国技术，而是要建立一套完全自主可控的 " 中国 AI 操作系统 "。

黄仁勋说那是灾难，但对中国 AI 产业而言，这恰恰是一个新时代的开端。当八家国产芯片围绕同一个开源大模型组成联盟，当混合算力调度让不同厂商的芯片协同运转，当从芯片设计、模型训练到商业应用的全链条实现自主闭环。中国 AI 正在做的不是追赶，而是重新定义一场比赛的规则。而 DeepSeek 和华为的这次联手，只是这场重构中落下的第一枚棋子。

宙世代

一起剪

相关标签