近期,英伟达H20芯片重新获得在中国销售的许可,这一消息让整个AI领域再次将目光聚焦于芯片竞争。几乎在同一时间,业内有消息称华为将让昇腾从专用的ASIC路线转回通用GPGPU架构。再加上此前盘古员工爆料,基于昇腾的AI模型训练效果欠佳,即便小模型也还在使用英伟达芯片,这些情况不仅是两大硬件技术路线的较量,更引发了人们对中国AI芯片自主化路径的重新审视。

中国AI芯片如何实现自主化

昇腾到了关键节点:新老架构看似相近,实则差异显著

英伟达CEO黄仁勋此次来华,对中国的华为、小米等企业赞不绝口,这给业内留下了深刻印象。而华为的昇腾作为英伟达H20在AI领域最直接的竞争对手,黄仁勋的夸赞就显得格外耐人寻味,值得深入思考。

那么实际情况到底如何呢?

从底层架构来看,华为昇腾系列芯片采用的是专用ASIC设计,在一些高并发推理任务中有着一定的能效优势。但这条路线和GPU的“通用路线”注定不同,存在的限制也十分突出。

以训练大模型为例,昇腾面临着明显的适配难题。由于ASIC设计天生就依赖特定的算子、调度机制和任务模式,昇腾很难快速应对算法的迭代,这就导致它在处理像基于Transformer这类快速发展的大模型时,表现不尽如人意。而且在进行模型移植时,开发者还得花费大量精力去做算子替换、流程重构等工作,进而延长了开发周期,增加了成本和团队的负担。

更致命的是,昇腾在生态方面存在短板。

虽然华为一直在努力打造MindSpore、CANN等生态组件,但目前和英伟达的CUDA体系相比,还有很大的差距。从框架兼容性、工具链完整性,到社区活跃度和第三方资源,昇腾都处于“非标平台”的尴尬处境。具体到实际应用中,字节跳动、阿里巴巴等中国主要科技公司的报告指出,和英伟达行业标准的CUDA相比,昇腾的神经网络计算架构(CANN)软件平台存在局限性。此外,CANN框架还被反映不够稳定,需要华为的现场工程师来进行代码故障排除等工作。

基于这些情况,我们认为,H20一旦回到市场,对于AI芯片客户来说,无疑是一个“实用且可选择”的明确信号。而在GPU已经成为事实标准的背景下,坚持选择昇腾平台,就相当于选择了一条更狭窄、更昂贵、更缓慢的道路。

重启GPGPU:疑似对旧路线的实际否定

正是在这样的背景下,有消息称华为正尝试把AI芯片转向GPGPU架构,而且可能会支持CUDA指令的中间件兼容。业内普遍认为,这意味着昇腾原有ASIC架构的发展逻辑已经接近瓶颈,重启GPGPU路线,实在是无奈之下的战略转变。

然而,转向GPGPU架构的新路线并不比原来的路线更容易。实际上,从专用芯片(ASIC)切换到通用芯片(GPGPU),本质上是从硬件设计逻辑到软件工具栈的全链条重构,面临着诸多挑战,短期内很难形成可以商用的成熟体系。

众所周知,从硬件架构设计到生态构建,GPGPU的难度要远高于ASIC。原因在于,GPU要实现通用并行处理能力,需要构建复杂的指令集、调度系统、内存一致性机制等,设计难度高,对IP的依赖强,技术壁垒大。而从零开始构建一套能和CUDA功能相媲美的工具链,更是一项需要长期投入的工作,短期内很难实现商用落地。

更关键的是,即便实现了对CUDA指令的兼容,也仍然会面临兼容但不稳定、性能损耗大、适配Bug频繁出现等实际工程问题。在AI芯片市场的竞争中,生态不是“有了就行”,而是要做到“稳定”“广泛”“快速”。

但现实情况是,昇腾原有的生态还没有站稳脚跟,新的生态又面临着难以发展的困境,极有可能陷入“双生态空转”的尴尬局面,这会给用户在选择和应用迁移方面带来极大的挑战。

对手早已领先:以兼容为先的生态战略才是破局之法

如果说上述是华为转向GPGPU架构自身所面临的挑战,那么当我们从整个GPU产业生态的角度进行横向比较时会发现,华为此时转向GPGPU,虽然象征着国内AI芯片路线“回到原点重新出发”,但同时也面临着GPU生态主流们早已远远领先的尴尬。

首先是英伟达的CUDA生态,它不仅在全球AI开发者中成为了事实标准,还在产业层面形成了“平台锁定效应”。从HuggingFace到Meta,从清华智源到阿里、字节,大模型训练几乎都是基于英伟达GPU及其工具链展开的,PyTorch也成为了国内外主流科研与产业并行使用的平台。

其次,国内已经有多家厂商,比如摩尔线程、沐曦、海光等,从一开始就选择了“兼容主流生态”的路线,分别支持PyTorch、ONNX、ROCm,甚至部分CUDA语义,通过中间件来降低开发迁移的门槛。

需要说明的是,这些厂商虽然起步比英伟达晚,但因为“从一开始就兼容”,所以在生态构建方面更具现实性和工程效率。反观华为,如果从头开发GPGPU,即便实现了指令级兼容CUDA,也仍然要面对性能差距、驱动优化、算子库重构等需要漫长周期才能解决的问题,更何况GPU芯片自身的研发复杂度要远高于ASIC。

与此同时,GPU芯片的制造环节高度依赖先进工艺和供应链保障。但当前华为仍然面临着国际制裁,它是否具备全链条的能力还是个未知数。

因此,我们认为,此时用户继续投入使用当前的昇腾平台,已经不再是“支持国产”的合理选择,而是面对现实路径时的迟疑和摇摆。未来的路线注定是“开放、兼容、共建”,而不是单一厂商封闭推进的孤岛生态,该如何选择,答案不言而喻。

最后想说

所谓透过现象看本质,当业内为H20回归中国市场以及华为打算开辟GPGPU新赛道而或喜或忧的时候,我们更应该看到其背后中国AI芯片自主路径所面临的重新选择:是走“自研、封闭、重构”的老路,还是转向“兼容、开放、共建”的新路径?

事实上,一个更现实的问题已经摆在眼前,作为昇腾的用户、开发者与合作伙伴,当原有的ASIC架构路线到达瓶颈,新架构又还没有成熟,而搭上开放式生态快车道的对手们早已远去,前期已经深度捆绑昇腾的他们又该如何抉择?

一切都不用多说。

种种事实让我们可以肯定的是,“兼容并蓄、百花齐放”的生态才是中国AI芯片实现自主化的更好路径。

友情提示

本站部分转载文章,皆来自互联网,仅供参考及分享,并不用于任何商业用途;版权归原作者所有,如涉及作品内容、版权和其他问题,请与本网联系,我们将在第一时间删除内容!

联系邮箱:1042463605@qq.com