国产GPU“王炸”，厂商一口气拿下400万颗芯片，但追赶英伟达不那么容易

发布时间：2021-06-07

阅读量：999

相较于CPU，GPU专利壁垒高，开发难度更大，因此总体上国产GPU的发展落后于国产CPU。记得在几年前盛传的一张国产芯片自给率的列表令大众震惊于国产CPU的份额之低。这几年国产CPU也确实得到了大力发展。那么，近两年我们明显看到国产GPU已经启动加速，力图补足这一芯片短板。

景嘉微GPU营收：2021年Q1同比增长1029.62%

景嘉微的最新财报显示，公司2021年第一季度实现营业收入21,237.41万元，较上年同期增长79.92%，主要原因是公司芯片领域产品较上年同期增长1029.62%，销售大幅度增长。公司实现的归属于上市公司股东的净利润4885.82万元，较上年同期增长91.82%。

据浙商证券资料，2020年12月至2021年1月景嘉微芯片委托制造金额合计约3.89亿元，对应近400万颗芯片，预计绝大部分收入将在年内确认，全年有望贡献营收6亿元以上。

我们再看景嘉微2020年实现营业收入65,377.21万元。其中芯片领域产品营收为7200万元。若芯片产品在2021年能达到6亿元营收，那么2021年景嘉微的营业收入将大幅增长。

这样的表现不仅对于景嘉微，对于国产GPU来说都是很好的预期。
在图形处理芯片领域，景嘉微成功研发了多款具有自主知识产权的图形处理芯片，共分为三代。

第一代，JM5400。2015年推出，JM5400 采用全新的架构设计，基于 65nm CMOS 工艺实现，可广泛应用于有高可靠性要求的图形生成及显示等领域。JM5400 能够高效完成 2D、3D 的图形加速功能，提供了多种丰富的外设接口，在芯片上集成了 1GB 的 DDR3 存储器，支持两路多种格式的外视频在图形上进行开窗、缩放、旋转以及叠加显示。提供符合 OpenGL 规范的驱动程序，全面支持国产CPU和国产操作系统。

第二代，2018年8月成功研发JM7200。JM7200在产品性能和工艺设计上较第一代图形处理芯片JM5400有较大的提升。JM7200已完成与国内主要的CPU和操作系统厂商的适配工作，与长城、联想、同方等十余家国内主要计算机整机厂商建立合作关系并进行产品测试，与苍穹、超图、昆仑、中科方德、中科可控等多家软硬件厂商进行互相认证，共同构建国产化计算机应用生态。
此次，大规模出货的也正是这颗JM7200GPU。未来将进一步大力开展适配与市场推广工作，不断扩大其在通用市场的应用领域。
第三代，景嘉微下一代图形处理芯片目前正按计划开展研发工作，目前已初步完成后端设计工作。消息称，它可能是一颗7nm工艺的GPU。
实际上，自去年以来信创市场的需求爆发，对于国产芯片、操作系统等的导入极大推动了相关软硬件企业的高增长。此前，笔者发布过国产CPU的相关报道，做了相应的市场分析。显然，这一推动力也惠及国产GPU厂商。

国产GPU最新进展，追赶英伟达，找差距中前进

根据Jon Peddie Research的数据显示，截至2020年第四季度，在集成GPU领域中，Intel凭借稳定的供应链占据了69%的市场份额，AMD和NVIDIA分别以17%和15%的市场份额名列第二和第三；在独立GPU领域中，NVIDIA 占据82%的市场份额拥有绝对优势，AMD以18%的市场份额排名第二。
对于国产GPU而言我们要追赶的正是国际巨头，这其中有两大方向，一是面向图形处理的GPU芯片，厂商包括景嘉微、芯动科技、兆芯等。另一类是面向通用计算的GPGPU芯片，厂商包括天数智芯、壁仞科技等。此外，我们在GPU IP方面还有Imagination、芯原股份等公司。这些公司都在各环节推进国产GPU向前发展。
图形处理GPU
首先看图形处理GPU，目前景嘉微最新一代GPU还未正式公布，不过消息称会是两款JM9系列芯片，分别采用7nm和14nm制程，其中7nm芯片产品的性能将到达到英伟达中端GPU水平。
下图比较的GTX1080，是英伟达在2016年发布的旗舰显卡。采用帕斯卡（Pascal）、16nm FinFET制程，GeForce GTX1080拥有2560个CUDA处理器，核心频率1607MHz，boost频率1733MHz，等效显存频率10GHz。显卡位宽为256bit，带宽320GB/s。公版显卡最高温度94℃，采用单8pin供电，TDP180w。

兆芯作为国产X86架构处理器厂商，同时掌握中央处理器、图形处理器、芯片组三大核心技术，具备相关IP自主设计研发的能力。公开报道称其独立GPU将采用台积电28nm制程。

芯动科技的GPU芯片走得比较前沿，他们在去年10月推出了采用 Imagination IMG B系列BXT高性能多核图形处理器（GPU）IP的独立GPU，这是一款高性能4K/8K图形 PCI-E Gen4 GPU独立显卡芯片，将为未来5G云游戏和数据中心应用提供强大的支持。这款芯片的工艺应该是7nm。
而芯动科技也是对标英伟达，芯动科技高管表示，目前公司的GPU架构比英伟达的图灵架构好，但相比其新推出的安培架构还有一些差距。
我们国产图形处理器GPU在桌面端随着景嘉微的大规模出货取得了进展，在数据中心端芯动科技的技术和产品也有能力冲击这一类市场。
通用计算GPGPU
再看通用计算GPGPU芯片，目前进展比较快的当属天数智芯，今年3月，天数智芯发布全自研高性能云端7纳米芯片BI及产品卡。BI是国内第一款全自研、真正基于通用GPU架构的GPGPU云端高端训练芯片，采用业界领先的7纳米制造工艺、2.5D CoWoS封装，容纳240亿晶体管，支持FP32、FP/BF16、INT32/16/8等多精度数据混合训练，集成32GB HBM2内存、存储带宽达1.2TB，单芯每秒可进行147万亿次FP16计算（147TFLOPS@FP16）。

BI芯片及产品卡均以实体形式发布，即将进入批量生产和商用交付，产品开发和商业应用进度领先国内同行1-2年时间。

天数智芯高管对电子发烧友网表示，近年兴起的AI浪潮中，GPGPU对于用传统语言编写的、软件形式的计算有较好的支持，具有高度的灵活性等这些特点，使其成为了一项炙手可热的技术产品。跟ASIC芯片相比，GPGPU具有更广泛的适用性、兼容性、灵活性，对技术变化的包容和适应能力更为突出，产品的应用生命周期更长。同时，通过性能挖掘优化，达成性能、能耗和性价比的最优解，实现跟ASIC芯片相当的算力和能耗水平。

早前，天数智芯首席科学家郑金山曾表示，“国际领先厂商GPU里是有图形渲染的，在芯片上大约占30%，但是图形渲染对于AI和数据中心完全没有用。所以这一块我们直接取消掉。”或许这就是GPGPU在数据中心和AI市场的机会所在。

壁仞科技也是专注GPGPU芯片研发的初创企业，成立于2019年，致力于开发原创性的通用计算体系，建立高效的软硬件平台，同时在智能计算领域提供一体化的解决方案。从发展路径上，壁仞科技将首先聚焦云端通用智能计算，逐步在人工智能训练和推理、图形渲染等多个领域赶超现有解决方案，实现国产高端通用智能计算芯片的突破。短短两年间已完成B轮融资，累计融资额超47亿元人民币。

业内人士表示，GPU芯片的研发比一般芯片难度大，研发成本高，先进工艺的芯片投片花费巨大，少则几亿多则十亿元以上，因此整个国产GPU芯片无论是融资还是投入都是相对较高的。从技术角度看，用于图像渲染的GPU设计相对更加复杂，不仅是GPU架构上，还在接口速率、带宽、存储以及先进封装如Chiplet等方面，考验芯片厂商的设计能力。而GPGPU针对AI训练或推理场景采用一定的算力和算法，能够更有针对性地发展计算性能。
小结：
在GPU领域业界常说，英伟达的成功并不仅是它的GPU芯片，更重要的是它的软件生态，因为其构建的强大生态，即便它的芯片或方案更贵，也仍然得到用户的购买。而这样的生态体系，令许多GPU或AI芯片公司望尘莫及。当然，在国内我们的桌面处理器生态系统正在建设，厂商们主动积极地将CPU、GPU与操作系统、应用软件进行广泛适配。另一个突围的机会则是国产GPU芯片厂商与客户充分沟通从定制功能、降低成本的角度切入到客户的需求当中。