新闻资讯

News

“创业说”对话天数智芯郑金山:坚持全流程自主研发通用GPU,价值更在于未来

2021-10-13

芯片是驱动科技发展和产业升级的发动机。随着全球竞争日益加剧,当下许多国家都纷纷投入重金在芯片研发与制造领域,并将其相关技术视作绝对竞争力。

GPGPU(General-Purpose Computing on Graphics Processing Units)又称通用GPU或通用图形处理器,是一种利用GPU处理图形渲染之外通用计算任务的高性能芯片。因其强大的并行处理能力和存储带宽,GPGPU在人工智能市场和高性能市场有广阔的应用空间。

在这个几乎被国外巨头控场的领域,鲜有能与其相提并论的玩家。而在2021年以前,中国企业虽然一些专用芯片领域多有突破,但在GPGPU领域仍却是空白。

这一局面终于在今年被改写。一季度,上海天数智芯半导体有限公司(简称天数智芯)自研的一款7纳米GPGPU(通用图形处理器)芯片产品卡——BI成功发布,这是中国第一款全自研且有产品面世的GPGPU的芯片。

对天数智芯的投资是大钲资本敢于下重注、用投资驱动变革的最好注脚。大钲资本于2019年首次投资天数智芯,今年再次加码。两年来,大钲资本见证了这款云端训练产品BI的投片、流片、回片及成功点亮、发布的过程。

本期《创业说》摘取和天数智芯首席科学家郑金山数次对话中的精华,为读者展示这款帮助中国实现零的突破的产品背后的情怀和故事。

- 对话郑金山 -

大钲资本创业说:在已经有英伟达、英特尔等巨头的GPU赛道上,为什么还想要做GPU?

郑金山:纵观整个IT系统,从CPU、操作系统、办公套件、整机到服务器,我们都已经初步具有一些商用化的可替代产品。唯独在GPGPU领域,目前还是一片空白。然而,GPGPU在中国的未来需求量很大,对国民经济的发展至关重要。

对于天数智芯来说,我们深知“开发中国自己的GPGPU产品”是一个具有极高难度的目标,但我们有幸汇聚了一群有梦想、有抱负又有能力的有识之士,建立了一支完整覆盖了GPGPU产品前后端软硬件的研发设计并深谙实现产品商业化闭环的团队。最近,我们还接连迎来刁石京董事长和吕坚平博士的加入,这对我们团队是极大的鼓舞。

我们过去积累了深厚的经验。现在恰逢中国经济实力增长、下决心发展半导体产业的良好时机,大家希望抓住这一机遇,一显身手,为中国半导体产业发展做出一份贡献。

大钲资本创业说从技术路线上,天数智芯有什么核心差异?

郑金山:GPU在工业领域的应用需求是很大的,但更大的市场在AI领域。从AI应用角度看,传统GPU的很多功能其实是不需要的。因此我们在设计GPU时,从专用和AI方面进行了特殊的优化,可以设计出面积更小、性能更高的GPU芯片,使得这款产品在技术和应用方面更具有竞争力。

我们的芯片从架构的第一天开始就立足于通用计算,主要用于云端计算的,包括科学计算、大数据相关应用等。

大钲资本创业说相比可以执行AI算法有特定功能的ASIC芯片和可编程的FPGA芯片,天数智芯为什么选择从GPU来切入呢?在你看来,这条路未来的空间会有多大?

郑金山:GPGPU目前广泛应用于高性能计算、行业AI应用、安防与政府项目、互联网及云数据中心等。不难看出,GPGPU在中国的未来需求量很大,对国民经济的发展至关重要。

从现在市场格局来看,GPGPU的需求是远大于供给的。在云端的市场里,一个产品从研发出来到部署,至少是五年以上的时间。大部分云端还是用GPGPU的方式来做AI的。

我认为通用计算这个主要的方向,在未来很长的阶段应该不会有大的变化。此外,由于高性能计算是国之重器,从自主可控的角度来说,我们也需要有中国企业在这个领域有所积淀。

近年来我们看到很多创业公司都发力AI芯片,特别是在ASIC和FPGA领域。这是不同公司的根据自身资源条件和对行业的判断而做出的选择。在我看来,这都是推动中国芯片产业一步步发展的力量。

在这个过程中,大家可能迫于各种各样的原因,必须在短期内交付一些成果,比如有一个产品上市,去把初始的投资先收回来,才能继续下一轮的融资或者发展,因此会做一些短期的考虑。但是天数智芯不太有这样的顾虑,我们希望在技术上多一些积淀,哪怕慢一些也要坚持自主研发。

2021年3月31日,天数智芯正式发布7纳米云端训练BI芯片产品卡,实现国产高性能GPGPU历史上的突破。

大钲资本创业说天数智芯最大的不同是什么?

郑金山:最大的不同还是在于团队吧。我们团队于2018年组建,主要是来自各大国际巨头芯片公司和软件公司。我们的团队在芯片设计领域有着数十年的经验。

可以说,这是一支在世界范围内都不可多得的、完善的高端芯片设计队伍。

基于我们工业界的背景和实战经验,我们希望把整个芯片的细节,从架构、设计、到最后量产,都做扎实,让客户满意。我们希望通过兢兢业业的努力,能让芯片成功商用,为GPGPU的国产化贡献自己的力量。

大钲资本创业说芯片研发需要高精尖人才的合作,天数智芯目前的人才招揽和建设如何,有何挑战?

郑金山:正如你所言,芯片研发需要高精尖人才的合作。我们做出来一款成功的芯片靠的是整个团队,要靠我们整个工程师团队。

天数智芯虽然目前取得了一些成绩,但我们非常清醒地认识到,未来的路还很长,希望能够团结更多顶尖人才一起努力。

大钲资本创业说在芯片领域最近经常提到两个关键词“弯道超车和国产替代”,你怎么看待这两种论点?

郑金山:弯道超车是说一个技术代替另外一个技术,我们叫disruptive innovation(颠覆式创新),比如说数字相机代替胶卷,比如说半导体技术突然间出现新的一个技术把以前那套东西整个推翻,把此前的关键东西给打掉。否则的话,没有办法,就老老实实去追,没有捷径,就是这样的。

第二个国产替代,或者说自主替代,这个当然是很重要。自主替代我觉得最核心的一点是,这不单纯是出于情怀需求,即便考虑经济因素我们也需要这样做,因为如果我们没有自给能力,我们的价钱一定会被压的很惨。

当初为什么AMD在最糟糕的时候还能生存下去?因为所有的供货商都知道如果AMD倒掉,业内只剩下一家独大的时候大家会更惨,大家不希望一家垄断。

我们自己有和没有此类产品,差别是非常大的。有了替代品,即便和对方差距,低一个档次,但对方也会有所顾虑,会担心失去一部分市场,因此中国企业就拥有更多话语权。这是市场规律。

大钲资本创业说从创业到现在,能想起来自己印象特别深的故事吗?

郑金山:我不是一个擅长讲故事的人,我们做产品的,做技术的,就是典型的工程师思维。我们按部就班去做事情,并且每一步的标准都非常具体、非常严格。实际上很多人会觉得这样的生活挺枯燥的。

但我们却充满热忱。因为我们是从零在打造一款产品,每个细节都很重要。实际上我们走到今天这一步,是相当不容易。

经过团队的努力,我们非常欣慰地看到我们首款7nmGPGPU云端计算芯片和产品卡BI成功发布,这极大提振了团队士气,我们对后面的产品信心度蛮高的。

大钲资本创业说从确立研发方向到首款国产首款自研GPGPU芯片面世,天数智芯付出了3年多时间,主要的难点在哪里?

郑金山:我觉得做半导体这个行业,本身是很严肃的一件事情。前面少做什么,后面一定会补回来,而且届时可能代价比之前还高。

芯片设计和做互联网创新不一样,互联网可以一边试错一边推进,但是做芯片设计如果一开始没有想好,其后再推倒重来成本就太高了,尤其是做高端芯片。

业界的流片行情是大公司的一次成本约为1000万美金,而创业公司一次流片要高达1500万美金到2000万美金之间。

因此,天数智芯花了很多时间去打基础。我们如果只追求短期要出一个产品,也许可以获得短期收益,但可能不利于长远的发展。虽然我们前面花了很多时间,但有了基础后,我们再做第二颗、第三颗芯片就会快很多。但是在第一颗芯片上,我们所有的流程都要走一遍、蹚一遍,这时候小心谨慎是比追求速度更重要的。

第二个我们投入时间比较多的地方就是坚持自主可控。如果什么东西都是外包,或者都出去拿授权,这样做的话产品可能很快就出来了,但下一步再往下优化、研发就会出大问题。

所以,我们坚持自己写代码、做设计,我们整个芯片的实现,从前端到后端,包括流程都是我们自己去建,这个在一般的创业公司里面其实是比较少见的。

当然,在这个过程中,我们也得到了投资人,特别是大钲资本的理解和支持。他们不仅提供资金,还帮助我们招揽人才,对接市场。我们的共识是,自主可控的价值在于未来,而不在于现在。这是我个人觉得最值得投入精力的地方。

大钲资本创业说天数智芯的愿景和目标是什么?

郑金山:天数智芯推出的GPGPU芯片,实现了国产领域零的突破。这款芯片采用7nm工艺,由台积电代工,采用了2.5DCoWoS封装技术,有240亿晶体管,单芯每秒可进行147万亿次FP16计算,每秒可完成上百路摄像头视频通道的人工智能处理,性能达市场主流产品的两倍。我们是非常自豪的。

但是,我们又十分清醒。中国芯片产业的发展只是起步,这款芯片的面世也只是公司发展的起点。

我们拥有一支一流的数字集成电路设计与基础软件团队,一批行业经验超过20年的世界级技术专家,也有一大批高执行力5-15年业界经验的技术精英,我们来到天数智芯都是心怀梦想的。

往小了说,我们的追求很简单,就是做出成功的产品,能够解业界之困。往大了说,我们期望,通过共同的努力,把天数智芯打造成中国第一、全球领先的全自研高端GPGPU大芯片及算力系统提供商、具备可持续商业模式和竞争优势的行业领袖,创造长期的社会价值,真正驱动国产AI芯片行业的变革。