发布时间:2025-05-06 点此:311次
来历:中科大胡不归
“我国英伟达”离别2024
作者 亚洲视觉科技研制总监 陈经
修正 郑可君 苏扬
国产芯片规划公司正在阅历冰火两重天——一些公司风景上市,一些公司却不得不走进ICU。
9月12日,国产GPU独角兽壁仞科技进入了上市教导程序,IPO在即。11月11日,音讯称摩尔线程已完结股份制改造,方针科创板上市。作为比照,国产厂商象帝先却被传出闭幕的音讯。
2020年9月,中科院核算机专家唐志敏牵头创建象帝先,进入GPU创业赛道,被外界称之为“我国英伟达”,同年象帝先拿下天使轮融资,并于2023年完结来自14个出资方的3轮融资,随后于2024年成为重庆市独角兽企业,估值150亿元。
针对闭幕风闻,象帝先发文回应称未闭幕、清算,仅仅经过人员优化降低本钱,并且会保存中心研制团队,并且正在活泼与出资者交流,寻觅外部融资。
象帝先对闭幕风闻的回应
一时刻,象帝先为什么会忽然大举缩短,国产GPU创业赛道开端洗牌了吗?这些也成为了国产GPU甚至整个芯片工业需求考虑的问题。
01 “我国英伟达”的战略误判
2014年9月,国家集成电路工业出资基金(简称大基金)建立,一期募资逾越1300亿元,制作与规划都是其时要点的出资方向。在此之前的6月份,《国家集成电路工业开展推进大纲》就现已发布,其间有两个要害方针:
2020年,“集成电路工业与国际先进水准的间隔逐渐缩小,16、14纳米制作工艺完结规划量产”;2030年“集成电路工业链首要环节到达国际先进水准,一批企业进入国际榜首队伍。”
在这一大布景下,国内GPU创业榜首波大潮拉开序幕,芯原微、景嘉微、龙芯等在这一阶段都开端布局相关项目。
不同时期建立的国产GPU创业项目,数据来历:企查查
现在回头来看,最初《大纲》对晶圆代工部分定的KPI其实完结得还不错。
2020年,中芯国际已能够以95%的良率完结14纳米的量产,现在还打破到更先进的节点,不过咱们也要正视问题:先进工艺依旧在不断往前推进,曩昔的先进工艺,将来会被划分到老练工艺;咱们的制作才干前进都建立在进口设备的根底之上,间隔全工业链的国际先进水平方针仍有间隔。
到了2018年,中、美科技竞赛加重,断供的危险急剧飙升——中兴通讯被逼喊出“美国禁令将使公司当即进入休克状况”,台积电被逼中止向华为供给麒麟芯片代工服务,国产GPU创业进入第二轮出资浪潮,象帝先便是在这一轮创业大潮下诞生,同期的国产团队还包含壁仞科技、摩尔线程、沐曦等。
象帝先董事长唐志敏是我国芯片范畴稀有的战略级科学家,我在20多年前就有过了解,曾在多家国产芯片项目傍边担任负责人。
2000年,龙芯董事长胡伟武的热文《咱们的龙芯一号》中,唐志敏就以龙芯项目负责人的身份呈现。在创建象帝先之前,唐志敏还领导了海光的CPU、DCU项目,不过相关项目商业化都不是很成功,要害问题仍是由于过度依靠AMD的Zen1授权,这儿不打开讨论。
2020年9月建立初期,象帝先完结天使轮融资,2022年完结A轮融资。到2021年,两年时刻公司规划已逾越200人,开展速度十分快,而不久前由哈佛3名00后辍学生组成的AI芯片项目“Etched”团队仅仅只要35个人,所以不少观念以为,象帝先在前期扩张太快,但这种比较略显肯定,后文再具体打开。
2022年,象帝先迎来高光时刻,当年依据Imagination的IP核授权,流片并发布了“天钧一号”GPU——12纳米工艺,2048个核算核,4TFLOPS的FP32算力、16TOPS的AI算力、16GB显存、256GB/s带宽。
横向比照硬件目标,象帝先的“天钧一号”在带宽、算力和工艺上与2022年的国产竞品有必定间隔,其功能牵强追上英伟达2019年的中高端产品RTX 2060(如下表),后者相同选用12nm工艺,总计1920个核算中心,6.5TFLOPS的FP32算力,51.6TOPS的AI算力,6GB显存,带宽336GB/s。
相关GPU产品硬件目标比照,来历:产品官网及相关报导
2023年9月,象帝先发布“天钧二号”,这代产品定位低端,1024个核算中心、2.6TFLOPS的FP32算力、8GB显存、128GB/s带宽,主打低功耗和高性价比。
两款产品作为敲门砖,协助象帝先在2023年完结了至少来自14个资方的3轮融资,并于2024年成为重庆市独角兽企业,估值逾越150亿元,被许多媒体称之为“我国英伟达”。
不过,“我国英伟达”的帽子,关于象帝先来说不必定匹配——它要对标的英伟达,营收构成现已风格大变,数据中心事务占比挨近90%。
英伟达营收构成,2023财年Q1,数据中心事务初次逾越游戏事务 来历:App economy insight
而象帝先直到2024年,还停留在桌面显卡商场,仅有能和AI芯片相关联的产品,是2024国际人工智能大会上露脸的一块奥秘的PCIE版别服务器显卡XDX X1900。
外界传过B轮融资满5亿元的对赌协议是压垮象帝先的“终究一根稻草”,而对赌牵涉的本钱问题,与整个大环境有关,本年7月份,汹涌新闻在报导中发表,深创投大批量建议回购诉讼,经过这种方法来退出被投项目,但象帝先的境遇不能阐明国产芯片规划团队遭受本钱隆冬,壁仞、摩尔线程究竟还在排队IPO。
2024年国际人工智能大会上“象帝先”公司展出的产品矩阵
从我的视点来看,问题中心仍是战略误判,对赌协议仅仅象帝先“闭幕”的导火线,即使没有这个诱因,也或许会呈现其它原因。
关于象帝先现在的本钱困局,我尝试过与其商场部前职工进行求证,但未取得正面答复,仅仅表明“咱们也都盼着好音讯。”
02 其实,GPU厂商是“软件公司”
国产创业项目还在追硬件目标,可是GPU竞赛现已从硬件为主、软件为辅的比拼,转变为硬件+软件的归纳生态才干比赛。
深度学习爆火之前,通用GPU需求数量最多的运用方向是PC桌面显卡,英伟达、AMD、英特尔是首要玩家,其间英特尔首要在CPU上集成GPU,2022年又重回独显商场。三家供给的产品多,满意作业、游戏、图形等各类需求。
依据商场研究组织JPR的数据,PC显卡供货商市占率,英特尔依靠集成显卡出货占有68%比例位列榜首
新入局者,想要在这样的商场上分一杯羹,不只需求厚实的产品功能,更需求运转多年的老练供应链系统支撑,难度极高。
就拿象帝先的天钧一号来说,不只功能无法和同期国产产品抗衡,与国际商场上的对手间隔在3年左右,这意味着新晋者连打价格战的实力都不具有。
更重要的是,桌面显卡聚集图形处理才干,而深度学习鼓起之后,依据并行核算优势,GPU找到了新的添加空间。
两个目标可阐明GPU通用核算需求“暴增”——其一,“算力顶流们”的数据中心事务急剧胀大;其二,“硅谷巨子”算力储藏急剧胀大。
一方面,到到本年10月27日的第三财季,曩昔四年,英伟达的数据中心事务添加了约30倍,财季营收从11亿美元(占比25%)暴增到309亿美元(占比88%)。
另一方面,研究组织Omdia的数据显现,到2023年第三季度,英伟达H100出货量到达65万张,其间Meta和微软别离拿下15万张,挨近悉数订单的一半。到2024年,微软的Hopper系列GPU储藏量直接冲到了48.5万张,其AI数据中心开销逾越300亿美元,位列一切硅谷巨子之首。
*研究组织Omdia发表的近两年美国首要科技公司Hopper架构GPU的储藏量
深度学习和人工智能为GPU带来了潜在的时机和蛋糕,但这不代表草创公司必定就有时机拿下,像AMD这样的GPU老玩家,一些产品算力目标都逾越了英伟达,但在竞赛中便是打不赢,以CUDA为代表的软件生态扮演了至关重要的效果。
有一个细节,本年的GTC大会上,黄仁勋说“英伟达是一家软件公司”,指的便是其GPU产品“控制”AI的要害要素之一,CUDA生态。这一点我在《没人能“杀死”1.5万亿美元的英伟达》一文中也解说过。额定插一句,这才曩昔半年多时刻,英伟达市值现已突破3万亿美元市值。
生态系统的控制力怎么了解?能够类比用户对操作系统的偏好——苹果的macOS现在满足优异了,曩昔10年其商场比例翻了一倍,但Windows依然有先发优势以及用户的承受度,牢牢占有着70%的比例,这便是生态系统的力气。
依据GPU的通用核算,生态系统的重要性或许比操作系统还要极点——开发者一旦习惯了英伟达的软件生态,就很难从其间切换出来。
举个比方,假定某个企业要收购国产GPU,首要就要处理代码兼容性问题,包含不兼容的库和函数都要替换或许修正,尽管国产厂商会供给搬迁东西,这仍需许多的开发作业,搬迁进程还会引发运用功能丢失的问题,要削减这种丢失,就得依据国产GPU的架构来调整优化算法,这又进一步添加开发作业量。
设备的安稳性也是影响功率的一个要害要素,之前Meta在论文中曾发表过——H100的万卡集群练习Llama 3.1,均匀3小时毛病一次,尽管许多问题都能够自动化处理,但依旧会添加人力和时刻本钱,终究影响功率。
而这仍是H100这样市占率超高的产品,一些问题还有或许在线上社区找到处理方案,一旦换成国产设备,假如支撑生态做得欠好,快速定位问题并获取处理方案都不是一件简单得工作,用比较盛行的话说,切换国产GPU的TCO(总具有本钱)太高。
从心思上说,应该有许多企业乐意支撑国产芯片,收购本钱不廉价也能够承受,可是从商业的视点来说,假如开发特别费事、运用呈现问题,占用了研制团队过多精力,这样的商业协作很难维持下去。
抛开商场需不需求这么多英伟达的问题来看GPU、AI芯片创业,现在许多新项目一露脸便是数十倍的“吊打”英伟达,硬件目标看上去不必忧虑了,但除了纸面数据要好外,一开端就要想好怎么做生态。而一旦触及做生态,关于“400人是不是多”这类问题,就会好答复许多——我所知道的是,英伟达这样的企业,在大客户那里一般都会组织数十人的驻场支撑团队。所以,GPU厂商是“软件公司”这个观念现在来看十分恰当。
03 只做“代替”很难上牌桌
没有生态支撑的GPU通用核算项目,局面能够说是时机与应战并存。
由于美国约束高功能AI芯片向大陆出口,客观上给国产厂商打开了时机之门。当一切企业都拿不到,或许很难经过正常途径收购海外先进产品时,能够安稳供货的国产GPU就会成为争抢目标,并且现在方针和组织也在鼓舞这件事,这也会加快国产半导体生态的老练与进化,华为在手机芯片上现已验证这一点。
与手机芯片不同,GPU作为“大芯片”,die size都在500mm²以上,比方RTX 4090是600mm²,H100是800mm²+,假如选用高带宽内存,还要侧重考虑先进封装技能。
用于通用核算的干流GPU(右侧),die size为826mm²,Cerebras WSE-2(左边)专用芯片到达了46225mm²
所以,除了前面说的战略误判,影响国产GPU成功的要素还包含IP、规划、制作、出售等环节之中,并且环环相扣。
在规划环节首要面临的便是IP授权和规划东西的问题,象帝先、摩尔线程都是拿Imagination的IP授权,然后选用海外公司的规划东西,假如这两个范畴得不到继续地更新支撑,就存在断供危险。
规划的下一个环节便是制作。许多企业的产品硬件目标,不管单项仍是多项都很优异,但能否流片成功,并且以高良率量产也很要害。
单就流片这个环节的单次费用就高达上亿元,假如流片失利就得额定再付出费用,之前英伟达的Blackwell芯片遭受“跳票事端”,一度带崩其股价,英伟达能够扛得住这种危险,创业团队未必能饱尝住。
好音讯是,在制作端,曩昔几年在美国的极限施压之下,国产制作工艺和设备现已有了很大前进。9月份,工信微报发表了国产光刻机的开展,按官方供给的数据,纯国产设备现已能够掩盖65nm工艺的芯片,这关于我国芯片工业具有很大的含义。不过,尽管大陆自主晶圆制作技能前进敏捷,但先进产能也相对有限。
所以,现阶段大陆的fabless,也还离不开对台积电的依靠。并且,由于创业团队体量与需求量的差异,代工费用会有不同,平等工艺代工费用或许是台积电的1.5倍左右,这也会影响草创公司的毛利率。
规划、制作之后,便是怎么把产品卖出去,完结正循环。一些现在还活泼的一些头部创业团队,许多背面都有上市公司的支撑,这些上市公司在各地推进构建智算中心,关于创业团队来说,它们既是出资人,又是客户。这种逻辑还能够类比云核算厂商——自研AI芯片更简单成功,自己便是自己的客户,能构成很好的自循环。
许多人问我国芯片的出路在哪里,从一个外部观察者的视角,短期确实要完结自主代替,长时间则需求参加到对工业的规范拟定傍边,这样才干够影响到全球工业。我想举一个大疆的比方,它也被纳入了实体清单,可成果呢?美国要制裁它,又不得不想办法来买它的产品。
曩昔,职业看到“美国禁令”的大利好之后,感觉时机来了纷繁举动、融资开跑,是能够了解的激动。但终究,创业团队与本钱在遍及认知、达到一致之后,结合工业开展窗口来攒局,才干更好地预备应对应战,在未来我国芯片生态“大成”之时,成为胜利者中的一员。假如上述条件都不具有,更多的“我国英伟达”或许会迎来不确定性。
相关推荐