英伟达 (NVIDIA) 崛起的传奇历程——从显卡霸主到AI王者的版图全览
编辑:admin
来源:兰越手游网
2023-06-04
(一)初创与壮大1,“顽童”创业1963年,黄仁勋在台湾出生。当他九岁那年,身为工程师的黄父,为了让他接受更好的教育,便将两个儿子一同送往美国华盛顿州(舅家)。结果,到了美国后,由于舅家经济非常困难,很快把小哥俩送到了一所乡村寄宿学校就读。在这里,黄仁勋不仅学会了爬墙上树、偷吃东西,甚至还学会了抽烟。幸好这样的生活只持续了两年,黄的父母就来到了美国,之后黄家迁往俄勒冈州,黄仁勋也终于可以进入正规学校读书了。值得一提的是,求学期间黄仁勋在乒乓球运动上显示出了惊人的天赋——这几乎让他成为了职业选手!当时,15岁的他参加了美国乒乓球公开赛,并在青年组双打赛事中夺得季军!但是,更热爱技术的他,最终还是放弃了爱好,在高中联考后进入了俄勒冈州立大学的电子专业读书。1983年毕业后,又前往加州硅谷,加盟AMD公司并成为了一名芯片设计师。两年之后,他跳槽到了另一家芯片公司——LSI Logic (巨积) 。1992年,在黄仁勋取得斯坦福大学硕士学位之时,便辞去了工作,并开始筹划其“30岁承诺”。原来,黄仁勋曾经对他的妻子Lori作出过承诺——他一定会在30岁之时拥有自己的公司。于是,1992年底,在两位曾经于SUN工作过的技术人员之邀请下,他欣然应允。1993年初,黄仁勋、克里斯·马拉科夫斯基(Chris Malachowsky)、卡蒂斯·普里姆(Curtis Priem)三人,在美国加利福尼亚州正式创办了NVIDIA。同时,为了兑现承诺,他将第一天上班的日子定在了1993年的2月17日——正是他的30岁生日(下图便是这历史性一天的旧照)。“顽童”的特性,可谓是伴随着黄仁勋的整个人生。2,“大佬”助力NVIDIA创立的时候,市场上足足有20多家图形芯片公司(三年后这个数字更是飙升到了70家)。但是,三位创始人还是义无反顾地投身于这个市场当中。1994年,NVIDIA与SGS-Thompson Microelectronics(1998年更名为意法半导体)达成了首个战略合作伙伴关系,共同研发制造单芯片图形用户界面加速器。不过,当时NVIDIA选择了并不被人看好的正方形绘图技术;同时,其又重视芯片的多功能性,因此选择了集成
游戏手柄、声卡等多重功能的芯片设计思路,欲进入游戏机市场。另外,当时NVIDIA还选择了Diamond Multimedia Systems, Inc. (帝盟公司) 作为商业合作伙伴——准备让其将芯片安装在多媒体加速器板上。1995年五月份,首款产品NV1正式诞生。同年七月尾,与街机游戏领导者世嘉 (SEGA) 建立伙伴关系;在世嘉的助力下,“VR战士 (Virtual Fighter) ”成为首款在NVIDIA显卡上运行的3D游戏。同年十一月份,帝盟推出了基于NVIDIA技术的Diamond Edge 3D。这是第一款主流多功能芯片:集成了操纵杆、游戏端口、声效、显示、2D、3D等多种功能。当时NVIDIA的运气不错,不仅与世嘉合作让NV1芯片额外得到了一些应用,同时还得到了世嘉一笔高达700万美元的下一代产品NV2之研发订金!但由于NVIDIA强烈希望保留其成熟的正方形绘图技术,而多边形渲染技术又是未来的发展之路,所以世嘉和NVIDIA起了冲突。最终,NV2芯片还没有开发完成就被世嘉放弃。后来世嘉选择了3dfx,作为新的合作伙伴。但值得庆幸的是,世嘉作为行业“大佬”,并没有收回订金,而这笔钱却帮助NVIDIA撑到了Win95时代的到来。3,顺应时势在经历了NV1的勉强度日和NV2的胎死腹中之后,英伟达最终决定放弃多媒体加速芯片的研发,转而专注于PC专用的2D/3D显卡,以此降低研发成本。1996年三月份,NVIDIA和游戏开发者联盟制订Direct 3D的主要规则,推出首款支持Direct3D的Microsoft DirectX驱动程序。同年六月份,将主要力量投入开发台式电脑专用的领先显示芯片。1997年四月份,推出全球首款128bit的3D处理器RIVA 128(核心代号为NV3),这也是第一款支持微软Direct3D加速的图形芯片。当时Windows95已经流行开了,所以黄仁勋在总结了NV1、NV2的经验教训之后,决定在实力不足以制定规则的情况下,那就顺应潮流,所以才将微软的Direct3D作为优先支持的API。事实证明,这个决定异常正确!虽然RIVA 128在图像质量上比不了当时主流的3dfx Voodoo,但是凭借着低廉的价格和高性能的2D/3D加速能力,以及对于AGP1x接口的支持,其迅速获得了OEM厂商的认可。1997年八月份,与Dell、Gateway、Micron建立了合作伙伴关系,并在接下来的四个月里完成了一百万台的出货量!依靠强大的微软平台和卓越的战略眼光,NVIDIA取得了一场难得的胜利!1998年三月份,正式与台积电签约建立合作伙伴关系;接下来的五月份,联手微软在电脑游戏开发者会议推广他们共同开发的DirectX 6.0;后面的九月份,则成功入选OpenGL结构审核委员会。同时,年内发布的行业第一款多纹理3D显示芯片——RIVA TNT(核心代号为NV4)凭借着优异性能继续抢占市场。而另一款同年发布的Vanta显示芯片,则进入了商用台式电脑市场。1999年四月份,NVIDIA再接再厉,推出了往后“英伟达显卡王朝”的基石产品——RIVA TNT2(核心代号为NV5)。从这代开始,依靠着众多衍生型号,产品的市场化细分正式开始。(二)英伟达显卡王朝1,碾压打法之所以RIVA TNT2能依靠众多衍生型号切入各细分市场,皆仰赖于其自身强大的性能——在制程工艺升级的情况下核心频率和显存容量皆有极大提升,以及其更具优势的价格。反观NVIDIA最大的竞争对手3dfx,不仅在新产品上“挤牙膏”,还采用了AGP2x接口故仅支持16位色彩(RIVA TNT2是AGP4x接口所以支持32位色彩)。也就是说,NVIDIA的显卡性价比明显更高——消费者纷纷投向NVIDIA怀抱。而且这时候的3dfx已经痛失了世嘉这棵“大树”,又因为独造显卡而失去了帝盟、技嘉、创新、艾尔莎等大厂的支持(雪上加霜的是这些大厂皆转投了NVIDIA)。不过,真正让NVIDIA崛起,并彻底打败3dfx的,还是1999年八月份发布的全球首款GPU (Graphics Processing Unit,即“图形处理器”)——那款极具里程碑意义的GeForce256。其首次加入了硬件T&L(全称为Transforming&Lighting,即“坐标转换和光影计算”),从而减少了CPU的处理量,让显卡成为了电脑的核心硬件并彻底解放CPU。后面的十一月份,又发布了全球最快的工作站GPU——Quadro。值得一提的是,就是在1999年初,NVIDIA在纳斯达克(Nasdaq)挂牌上市,并在年内达成了显示芯片出货量破一千万个的里程碑记录!一套“组合拳”下来,3dfx彻底被打懵了!GeForce256的出现,直接改变了业内的竞争格局。因为之前用“高端CPU 显卡”才能完成的工作,如今只需用“便宜点的CPU GeForce256”便能完成,而且流畅度还更好!花更少的钱办同样的事,还更具效率,这么具有革命性的事情,就这样被NVIDIA做到了!得益于这番优异表现,2000年三月份,NVIDIA成功拿到了微软首款XBOX游戏机的图形处理器订单——辗转多年后又回到了最初想攻占的游戏机市场。同年又推出了GeForce2,并基于此推出了其它丰富的产品线,例如十一月份发布的全球首款笔记本电脑GPU——GeForce2 Go;从此,这招“阉割大法”便成了N卡的招牌打法,并屡试不爽!2,双雄争霸2000年十一月份,收购了一代显卡王者3dfx的知识产权(核心图形资产),数年的“显卡争霸”最终以NVIDIA全面胜利收尾。而接下来要面对的,便是另一家显卡劲敌——ATI。2001年二月份,推出了业内首款可编程GPU——GeForce3,从而使得开发者能够创建定制视觉效果。这时候的NVIDIA发展势头极其迅猛,在2002年二月份直接越过了一亿个绘图处理器的出货量关卡!2003年,收购了无线领域图形和多媒体技术的领导者——MEDIA Q(成立于1997年),借此切入无线移动市场(包括手机、PDA、LCD显示器以及其它移动设备)。2004年六月份,NVIDIA的SLI技术问世,其允许将多个GPU连接在一起,从而大大提升了单台PC的图形处理能力。至此,ATI已经有了全面溃败的迹象,与之相对的便是NVIDIA之所向披靡。同年与暴雪娱乐合作,发布了采用3D图形技术的游戏“魔兽世界 (World of Warcraft) ”,这款大型多人在线游戏很快成为了全球最热门的游戏。次年,又开始为索尼PlayStation3开发处理器。2005年尾,宣布收购总部位于台湾的核心逻辑技术开发商ULi Electronics(宇力电子),此举可谓一举两得——既打击了ATI(宇力是其南桥芯片供应商)又壮大了自身的技术实力。2006年,CUDA架构问世,这是一种用于通用GPU计算的革命性架构。同年收购了Hybrid Graphics(1994年创立于芬兰),这是一家为手持设备开发嵌入式2D和3D图形软件的开发商。反观另一边,2006年ATI被AMD以54亿美元巨资收购——接下来的“双雄争霸”直接变成了接力的AMD和NVIDIA之格局。2007年,Tesla GPU诞生,其所提供的堪比超级计算机之算力,被广泛使用于药物研发、医学成像和天气建模等领域。此外,2007年NVIDIA还收购了PortalPlayer,这是一家为个人媒体
播放器提供半导体、固件和软件的供应商。同年尾,正式启用官方中文名“英伟达”——英伟达王朝至此开始成型。3,显卡王朝2008年,英伟达低调收购了Mental images(1986年创建于德国)。这家公司是视觉渲染软件领域的领导者,其Iray软件与Quadro GPU相结合,通过逼真的设计渲染效果为创意专业人士提供即时反馈。另外,同年还收购了游戏物理技术开发商AGEIA,这家公司的PhysX软件在游戏中用于再现物理性质对物理世界中的物体之影响效果。当时英特尔已经收购了另一家物理加速卡公司Havok,英伟达则携AGEIA与之对抗,AMD只能黯然观战。2009年,在第一届GPU技术大会上,英伟达发布了名为“Fermi (费米) ”的新一代CUDA GPU架构。这个架构虽然性能极强,但功耗也极高,所以2010年十一月份推出的该架构之旗舰产品GTX580被戏称为“核弹显卡”。2011年初,在CES大会上推出“Project Denver (丹佛计划) ”,首次为PC开发基于ARM指令集的超高效定制架构CPU。次年,发布了基于全新“Kepler (开普勒) ”架构的GeForce GTX600系列显卡。这代的功耗表现相较于前代进步很大,特别是其中的旗舰型号GTX680,不仅帮助英伟达夺回了单芯显卡卡皇的宝座,还成为了N卡发展方向的转折点——削减与游戏无关的结构专注图形性能从而大幅提升能效比。事实证明,计算卡和游戏卡分开发展是极具里程碑意义的战略规划,从此英伟达的游戏显卡发展速度一骑绝尘,将A卡越甩越远(直到2019年AMD才无奈宣布也会采取游戏卡和计算卡分开设计的
策略)。2013年,又推出了面向游戏玩家的GeForce GTX TITAN,其诞生可谓开启了“超级计算机游戏时代”。同年,收购了Portland Group(创立于1989年),进而推动英伟达为加速计算革命创建开发者工具的进程。2014年,推出“Maxwell (麦克斯韦) ”GPU架构,能效比继续大幅提升。2016年,全新的“Pascal (帕斯卡) ”架构诞生,叠加全新的16nm制程工艺,直接助力“甜点产品”GTX 1060成为英伟达历史上最为畅销的显卡!至此,英伟达王朝的霸业正式建立,双雄争霸已分胜负——AMD在其步步紧逼之下毫无还手之力(特别是高端领域)。桌面端尘埃落定,那么移动端英伟达的表现如何呢?(三)AI 王者1,折戟移动端2003年收购MEDIA Q后不久,NVIDIA便推出了旗下首款专为移动计算设计的产品——GoForce 2150,此后的年份相继推出了多款此类芯片。但事实证明,独立的GPU芯片在移动计算产品中几无立足之地。于是,NVIDIA转而开发SoC芯片,开始将ARM CPU和自家移动GPU(2006年收购的Hybrid Graphics发挥了很大作用)集成在一起。最终在2008年,Tegra移动处理器问世——至此英伟达正式参与到移动计算平台的竞争中。2011年初,推出了全球首款双核移动处理器Tegra2,并在此基础上打造出首款安卓平板电脑。同年十一月份,英伟达铆足了劲,又发布了全球首款四核移动芯片Tegra3。Tegra3虽然性能提升很大,但由于制程工艺并没有升级,所以功耗表现一言难尽(其实前代的发热量已经很“感人”了),2012年发布并号称“世界首款四核手机”的HTC One X便深受其荼毒。2013年初,继续发布了全新一代的四核移动处理器Tegra4和首款完全集成4G LTE基带的移动处理器Tegra4i,这代的制程升级为当时最先进的台积电28nm工艺,可谓是准备打一场翻身仗的!但是,Tegra4所集成的那款号称“世界最强”之GPU,依然沿用老旧的分离渲染架构,所以一旦到了需要统一渲染架构的OpenGL ES 3.0的环境就会直接罢工!同时CPU所采用的公版A15架构发热量比较严重(而且72核GPU发热量也不低)。更糟糕的是这款处理器还没有集成基带,所以当年小米3移动版选择的是外挂展讯基带,那个信号体验谁用谁知道!再加上Tegra4的CPU和GPU拖后腿,各种发热、卡顿、兼容性差的缺点暴露无遗!虽然还有一款集成了基带芯片且在GPU核心规模做了缩减的Tegra4i,但由于上市时间太晚了,直到高通的骁龙800普及也没有兴起什么风浪,关键在性能方面也没有什么优势。最终,在4G普及的“前夜”,高通靠着全自研的CPU和GPU架构,以及SoC集成的“全网通”方案,彻底把包括英伟达和德州仪器在内的一众老牌劲敌远远甩在了身后,英伟达就此退出了手机芯片市场。2,最佳归属2014年,英伟达推出了Tegra K1。其有两种方案(皆为28nm工艺制造),其一是32位的四核Cortex-A15架构,主要产品是小米平板(第一代),另一个则是双核64位自研丹佛(Denver)架构。GPU升级到开普勒(Kepler)架构,共192个CUDA核心(这回终于是统一渲染架构了),有入门级独立显卡的性能实力。当然,随着性能的飞涨,功耗与发热自然也非常高,基本是不指望在手机上使用的。而且,这时候英伟达已经退出了火热的手机芯片市场,所以这款性能非常强大的芯片只能在安卓平板中寻求一席之地,或者安装在英伟达自家的掌机中,此外也有部分车企采购这款芯片应用于车机上。2015年初,继续推出Tegra X1,制程升级为台积电20nm工艺。CPU采用了“四颗A57 四颗A53”的八核架构,GPU则升级为麦克斯韦(Maxwell)架构——拥有256个CUDA核心。这款“核弹芯片 (功耗很高) ”非常成功,因为英伟达运气爆棚遇到了一个大客户——任天堂,更幸运的是其成为了后面爆火的Switch搭载之芯片!Switch上市的时候,已是2017年,这时候的Tegra移动处理器系列刚好走过了一个十年的历程。但“好饭不怕晚”,搭乘Switch的东风,Tegra移动处理器终于迎来了大展拳脚的机会!2016年八月份,又推出了Tegra Parker,制程升级为16nm工艺。其中CPU采用了“四颗A57 两颗Denver2”的六核架构,GPU则升级为全新的帕斯卡 (Pascal) 架构。紧接着的九月份,又发布了Xavier(直到两年后才交样,量产更是要等到2020年),制程升级为12nm工艺。这是英伟达首款为高级自动驾驶研发的芯片,同时也面向机器人和边缘计算等计算平台。Tegra系列芯片发展到了Xavier这代,已经不仅仅是一个处理器了,而是完成了华丽蜕变——成为了一个提供人工智能的超级计算机(所以去掉了“Tegra”前缀)!3,AI 王者要说起英伟达称霸AI领域的源头,还得追溯到2006年推出的用于通用GPU计算的CUDA架构上。其革命性之处在于,能够在庞大运算问题中,通过CUDA编程充分利用GPU的并行处理能力。打个比方,假如让一个数学教授和100个小学生比数学能力,那么扔一道高等数学方程下来,数学教授轻松搞定,100个小学生则当场懵逼;但若扔100道四则运算题下来,那么100个小学生的计算速度就要远远超过那个数学教授!在这里,数学教授扮演的就是CPU的
角色,那100个小学生则扮演了GPU那100个核心的角色,而那100道四则运算题指的就是通用GPU计算。恰好,人工智能深度学习所依赖的便是通用GPU计算!2016年,英伟达推出全球首款一体化深度学习超级计算机——DGX-1,这是一款搭载了8块 P100加速器的超算,可强力支持人工智能应用程序。当时黄仁勋独具慧眼,第一台DGX-1直接捐给了初创的OpenAI。2017年,推出了“Volta (伏特) ”GPU架构,其中首次引入了名为“Tensor Core (张量核心) ”的计算单元,专为深度学习而设计。基于此架构设计的Tesla V100 GPU加速器,为DGX系列AI超级计算机提供了极其强劲的动力支持!2018年,再接再厉推出了“Turing (图灵) ”GPU架构,为全球首款具备实时光线追踪功能的GPU(即RTX 8000)提供支持。实时光追长期以来一直被视为计算机图形技术的终极目标,英伟达此举可谓重塑了计算机图像技术。2019年,丰田和沃尔沃集团开始使用NVIDIA DRIVE端到端平台,以开发和训练安全的自动驾驶汽车,并部署到全球的交通运输行业。2020年,英伟达收购了高性能互联技术领域的领头羊 Mellanox(迈络思,成立于1999年),HPC领域的两家卓越公司合二为一。同年隆重推出了“Ampere (安培) ”GPU架构,助力实现一种新的功能强大且灵活的数据中心。2022年十一月底,OpenAI旗下的人工智能对话聊天机器人ChatGPT推出,此后迅速在社交媒体上走红爆火。而实际处理ChatGPT的GPU,正是英伟达的HGX A100 (基于安培架构) !尾声:起始于2020年九月份的“英伟达400亿美元收购ARM”之交易,在2022年二月份正式因严格监管审查及竞争对手的反对而以失败告终,英伟达为此支付了软银12.5亿美元的巨额“分手费”。究其原因,皆在于ARM本身实在太过重要所致。如今在移动市场,有超过90%的智能手机和平板电脑以及其他移动设备都在采用ARM提供的架构,更不用提在物联网领域。所以欧盟、中国以及美国科技巨头(例如谷歌、苹果、高通)皆极力反对。不过,这对于英伟达来说只能算是“小赌怡情”的小插曲,并未伤及元气。这几年除了继续称霸显卡领域外,得益于人工智能和自动驾驶的迅猛发展,其市值已超7100亿美元(半导体行业最高)!END致力于手机知识的探索和整理
标签: