今年6月18日,美国金融圈,发生了一件大事,英伟达的股价一天内上涨了3.6%,市值飙升至了3.34万亿美元,一举超过了微软和苹果,成为全球市值最高的上市公司。 虽然几天后,股价又出现了回调,但无疑的一件事是在AI当道的今天,英伟达绝对是全球科技企业中最风光的一个。 以至于英伟达CEO黄仁勋在采访中可以毫不避讳地说道「我们就是AI世界的发动机」。 黄仁勋这话也绝对不是在吹牛皮。生成式AI、自动驾驶、加密货币、元宇宙,这些风口上的科技,背后都离不开英伟达所生产的显卡的支持。 出生于台南的黄仁勋,今年6月访台时,在科技圈掀起了一阵现象级的追星热潮。16年前,黄仁勋对显卡行业做出的大胆预言现已精准实现。 如今他又说了哪些预言,给了年轻人怎样的忠告呢?为什么他会说台湾站在这场新的工业革命、AI革命的中心呢?今天我们来聊聊这位AI教父的故事。 1963年,黄仁勋出生于台南。9岁时,他和哥哥被送往美国亲戚家,由于亲戚家的居住条件有限,初到美国的日子,他和哥哥是在肯塔基州的一所寄宿学校里度过的。 这所学校的优点是学费便宜,缺点是生源混杂,有不少问题少年,黄仁勋后来回忆道:「我是学校里唯一没有折叠刀的男孩。」 几年后,黄仁勋的父母终于获准来到美国,定居在俄勒冈州,兄弟俩与父母团聚。 高中期间,黄仁勋表现出了华人小孩的两大特点:成绩优异;有运动才能。 他参加了学校的数学、计算机和科学俱乐部,跳了两级,16岁就高中毕业了,15岁还拿到了乒乓球比赛全美双打第三名。 后来,黄仁勋进入俄勒冈州立大学(OSU),攻读电子工程专业。1984年,又进入斯坦福大学读硕士。 在大学实验室里,黄仁勋遇到了未来的妻子洛瑞·米尔斯Lori Mills。 据黄仁勋回忆,当时电子工程专业有250个学生,但只有三个女生,男生们争相吸引洛瑞Lori的注意,但黄仁勋却凭借一句「你要看我作业吗?」成功俘获了女神的芳心。 靠着教Lori功课的名义,黄仁勋顺利与其交往并结婚,相伴至今,两人还育有两个孩子。交往时,Lori曾问黄仁勋,你将来想做什么? 黄仁勋说道「30岁时,我将会是一家公司的CEO」。 所以有人开玩笑说,英伟达的诞生就是黄仁勋为了兑现当年在女友面前吹下的牛。 大学毕业后,黄仁勋曾先后在芯片公司AMD和LSI Logic工作过,获得了丰富的技术经验。 1993年,30岁的黄仁勋与另外两名志同道合的工程师好友克里斯·马拉科夫斯基Chris Malachowsky和柯蒂斯·普里姆Curtis Priem共同创立了英伟达公司。 三人最初是在黄仁勋家附近的一家叫做Denny’s的连锁餐厅里,讨论创业方向的,那里有可以免费续杯的咖啡,他们一坐就是四五个钟头。 有意思的是,80年代时,上大学的黄仁勋曾在这家店里打工,他刷了无数的盘子和杯子。后来,他常常自我调侃说,我应该是Denny’s最棒的洗碗工了。 不过,罗马不是一天建成的,英伟达走向巅峰的路上也曾九死一生。 九死一生创立之初,黄仁勋在前东家的帮助下,拿到了红杉资本和萨特·希尔资本各100万美金的投资。 当时正处于PC革命爆发之前,Windows 95 还没上市,但黄仁勋已经看到了3D游戏市场的巨大潜力 他预想PC时代到来后,全球各地的游戏玩家们,人手一台游戏机,联机打怪,在虚拟世界中,体验3D游戏带来的超强视觉冲击。英伟达决定将产品聚焦于图像处理领域。 1995年5月,英伟达推出了他们的第一款产品---显示芯片NV1,当时还没有显卡的概念 这款产品又被称作「多媒体加速器」,在技术上整合了2D和3D图形处理,并具备视频处理、声卡、游戏端口等功能,算是市面上比较先进的产品。 但由于其不菲的定价,NV1的销量一直低迷,唯一的好消息是,NV1集成了声卡的功能引起了日本游戏巨头世嘉的注意 世嘉希望英伟达为他们的新款游戏机研发显示芯片NV2,并甩出了一张700万美金的订单,英伟达一时间干劲十足。然而,NV2的研发很快惨遭碰壁。 当时3D图形处理技术方兴未艾,业内并没有统一的标准,大家走的技术路线都不一样,英伟达选择的是「四边形纹理贴图」。 但1995年底时,业内已有风声传出,微软将发布与Windows 95兼容的Direct 3D标准,该标准将只支持「三角形纹理贴图」。 可英伟达并未在第一时间意识到外部环境的变化,依然执着于「四边形纹理贴图」的路线。 这就等于自动舍弃了Windows电脑的市场,要知道90年代Windows操作系统在PC市场上拥有超过90%的市场份额,这意味着NV2就算研发出来了也无法投入使用。 等黄仁勋意识到问题的严重性时,公司账上的钱只够维持30天了,人员也从100多人裁到了只剩三分之一。 万般无奈之下,黄仁勋硬着头皮找到了世嘉社长入交昭一郎,坦白地承认了英伟达的研发方向错了,让世嘉抓紧时间更换合作伙伴 但同时说道英伟达还是希望世嘉能够支付700万美金的定金,因为如果没有这笔钱,英伟达就要破产了。 可天下哪有这样的好事:你东西没给我研发出来,耽误了我的时间不说,还要我给你付钱? 说出来大家可能都不信,入交昭一郎还真就答应了黄仁勋的请求。 后来,据入交昭一郎所说,他对黄仁勋的印象很好,觉得黄仁勋是个真诚又充满激情的年轻人,相信他未来一定能成功,并愿意在他困难时,拉他一把。 也许这就是所谓的「人格魅力」吧。 拿到700万美金的英伟达逃过了「30日生死劫」,黄仁勋迅速调整研发方向,采用微软的Direct 3D标准,并从游戏设计公司「晶体动力」挖来了大卫·柯克David Kirk博士担任首席科学家。 1997年4月,英伟达第三代产品NV3即Riva 128正式推出,凭借着其100M/秒的像素填充率成为了当时市面上唯一真正具有3D加速能力的显示芯片。 不到一年,Riva 128的出货量就突破100万片。英伟达终于脱离险地,活了下来。 此后,黄仁勋偶尔还会将30 days挂在嘴边。 NV2的研发失败给黄仁勋好好上了一课,让他明白,想要在竞争中生存下来就要向市场学习,要足够谦逊,而且要懂得及时纠错,绝不把时间浪费在悔恨上。 1998年,英伟达与台积电达成战略合作,将其产品交付台积电生产,自己则专注于研发。此后数十年间,黄仁勋与台积电创始人张忠谋也结下了深厚的情谊。 但英伟达真正的翻身仗,还要属1999年8月推出的革命性产品GeForce 256。 GPU的发明者1999年8月,英伟达发布了Geforce 256,并首创了图形处理器GPU(Graphics Processing Unit)一词。 此后,英伟达就把自己和「GPU发明者」这个头衔深度绑定起来,不得不说这是非常聪明的一步棋。 彼时的芯片市场是英特尔的CPU所称霸的世界,英伟达想要杀出一条血路,就必须另辟蹊径,于是他们就想到了营销GPU这一概念。说到这儿,就不得不讲讲CPU和GPU的区别了。 CPU的全称是Central Processing Unit中央处理器,可以被认为是计算机的心脏,负责处理大部分指令,擅长逻辑控制和复杂的运算。 CPU的架构包括运算器ALU(Arithmetic/Logic Unit)、控制器(Control Unit)、缓存(Cache)等等 由于需要应对不同类型的数据计算,还要响应人机交互,CPU需要更大的缓存,保存各种任务状态,以降低任务切换时的时延。 它也需要更复杂的控制器,进行逻辑控制和调度。 相对而言,真正干活的运算器ALU,也就是我们俗称的「核」,就被挤得占比较少了。 而90年代中后期,蓬勃发展的游戏和多媒体产业,对计算机的3D图像处理和渲染能力提出了更高的要求,传统CPU就有点不堪重负了。 GPU的出现就是为了分担CPU处理图像的工作重担的。 从它的名字图形处理器Graphics Processing Unit中就可以看出,GPU的任务单一且明确,它要做的,就是图形渲染。 而图形是由海量像素点组成的,属于类型高度统一、相互无依赖的大规模数据,所以GPU就被设计成了擅长大规模并发计算的架构,需要在在最短的时间里,完成大量同质化数据的并行运算。 并行运算,当然需要更多的「核」了,又因为其它的「杂活」少,GPU就不需要特别大的缓存和复杂的控制器。一般而言,CPU的核数也就几十个,GPU的核数可以达到几千个甚至上万个。 业界喜欢把CPU比作几个学识渊博的老教授,什么复杂的任务都能做,但得一项一项来。 而GPU就像是一大群小学生,虽然只能做加减乘除,但架不住人多力量大,你要是需要计算一亿次100以内的加减法,想想也知道,最好的办法肯定是雇一大帮小学生一起算。 英伟达曾发布过一支视频,形象地解释了CPU和GPU在处理图形上的区别。CPU就像是一把精准的机关枪,但子弹需要一发一发的射出来。而GPU是成千上万发子弹同时射出的。 GPU是为图形处理而生的,但歪打正着,在深度学习当道的今天,用于处理海量训练数据也能事倍功半,这正是英伟达称霸AI芯片市场的原因,不过这都是后话了。 英伟达在推出Geforce 256的同年年初,在纳斯达克成功上市,IPO价格为每股12美元,估值6.26亿美元,现如今英伟达的市值已超过了3万亿,涨了4800倍。 一直以来,英伟达就在干一件事:设计和研发GPU。如今,我们常常将GPU称为「显卡」,但其实确切地说GPU 是显示卡的芯片,也是显卡的「心脏」。 而显卡是把GPU、显存、接口等部件集合在一起的计算机扩展卡。 英伟达只出货GPU,也就是显卡的心脏,而显卡的生产则交给了刚才我们提到的全球第一家也是最大的一家集成电路代工制造商台积电TSMC。 在台积电生产力的加持下,黄仁勋提出了与「摩尔定律」并称的「黄氏定律」。 摩尔定律是英特尔创始人之一的戈登·摩尔在1965年提出的,核心内容为:集成电路上可容纳的晶体管数目在每过18个月到24个月会增加一倍,即每隔2年,CPU的性能会翻一倍。 而黄仁勋则说,GPU的发展速度将远远快于CPU。英伟达的核心战略就是产品将每6个月升级一次,性能翻一番。 多年前,黄仁勋在接受采访时被问到,英特尔也即将推出聚焦于图形处理的产品,英伟达会不会感到有压力? 黄仁勋问,英特尔的新产品什么时候问世啊?现场观察员说,2010年年底,黄仁勋惊讶地说道,这么久啊,言外之意是,到时候英伟达的产品早就更新换代了好几次了。 我们都知道,显卡根据形态可以分为集成显卡(iGPU,integrated GPU)和独立显卡(dGPU,discrete GPU)。 集成显卡内置于CPU中,与CPU共享内存。独立显卡则是一个独立的个体,有单独的显存,可以直接加装到电脑主板上。 英伟达专注于独立显卡市场,而在该领域,ATI曾是英伟达最大的竞争对手。用户们常把搭载英伟达GPU的显卡称为「N卡」,把搭载ATI GPU的显卡称为「A卡」。 ATI是一家加拿大公司,比英伟达早成立8年,90年代末开始进军独立GPU领域。2000年,ATI发布了继Geforce 256之后第二款真正的GPU——Radeon 256。 其性能较英伟达的Geforce 256更优。此后的多年里,英伟达和ATI一直处于缠斗的状态,2004年到2005年间,ATI的市场占有率甚至一度超过英伟达。 转折出现在2006年7月,CPU市场上仅次于英特尔的第二大供应商AMD,以54亿美元的价格收购了ATI,A卡上的标志从ATI换成了AMD。 黄仁勋听到这个消息后说道「ATI 这是打算认输了,让我们成为世界上唯一一家独立的图形芯片公司吧!」 曾有AMD的离职员工爆料称,AMD最初是打算收购英伟达的,但黄仁勋坚持在公司合并后,依旧由自己担任CEO,最终AMD退而求其次,选择了英伟达的对手ATI。 事实证明,黄仁勋的坚持再次帮了他,为了收购ATI,AMD几乎用光了账面现金,并产生了25亿美元的债务。 因为债务危机,二者的合并没能出现1+1大于2的「合力」,反倒让英伟达捡了个大便宜,趁机重新找回了市场竞争力。 虽然整合完ATI之后,AMD也发起过数次反攻,但大势已去,昔日「独显双雄」的局面早已一去不复返。 2007年之后,英伟达在独立GPU市场的占有率一直遥遥领先于AMD。 一个题外话是,在英伟达与ATI、AMD缠斗的那些年里,黄仁勋还意外喜提了「两弹元勋」的称号。 2010 年 12 月,AMD 推出了高端显卡 HD6900 系列,迫于竞争压力,三个月后,英伟达就推出了对标产品GTX590显卡。 GTX590性能强悍自不用说,但发热量和功耗也是高的吓人的。喜欢搞机的朋友,买了新显卡之后,又偏偏爱玩超频。 所谓「超频」就是让芯片在高于厂方所设定的工作频率的状态下工作,从而提高它们的性能。 结果就是,超频之下,GTX590竟然起火了,运气不好的玩家,连同CPU、内存、主板和电源也一起报销了,此后GTX590就被网友们戏称为「核弹」。 之后推出的GTX690,GTX790,虽然功耗有所改善,但网友们仍然对其发热不满意,还将GTX690戏称为「战术核显卡」。 本来这只是显卡圈儿里的一个梗,但不知道哪个有才的网友,把这个「核显卡」的梗写进了国内的百度百科。 更搞笑的是,2014年,甘肃卫视制作的一档军事节目直接引用百度百科的文案,连资料的正确性都没有核实,主持人就这么一本正经的说出了以下这段话 搭载690战术核显卡的火箭推进榴弹,一发就可以摧毁一个航母战斗群。 显卡圈最大的名场面就这么诞生了,从此,英伟达核弹厂名声算是坐实了,CEO黄仁勋更是被冠上了「两弹元勋」的称号。 网友们做了一系列的表情包来调侃老黄,再加上英伟达早期曾推出过Riva TNT系列显卡,驱动的名字叫雷管(Detonator),这似乎更加印证了老黄是个做军火的。 插曲讲完了,我们回归正题。2006年,AMD收购ATI的同一年,英伟达发布了CUDA架构,这成为了它迈向巅峰的重要一步。 划时代的CUDACUDA的全称是Compute Unified Device Architecture,是英伟达为GPU设计的一种并行计算平台和编程模型 它使开发人员能够使用C语言,C ++,Fortran等编程语言直接在GPU上编程。 这么说,大家可能很难理解CUDA究竟是个什么东西,我换一种说法吧。 CUDA出现之前,GPU只是一个负责在屏幕上绘制图像的「图形处理单元」;有了CUDA,GPU的算力真正变得通用 因为不同领域的开发者用可以他们已经熟悉的编程语言在GPU上编程,驱动GPU完成不同的计算任务。 GPU如今能被广泛应用于深度学习、大数据处理、挖矿等领域,全靠CUDA的支撑。 英伟达决定开发CUDA的契机,说起来也相当有意思。 早在2000年时,斯坦福大学计算机系的一位研究生伊恩·巴克Ian Buck将32块GeForce显卡连接在一起,外加 8 个投影仪来玩游戏《雷神之锤》(Quake)。 GeForce显卡附带了一种叫做「着色器」(shader)的原始编程工具。 伊恩Ian Buck黑进了着色器,访问了下面的并行计算电路,将几十个GeForce改装成了一台低成本的超级计算机。 伊恩Ian Buck说,这是世界上第一台8K分辨率的游戏机,它占据了整面墙,看起来棒极了。这一事件让英伟达意识到了GPU在超级计算领域的巨大潜力。 英伟达首席科学家大卫·柯克David Kirk认为,从长远看,让原本只做3D渲染的GPU技术通用化,有重大战略意义。 后来,Ian Buck入职了英伟达,现在是英伟达的一名副总裁了。 决定启动CUDA项目后,英伟达每年砸到CUDA上的研发成本至少5亿美元起步 这些年,英伟达在将GPU转化为更通用的计算工具上投入了将近100亿美元,反映在账目上就是成本增加、利润率降低,甚至亏损。 黄仁勋要让每一颗英伟达GPU都支持CUDA,但这意味着芯片面积增大、散热增加、成本上升、故障率增高 这一举动在当时被外界视为不计成本的疯狂之举,更何况,CUDA只是一个与公司核心业务关系不紧密的项目。 即使黄仁勋苦口婆心地阐述CUDA的价值,但华尔街的分析师们并不买账,要知道,并不是所有人都像黄仁勋一样具有前瞻性眼光,华尔街甚至将CUDA估值为0。 投资人也都觉得「你一家游戏显卡公司为啥要花钱去做梦呢」。 2008年,英伟达还经历了「显卡门危机」,G84、G86系列显卡由于存在封装缺陷,导致装有这些显卡的笔记本电脑无法启动,或启动后出现黑屏等现象 客户和投资人们对英伟达的不满上升到了极点。那一年,英伟达的市值蒸发了76.3%。 直到2012年,事情发生了转机。在之前AI简史的那期视频中,我们讲到了人工智能的发展曾2次陷入低谷。 2012年,「深度学习之父」杰弗里·辛顿教授带着他的两位学生亚历克斯·克里热夫斯基和伊利亚·苏茨克韦尔兹参加了全球最权威的计算机视觉大赛ImageNet大赛 他们设计的深度卷积神经网络AlexNet以压倒性的优势夺得了冠军,此事件标着这一直持续至今的连接主义学派(connectionism)人工智能研究热潮的复苏。 对AI的发展历程好奇的朋友,还请回看之前的视频。 而辛顿团队训练AlexNet模型时,用的就是两块双GPU的GTX580显卡。 AlexNet有6000万个参数和65万个神经元,完整训练ImageNet数据集至少需要262千万亿次浮点运算 但4个英伟达GPU在一个星期内,就完成了训练,如果用同样数量的CPU,训练时间可能长达1-2年。 2012年早些时候,谷歌团队曾用1.6万个CPU训练了一个可以「识别猫」的神经网络,但准确度却远比不上只用了4个GPU训练出来的AlexNet模型。 辛顿学生亚历克斯所写的描述AlexNet的论文在此后十几年前被引用了超过13万次,成为了计算机科学史上最有影响力的论文之一。 可以说是深度学习算法和GPU的算力一拍即合,引发了人工智能大爆炸的时代。 辛顿说:「用专门的GPU训练神经网络速度要比通用CPU快100倍」,然后又补充说道「如果没有CUDA,要进行机器学习就太麻烦了!」 一夜之间,英伟达从一家图形公司摇身一变,成了一家为人工智能的发展提供引擎的公司,昔日不受待见的CUDA成了新时代的宠儿。 2016年8月,英伟达向一家初创公司捐赠了第一台装载了8块GPU的专用于人工智能领域的超级计算机DGX-1,价值12.9 万美元。 黄仁勋在机身上留下了一句话:「为了计算和人类的未来,我捐出世界上第一台DGX-1。」 这家初创公司的联合创始人艾隆.马斯克Elon Musk、山姆·奥特曼Sam Altman以及一众早期员工也激动地在机身上签下了自己的名字。 6年后的2022年11月,这家初创公司发布了ChatGPT,一鸣惊人,没错这家公司就是Open AI。 ChatGPT发布一周后用户破百万,两个月后用户数破亿,英伟达芯片的市场需求也随之开始暴增。 英伟达与Open AI之间的故事乍看之下是一段「投桃报李」的缘分,但细想,何尝又不是黄仁勋对于AI领域的提前押注呢。 其实早在2017年时,英伟达还曾被天上掉下的另一块大馅饼砸中过。 2017 年,加密货币迎来大牛市,吸引了大量矿工「挖币」,挖比特币需要「矿机」,而矿机运行依赖的哈希算法需要算力,英伟达的GPU正是算力的来源。 全球显卡销量急剧增加,价格也水涨船高。以最受矿工欢迎的GTX 1060型号显卡为例,2017 年 5 月之前的拿货价约为 1650 元一张,2017 年 6 月后就涨到了 2900 元左右。 英伟达后来还推出了多款取消IO输出接口的GPU,仅支持OpenGL,这意味着此类GPU没法用于游戏,业内人士将这类GPU称为「专业矿卡」。 受益于挖矿潮,英伟达的 2018 财年全年收入创下了 97.1 亿美元的新高, 成为了加密货币大牛市背后的大赢家,天降财富。 如今,英伟达的市值(3.02 trillion USD)是腾讯(3.52 trillion HKD)的6.7倍、台积电(25.39 trillion TWD)的3.8倍,英特尔(132.26 billion USD)的22.8倍, AMD(265.58 billion USD)的11.3倍。 虽然纵观整个GPU市场,英特尔依旧占有百分之六、七十的市场份额,但这是因为大分部英特尔CPU都内置了相应的集成GPU(iGPU)。 在利润丰厚的独立GPU市场,英特尔几乎没有话语权。截止到2023年底,英伟达GPU在独显市场中占比80%,AMD占比19%,英特尔占比1%。 如果单把AI GPU市场拎出来看,英伟达的产品占比甚至达到了98%。 据投行瑞杰金融的估计,每枚英伟达H100 AI芯片的制造成本是3320美元,而售价是25,000至30,000美元,也就是说英伟达AI芯片的利润率逼近1000%,但依旧供不应求。 2024年3月,英伟达重磅推出了Blackwell B200 GPU 和 GB200 超级芯片。Blackwell系列芯片的名字来源于数学家、博弈论家、概率论家 大卫·布莱克威尔。 英伟达高级科学家 Jim Fan称其是「新的性能野兽」。Blackwell B200 GPU拥有 2080 亿个晶体管,性能达到了 H100 的 2.5 倍。 GB200 超级芯片更是将2个GPU 与一个CPU相结合,在具有 1750 亿个参数的 GPT-3大型语言模型(LLM) 基准测试中,GB200 的性能是 H100 的 7 倍,训练速度是 H100 的 4 倍。 OpenAI CEO Sam Altman 在看完英伟达新品发布会后,在推特上发文称「这是人类历史上最有趣的一年,但会是未来最无趣的一年。」 3D游戏、加密货币、人工智能,英伟达一次次地踩中风口,成就了它如今AI霸主的地位。这其中当然有运气的成分,但黄仁勋的前瞻性眼光也是毋庸置疑的。 16年前,在一档访谈节目中,主持人将芯片行业的格局比作了「三国演义」,英特尔是曹操,AMD是刘备,英伟达是孙权,并问黄仁勋同意这个划分吗? 黄仁勋表示,「20年之后的世界是现在的我们无法想象的,你现在提到的几个巨头可能都不会在未来继续搅弄风云。 如果以狭窄的眼光看待世界,那么你的战略部署也必将是狭窄的」。 8年前,黄仁勋也曾预言,很快AI将掀起浪潮。那么如今这位AI教父对未来又抱着怎样的看法呢? AI教父的预言2023年3月,黄仁勋先是喊出了那句振奋人心的「AI的iPhone时刻已经来临」 几个月后,黄仁勋接受了知名未来学家瑞安·帕特尔Ryan Patel的采访,采访中,黄仁勋表示 「这是人类第一次看到通用计算和AI两种技术转型同时出现,算力的进步结合深度学习的发展,将会带来1+1大于2的效果,甚至会让计算技术每10年进步一百万倍。 2年后,英伟达乃至整个行业就会面目全非」。 2024年3月初,黄仁勋在母校斯坦福大学举办的一场活动上预测说,AI将在五年内通过所有人类测试,包括数学测试、推理测试、历史测试、生物学测试、医学考试、律师考试,以及你能想象到的每一个测试 届时你可以说AI已经拥有了人类的智慧,AGI时代将全面到来。 这与我们在之前视频中扒出的一份、据说是从Open AI内部泄露的文件「Q*信息」的内容高度一致。 「Q*信息」也声称2027年将会出现可以执行通用任务、可以像人类一样思考和学习,具有自主意识和情感的「通用人工智能」(Artificial General Intelligence)。 不久前,在台北举办的国际电脑展(COMPUTEX 2024)上,黄仁勋发表了一场主题为「开启产业革命的全新时代」的演讲。 演讲中,黄仁勋对未来AI的发展做出了展望,我将其归纳为了3大预言。 第一,未来全球AI产业规模将高达100万亿美金,比之前IT时代的3万亿美元高出33倍以上,具有强大的市场前景。 第二,未来个人电脑,也就是PC,才是AI的主要载体,AI应用程序将充斥每个人的生活。第三,实体人工智能将融入我们的日常生活,AI将理解这个物理世界,机器人将无处不在。 黄仁勋还曾表达过一个观点是,未来首先消失的职业可能就是「程序员」了。 在过去20年间,几乎所有教育界、科技界大佬们都在不断强调学习计算机科学和编程的重要性,但黄仁勋的却说 「事实上,真相几乎完全相反。在人工智能的帮助下,未来每个人都可以成为程序员,人类的自然语言就是编程语言。」 黄仁勋认为年轻人应该更专注于学习生物、教育等AI所无法完全替代人类的领域的知识。在以往的不少演讲中,黄仁勋留下过无数给年轻人的宝贵建议。 在 2024年斯坦福大学经济峰会(SIEPR)上,当被问到「关于成功,有什么给斯坦福学生的建议」时 黄仁勋说,「我觉得我最大的优势之一就是我的期望很低,但是大部分斯坦福毕业生都对自己有很高的期望,当然了,你们也绝对配得上高期望,你们来自世界上最好的大学之一,成绩拔尖,是同辈中的佼佼者。」 但黄仁勋接着说道「对自己期望非常高的人,往往韧性(resilience)也低,不幸的是,韧性对成功来说至关重要。」 黄仁勋强调,「成功不是来自于智慧,而是来自于品格,而品格是在苦难和挑战中磨砺出来的。我希望年轻人有机会经历大量的痛苦和磨难。」 2023年5月,黄仁勋受邀在台大毕业典礼上致辞。 3年前,黄仁勋被授予了台大名誉博士的学位,致辞中,黄仁勋讲述了他创业过程中经历的3次低谷:NV2的研发失败;CUDA的饱受质疑;以及退出手机芯片市场。 他想借由这三件事告诉即将踏入社会的台大学子3个道理:1)困境中,要懂得谦卑地寻求帮助。 2)要实现长远的愿景,就要有承受近期苦难的能力。 3)有时候「放弃」也是一种智慧,有舍才能有得。 最后,黄仁勋用这样一句话结束了他的致辞:「跑起来,别用走的!为了寻找食物而跑,或者为了避免成为猎物而跑,无论为了什么都要跑起来。」 作为一名台南出生的企业家,黄仁勋对台湾有着特殊的感情。他曾在硅谷的一个台湾同乡聚会上说道「这场新的工业革命、AI革命,台湾就在中心,台湾所做的工作非常重要。」 在刚刚结束的台北国际电脑展(COMPUTEX 2024)上,黄仁勋也表示,「台湾是英伟达开始的地方,是台湾的合作伙伴们创造了世界级的AI基础架构」。 黄仁勋会有这样的感慨,并不是没有理由的。与英伟达合作了近30年的台积电,是全球最大的芯片代工企业。黄仁勋曾不止一次的在公开场合提到台积电对英伟达的帮助。 90年代末,英伟达研发RIVA 128芯片,由于生产的复杂性,他们急需一家专业的代工厂来辅助他们,他找遍了美国的代工企业,但没人理会他们这个初创小公司。 最后是台积电的张忠谋向黄仁勋伸出了援手。接到张忠谋电话时,黄仁勋立刻对旁边的人大叫道「嘘!大家都安静,Morris Chang打给我了!」 而这通电话就成了2家公司合作的开端。 成为科技圈新贵后,每次到访台湾,黄仁勋及其家人都会被大批粉丝和狗仔队跟随,而黄仁勋行事也相当亲民。 一次,他在台湾街头,偶然入镜了两位年轻歌手的直播,化身好奇宝宝地老黄还还点播了一首 Lady Gaga 的歌,跟着唱了起来。 去年,英伟达市值飙升至万亿市值的前夕,黄仁勋却跑到了台北夜市,拎着一袋麻花到处闲逛,此时的他也许想到的是项羽的那句感叹吧:富贵不归故乡,如衣绣夜行,谁知之者。 今年6月18日,美国金融圈,发生了一件大事,英伟达的股价一天内上涨了3.6%,市值飙升至了3.34万亿美元,一举超过了微软和苹果,成为全球市值最高的上市公司。 虽然几天后,股价又出现了回调,但无疑的一件事是在AI当道的今天,英伟达绝对是全球科技企业中最风光的一个。 以至于英伟达CEO黄仁勋在采访中可以毫不避讳地说道「我们就是AI世界的发动机」。 黄仁勋这话也绝对不是在吹牛皮。生成式AI、自动驾驶、加密货币、元宇宙,这些风口上的科技,背后都离不开英伟达所生产的显卡的支持。 出生于台南的黄仁勋,今年6月访台时,在科技圈掀起了一阵现象级的追星热潮。16年前,黄仁勋对显卡行业做出的大胆预言现已精准实现。 如今他又说了哪些预言,给了年轻人怎样的忠告呢?为什么他会说台湾站在这场新的工业革命、AI革命的中心呢?今天我们来聊聊这位AI教父的故事。 1963年,黄仁勋出生于台南。9岁时,他和哥哥被送往美国亲戚家,由于亲戚家的居住条件有限,初到美国的日子,他和哥哥是在肯塔基州的一所寄宿学校里度过的。 这所学校的优点是学费便宜,缺点是生源混杂,有不少问题少年,黄仁勋后来回忆道:「我是学校里唯一没有折叠刀的男孩。」 几年后,黄仁勋的父母终于获准来到美国,定居在俄勒冈州,兄弟俩与父母团聚。 高中期间,黄仁勋表现出了华人小孩的两大特点:成绩优异;有运动才能。 他参加了学校的数学、计算机和科学俱乐部,跳了两级,16岁就高中毕业了,15岁还拿到了乒乓球比赛全美双打第三名。 后来,黄仁勋进入俄勒冈州立大学(OSU),攻读电子工程专业。1984年,又进入斯坦福大学读硕士。 在大学实验室里,黄仁勋遇到了未来的妻子洛瑞·米尔斯Lori Mills。 据黄仁勋回忆,当时电子工程专业有250个学生,但只有三个女生,男生们争相吸引洛瑞Lori的注意,但黄仁勋却凭借一句「你要看我作业吗?」成功俘获了女神的芳心。 靠着教Lori功课的名义,黄仁勋顺利与其交往并结婚,相伴至今,两人还育有两个孩子。交往时,Lori曾问黄仁勋,你将来想做什么? 黄仁勋说道「30岁时,我将会是一家公司的CEO」。 所以有人开玩笑说,英伟达的诞生就是黄仁勋为了兑现当年在女友面前吹下的牛。 大学毕业后,黄仁勋曾先后在芯片公司AMD和LSI Logic工作过,获得了丰富的技术经验。 1993年,30岁的黄仁勋与另外两名志同道合的工程师好友克里斯·马拉科夫斯基Chris Malachowsky和柯蒂斯·普里姆Curtis Priem共同创立了英伟达公司。 三人最初是在黄仁勋家附近的一家叫做Denny’s的连锁餐厅里,讨论创业方向的,那里有可以免费续杯的咖啡,他们一坐就是四五个钟头。 有意思的是,80年代时,上大学的黄仁勋曾在这家店里打工,他刷了无数的盘子和杯子。后来,他常常自我调侃说,我应该是Denny’s最棒的洗碗工了。 不过,罗马不是一天建成的,英伟达走向巅峰的路上也曾九死一生。 九死一生创立之初,黄仁勋在前东家的帮助下,拿到了红杉资本和萨特·希尔资本各100万美金的投资。 当时正处于PC革命爆发之前,Windows 95 还没上市,但黄仁勋已经看到了3D游戏市场的巨大潜力 他预想PC时代到来后,全球各地的游戏玩家们,人手一台游戏机,联机打怪,在虚拟世界中,体验3D游戏带来的超强视觉冲击。英伟达决定将产品聚焦于图像处理领域。 1995年5月,英伟达推出了他们的第一款产品---显示芯片NV1,当时还没有显卡的概念 这款产品又被称作「多媒体加速器」,在技术上整合了2D和3D图形处理,并具备视频处理、声卡、游戏端口等功能,算是市面上比较先进的产品。 但由于其不菲的定价,NV1的销量一直低迷,唯一的好消息是,NV1集成了声卡的功能引起了日本游戏巨头世嘉的注意 世嘉希望英伟达为他们的新款游戏机研发显示芯片NV2,并甩出了一张700万美金的订单,英伟达一时间干劲十足。然而,NV2的研发很快惨遭碰壁。 当时3D图形处理技术方兴未艾,业内并没有统一的标准,大家走的技术路线都不一样,英伟达选择的是「四边形纹理贴图」。 但1995年底时,业内已有风声传出,微软将发布与Windows 95兼容的Direct 3D标准,该标准将只支持「三角形纹理贴图」。 可英伟达并未在第一时间意识到外部环境的变化,依然执着于「四边形纹理贴图」的路线。 这就等于自动舍弃了Windows电脑的市场,要知道90年代Windows操作系统在PC市场上拥有超过90%的市场份额,这意味着NV2就算研发出来了也无法投入使用。 等黄仁勋意识到问题的严重性时,公司账上的钱只够维持30天了,人员也从100多人裁到了只剩三分之一。 万般无奈之下,黄仁勋硬着头皮找到了世嘉社长入交昭一郎,坦白地承认了英伟达的研发方向错了,让世嘉抓紧时间更换合作伙伴 但同时说道英伟达还是希望世嘉能够支付700万美金的定金,因为如果没有这笔钱,英伟达就要破产了。 可天下哪有这样的好事:你东西没给我研发出来,耽误了我的时间不说,还要我给你付钱? 说出来大家可能都不信,入交昭一郎还真就答应了黄仁勋的请求。 后来,据入交昭一郎所说,他对黄仁勋的印象很好,觉得黄仁勋是个真诚又充满激情的年轻人,相信他未来一定能成功,并愿意在他困难时,拉他一把。 也许这就是所谓的「人格魅力」吧。 拿到700万美金的英伟达逃过了「30日生死劫」,黄仁勋迅速调整研发方向,采用微软的Direct 3D标准,并从游戏设计公司「晶体动力」挖来了大卫·柯克David Kirk博士担任首席科学家。 1997年4月,英伟达第三代产品NV3即Riva 128正式推出,凭借着其100M/秒的像素填充率成为了当时市面上唯一真正具有3D加速能力的显示芯片。 不到一年,Riva 128的出货量就突破100万片。英伟达终于脱离险地,活了下来。 此后,黄仁勋偶尔还会将30 days挂在嘴边。 NV2的研发失败给黄仁勋好好上了一课,让他明白,想要在竞争中生存下来就要向市场学习,要足够谦逊,而且要懂得及时纠错,绝不把时间浪费在悔恨上。 1998年,英伟达与台积电达成战略合作,将其产品交付台积电生产,自己则专注于研发。此后数十年间,黄仁勋与台积电创始人张忠谋也结下了深厚的情谊。 但英伟达真正的翻身仗,还要属1999年8月推出的革命性产品GeForce 256。 GPU的发明者1999年8月,英伟达发布了Geforce 256,并首创了图形处理器GPU(Graphics Processing Unit)一词。 此后,英伟达就把自己和「GPU发明者」这个头衔深度绑定起来,不得不说这是非常聪明的一步棋。 彼时的芯片市场是英特尔的CPU所称霸的世界,英伟达想要杀出一条血路,就必须另辟蹊径,于是他们就想到了营销GPU这一概念。说到这儿,就不得不讲讲CPU和GPU的区别了。 CPU的全称是Central Processing Unit中央处理器,可以被认为是计算机的心脏,负责处理大部分指令,擅长逻辑控制和复杂的运算。 CPU的架构包括运算器ALU(Arithmetic/Logic Unit)、控制器(Control Unit)、缓存(Cache)等等 由于需要应对不同类型的数据计算,还要响应人机交互,CPU需要更大的缓存,保存各种任务状态,以降低任务切换时的时延。 它也需要更复杂的控制器,进行逻辑控制和调度。 相对而言,真正干活的运算器ALU,也就是我们俗称的「核」,就被挤得占比较少了。 而90年代中后期,蓬勃发展的游戏和多媒体产业,对计算机的3D图像处理和渲染能力提出了更高的要求,传统CPU就有点不堪重负了。 GPU的出现就是为了分担CPU处理图像的工作重担的。 从它的名字图形处理器Graphics Processing Unit中就可以看出,GPU的任务单一且明确,它要做的,就是图形渲染。 而图形是由海量像素点组成的,属于类型高度统一、相互无依赖的大规模数据,所以GPU就被设计成了擅长大规模并发计算的架构,需要在在最短的时间里,完成大量同质化数据的并行运算。 并行运算,当然需要更多的「核」了,又因为其它的「杂活」少,GPU就不需要特别大的缓存和复杂的控制器。一般而言,CPU的核数也就几十个,GPU的核数可以达到几千个甚至上万个。 业界喜欢把CPU比作几个学识渊博的老教授,什么复杂的任务都能做,但得一项一项来。 而GPU就像是一大群小学生,虽然只能做加减乘除,但架不住人多力量大,你要是需要计算一亿次100以内的加减法,想想也知道,最好的办法肯定是雇一大帮小学生一起算。 英伟达曾发布过一支视频,形象地解释了CPU和GPU在处理图形上的区别。CPU就像是一把精准的机关枪,但子弹需要一发一发的射出来。而GPU是成千上万发子弹同时射出的。 GPU是为图形处理而生的,但歪打正着,在深度学习当道的今天,用于处理海量训练数据也能事倍功半,这正是英伟达称霸AI芯片市场的原因,不过这都是后话了。 英伟达在推出Geforce 256的同年年初,在纳斯达克成功上市,IPO价格为每股12美元,估值6.26亿美元,现如今英伟达的市值已超过了3万亿,涨了4800倍。 一直以来,英伟达就在干一件事:设计和研发GPU。如今,我们常常将GPU称为「显卡」,但其实确切地说GPU 是显示卡的芯片,也是显卡的「心脏」。 而显卡是把GPU、显存、接口等部件集合在一起的计算机扩展卡。 英伟达只出货GPU,也就是显卡的心脏,而显卡的生产则交给了刚才我们提到的全球第一家也是最大的一家集成电路代工制造商台积电TSMC。 在台积电生产力的加持下,黄仁勋提出了与「摩尔定律」并称的「黄氏定律」。 摩尔定律是英特尔创始人之一的戈登·摩尔在1965年提出的,核心内容为:集成电路上可容纳的晶体管数目在每过18个月到24个月会增加一倍,即每隔2年,CPU的性能会翻一倍。 而黄仁勋则说,GPU的发展速度将远远快于CPU。英伟达的核心战略就是产品将每6个月升级一次,性能翻一番。 多年前,黄仁勋在接受采访时被问到,英特尔也即将推出聚焦于图形处理的产品,英伟达会不会感到有压力? 黄仁勋问,英特尔的新产品什么时候问世啊?现场观察员说,2010年年底,黄仁勋惊讶地说道,这么久啊,言外之意是,到时候英伟达的产品早就更新换代了好几次了。 我们都知道,显卡根据形态可以分为集成显卡(iGPU,integrated GPU)和独立显卡(dGPU,discrete GPU)。 集成显卡内置于CPU中,与CPU共享内存。独立显卡则是一个独立的个体,有单独的显存,可以直接加装到电脑主板上。 英伟达专注于独立显卡市场,而在该领域,ATI曾是英伟达最大的竞争对手。用户们常把搭载英伟达GPU的显卡称为「N卡」,把搭载ATI GPU的显卡称为「A卡」。 ATI是一家加拿大公司,比英伟达早成立8年,90年代末开始进军独立GPU领域。2000年,ATI发布了继Geforce 256之后第二款真正的GPU——Radeon 256。 其性能较英伟达的Geforce 256更优。此后的多年里,英伟达和ATI一直处于缠斗的状态,2004年到2005年间,ATI的市场占有率甚至一度超过英伟达。 转折出现在2006年7月,CPU市场上仅次于英特尔的第二大供应商AMD,以54亿美元的价格收购了ATI,A卡上的标志从ATI换成了AMD。 黄仁勋听到这个消息后说道「ATI 这是打算认输了,让我们成为世界上唯一一家独立的图形芯片公司吧!」 曾有AMD的离职员工爆料称,AMD最初是打算收购英伟达的,但黄仁勋坚持在公司合并后,依旧由自己担任CEO,最终AMD退而求其次,选择了英伟达的对手ATI。 事实证明,黄仁勋的坚持再次帮了他,为了收购ATI,AMD几乎用光了账面现金,并产生了25亿美元的债务。 因为债务危机,二者的合并没能出现1+1大于2的「合力」,反倒让英伟达捡了个大便宜,趁机重新找回了市场竞争力。 虽然整合完ATI之后,AMD也发起过数次反攻,但大势已去,昔日「独显双雄」的局面早已一去不复返。 2007年之后,英伟达在独立GPU市场的占有率一直遥遥领先于AMD。 一个题外话是,在英伟达与ATI、AMD缠斗的那些年里,黄仁勋还意外喜提了「两弹元勋」的称号。 2010 年 12 月,AMD 推出了高端显卡 HD6900 系列,迫于竞争压力,三个月后,英伟达就推出了对标产品GTX590显卡。 GTX590性能强悍自不用说,但发热量和功耗也是高的吓人的。喜欢搞机的朋友,买了新显卡之后,又偏偏爱玩超频。 所谓「超频」就是让芯片在高于厂方所设定的工作频率的状态下工作,从而提高它们的性能。 结果就是,超频之下,GTX590竟然起火了,运气不好的玩家,连同CPU、内存、主板和电源也一起报销了,此后GTX590就被网友们戏称为「核弹」。 之后推出的GTX690,GTX790,虽然功耗有所改善,但网友们仍然对其发热不满意,还将GTX690戏称为「战术核显卡」。 本来这只是显卡圈儿里的一个梗,但不知道哪个有才的网友,把这个「核显卡」的梗写进了国内的百度百科。 更搞笑的是,2014年,甘肃卫视制作的一档军事节目直接引用百度百科的文案,连资料的正确性都没有核实,主持人就这么一本正经的说出了以下这段话 搭载690战术核显卡的火箭推进榴弹,一发就可以摧毁一个航母战斗群。 显卡圈最大的名场面就这么诞生了,从此,英伟达核弹厂名声算是坐实了,CEO黄仁勋更是被冠上了「两弹元勋」的称号。 网友们做了一系列的表情包来调侃老黄,再加上英伟达早期曾推出过Riva TNT系列显卡,驱动的名字叫雷管(Detonator),这似乎更加印证了老黄是个做军火的。 插曲讲完了,我们回归正题。2006年,AMD收购ATI的同一年,英伟达发布了CUDA架构,这成为了它迈向巅峰的重要一步。 划时代的CUDACUDA的全称是Compute Unified Device Architecture,是英伟达为GPU设计的一种并行计算平台和编程模型 它使开发人员能够使用C语言,C ++,Fortran等编程语言直接在GPU上编程。 这么说,大家可能很难理解CUDA究竟是个什么东西,我换一种说法吧。 CUDA出现之前,GPU只是一个负责在屏幕上绘制图像的「图形处理单元」;有了CUDA,GPU的算力真正变得通用 因为不同领域的开发者用可以他们已经熟悉的编程语言在GPU上编程,驱动GPU完成不同的计算任务。 GPU如今能被广泛应用于深度学习、大数据处理、挖矿等领域,全靠CUDA的支撑。 英伟达决定开发CUDA的契机,说起来也相当有意思。 早在2000年时,斯坦福大学计算机系的一位研究生伊恩·巴克Ian Buck将32块GeForce显卡连接在一起,外加 8 个投影仪来玩游戏《雷神之锤》(Quake)。 GeForce显卡附带了一种叫做「着色器」(shader)的原始编程工具。 伊恩Ian Buck黑进了着色器,访问了下面的并行计算电路,将几十个GeForce改装成了一台低成本的超级计算机。 伊恩Ian Buck说,这是世界上第一台8K分辨率的游戏机,它占据了整面墙,看起来棒极了。这一事件让英伟达意识到了GPU在超级计算领域的巨大潜力。 英伟达首席科学家大卫·柯克David Kirk认为,从长远看,让原本只做3D渲染的GPU技术通用化,有重大战略意义。 后来,Ian Buck入职了英伟达,现在是英伟达的一名副总裁了。 决定启动CUDA项目后,英伟达每年砸到CUDA上的研发成本至少5亿美元起步 这些年,英伟达在将GPU转化为更通用的计算工具上投入了将近100亿美元,反映在账目上就是成本增加、利润率降低,甚至亏损。 黄仁勋要让每一颗英伟达GPU都支持CUDA,但这意味着芯片面积增大、散热增加、成本上升、故障率增高 这一举动在当时被外界视为不计成本的疯狂之举,更何况,CUDA只是一个与公司核心业务关系不紧密的项目。 即使黄仁勋苦口婆心地阐述CUDA的价值,但华尔街的分析师们并不买账,要知道,并不是所有人都像黄仁勋一样具有前瞻性眼光,华尔街甚至将CUDA估值为0。 投资人也都觉得「你一家游戏显卡公司为啥要花钱去做梦呢」。 2008年,英伟达还经历了「显卡门危机」,G84、G86系列显卡由于存在封装缺陷,导致装有这些显卡的笔记本电脑无法启动,或启动后出现黑屏等现象 客户和投资人们对英伟达的不满上升到了极点。那一年,英伟达的市值蒸发了76.3%。 直到2012年,事情发生了转机。在之前AI简史的那期视频中,我们讲到了人工智能的发展曾2次陷入低谷。 2012年,「深度学习之父」杰弗里·辛顿教授带着他的两位学生亚历克斯·克里热夫斯基和伊利亚·苏茨克韦尔兹参加了全球最权威的计算机视觉大赛ImageNet大赛 他们设计的深度卷积神经网络AlexNet以压倒性的优势夺得了冠军,此事件标着这一直持续至今的连接主义学派(connectionism)人工智能研究热潮的复苏。 对AI的发展历程好奇的朋友,还请回看之前的视频。 而辛顿团队训练AlexNet模型时,用的就是两块双GPU的GTX580显卡。 AlexNet有6000万个参数和65万个神经元,完整训练ImageNet数据集至少需要262千万亿次浮点运算 但4个英伟达GPU在一个星期内,就完成了训练,如果用同样数量的CPU,训练时间可能长达1-2年。 2012年早些时候,谷歌团队曾用1.6万个CPU训练了一个可以「识别猫」的神经网络,但准确度却远比不上只用了4个GPU训练出来的AlexNet模型。 辛顿学生亚历克斯所写的描述AlexNet的论文在此后十几年前被引用了超过13万次,成为了计算机科学史上最有影响力的论文之一。 可以说是深度学习算法和GPU的算力一拍即合,引发了人工智能大爆炸的时代。 辛顿说:「用专门的GPU训练神经网络速度要比通用CPU快100倍」,然后又补充说道「如果没有CUDA,要进行机器学习就太麻烦了!」 一夜之间,英伟达从一家图形公司摇身一变,成了一家为人工智能的发展提供引擎的公司,昔日不受待见的CUDA成了新时代的宠儿。 2016年8月,英伟达向一家初创公司捐赠了第一台装载了8块GPU的专用于人工智能领域的超级计算机DGX-1,价值12.9 万美元。 黄仁勋在机身上留下了一句话:「为了计算和人类的未来,我捐出世界上第一台DGX-1。」 这家初创公司的联合创始人艾隆.马斯克Elon Musk、山姆·奥特曼Sam Altman以及一众早期员工也激动地在机身上签下了自己的名字。 6年后的2022年11月,这家初创公司发布了ChatGPT,一鸣惊人,没错这家公司就是Open AI。 ChatGPT发布一周后用户破百万,两个月后用户数破亿,英伟达芯片的市场需求也随之开始暴增。 英伟达与Open AI之间的故事乍看之下是一段「投桃报李」的缘分,但细想,何尝又不是黄仁勋对于AI领域的提前押注呢。 其实早在2017年时,英伟达还曾被天上掉下的另一块大馅饼砸中过。 2017 年,加密货币迎来大牛市,吸引了大量矿工「挖币」,挖比特币需要「矿机」,而矿机运行依赖的哈希算法需要算力,英伟达的GPU正是算力的来源。 全球显卡销量急剧增加,价格也水涨船高。以最受矿工欢迎的GTX 1060型号显卡为例,2017 年 5 月之前的拿货价约为 1650 元一张,2017 年 6 月后就涨到了 2900 元左右。 英伟达后来还推出了多款取消IO输出接口的GPU,仅支持OpenGL,这意味着此类GPU没法用于游戏,业内人士将这类GPU称为「专业矿卡」。 受益于挖矿潮,英伟达的 2018 财年全年收入创下了 97.1 亿美元的新高, 成为了加密货币大牛市背后的大赢家,天降财富。 如今,英伟达的市值(3.02 trillion USD)是腾讯(3.52 trillion HKD)的6.7倍、台积电(25.39 trillion TWD)的3.8倍,英特尔(132.26 billion USD)的22.8倍, AMD(265.58 billion USD)的11.3倍。 虽然纵观整个GPU市场,英特尔依旧占有百分之六、七十的市场份额,但这是因为大分部英特尔CPU都内置了相应的集成GPU(iGPU)。 在利润丰厚的独立GPU市场,英特尔几乎没有话语权。截止到2023年底,英伟达GPU在独显市场中占比80%,AMD占比19%,英特尔占比1%。 如果单把AI GPU市场拎出来看,英伟达的产品占比甚至达到了98%。 据投行瑞杰金融的估计,每枚英伟达H100 AI芯片的制造成本是3320美元,而售价是25,000至30,000美元,也就是说英伟达AI芯片的利润率逼近1000%,但依旧供不应求。 2024年3月,英伟达重磅推出了Blackwell B200 GPU 和 GB200 超级芯片。Blackwell系列芯片的名字来源于数学家、博弈论家、概率论家 大卫·布莱克威尔。 英伟达高级科学家 Jim Fan称其是「新的性能野兽」。Blackwell B200 GPU拥有 2080 亿个晶体管,性能达到了 H100 的 2.5 倍。 GB200 超级芯片更是将2个GPU 与一个CPU相结合,在具有 1750 亿个参数的 GPT-3大型语言模型(LLM) 基准测试中,GB200 的性能是 H100 的 7 倍,训练速度是 H100 的 4 倍。 OpenAI CEO Sam Altman 在看完英伟达新品发布会后,在推特上发文称「这是人类历史上最有趣的一年,但会是未来最无趣的一年。」 3D游戏、加密货币、人工智能,英伟达一次次地踩中风口,成就了它如今AI霸主的地位。这其中当然有运气的成分,但黄仁勋的前瞻性眼光也是毋庸置疑的。 16年前,在一档访谈节目中,主持人将芯片行业的格局比作了「三国演义」,英特尔是曹操,AMD是刘备,英伟达是孙权,并问黄仁勋同意这个划分吗? 黄仁勋表示,「20年之后的世界是现在的我们无法想象的,你现在提到的几个巨头可能都不会在未来继续搅弄风云。 如果以狭窄的眼光看待世界,那么你的战略部署也必将是狭窄的」。 8年前,黄仁勋也曾预言,很快AI将掀起浪潮。那么如今这位AI教父对未来又抱着怎样的看法呢? AI教父的预言2023年3月,黄仁勋先是喊出了那句振奋人心的「AI的iPhone时刻已经来临」 几个月后,黄仁勋接受了知名未来学家瑞安·帕特尔Ryan Patel的采访,采访中,黄仁勋表示 「这是人类第一次看到通用计算和AI两种技术转型同时出现,算力的进步结合深度学习的发展,将会带来1+1大于2的效果,甚至会让计算技术每10年进步一百万倍。 2年后,英伟达乃至整个行业就会面目全非」。 2024年3月初,黄仁勋在母校斯坦福大学举办的一场活动上预测说,AI将在五年内通过所有人类测试,包括数学测试、推理测试、历史测试、生物学测试、医学考试、律师考试,以及你能想象到的每一个测试 届时你可以说AI已经拥有了人类的智慧,AGI时代将全面到来。 这与我们在之前视频中扒出的一份、据说是从Open AI内部泄露的文件「Q*信息」的内容高度一致。 「Q*信息」也声称2027年将会出现可以执行通用任务、可以像人类一样思考和学习,具有自主意识和情感的「通用人工智能」(Artificial General Intelligence)。 不久前,在台北举办的国际电脑展(COMPUTEX 2024)上,黄仁勋发表了一场主题为「开启产业革命的全新时代」的演讲。 演讲中,黄仁勋对未来AI的发展做出了展望,我将其归纳为了3大预言。 第一,未来全球AI产业规模将高达100万亿美金,比之前IT时代的3万亿美元高出33倍以上,具有强大的市场前景。 第二,未来个人电脑,也就是PC,才是AI的主要载体,AI应用程序将充斥每个人的生活。第三,实体人工智能将融入我们的日常生活,AI将理解这个物理世界,机器人将无处不在。 黄仁勋还曾表达过一个观点是,未来首先消失的职业可能就是「程序员」了。 在过去20年间,几乎所有教育界、科技界大佬们都在不断强调学习计算机科学和编程的重要性,但黄仁勋的却说 「事实上,真相几乎完全相反。在人工智能的帮助下,未来每个人都可以成为程序员,人类的自然语言就是编程语言。」 黄仁勋认为年轻人应该更专注于学习生物、教育等AI所无法完全替代人类的领域的知识。在以往的不少演讲中,黄仁勋留下过无数给年轻人的宝贵建议。 在 2024年斯坦福大学经济峰会(SIEPR)上,当被问到「关于成功,有什么给斯坦福学生的建议」时 黄仁勋说,「我觉得我最大的优势之一就是我的期望很低,但是大部分斯坦福毕业生都对自己有很高的期望,当然了,你们也绝对配得上高期望,你们来自世界上最好的大学之一,成绩拔尖,是同辈中的佼佼者。」 但黄仁勋接着说道「对自己期望非常高的人,往往韧性(resilience)也低,不幸的是,韧性对成功来说至关重要。」 黄仁勋强调,「成功不是来自于智慧,而是来自于品格,而品格是在苦难和挑战中磨砺出来的。我希望年轻人有机会经历大量的痛苦和磨难。」 2023年5月,黄仁勋受邀在台大毕业典礼上致辞。 3年前,黄仁勋被授予了台大名誉博士的学位,致辞中,黄仁勋讲述了他创业过程中经历的3次低谷:NV2的研发失败;CUDA的饱受质疑;以及退出手机芯片市场。 他想借由这三件事告诉即将踏入社会的台大学子3个道理:1)困境中,要懂得谦卑地寻求帮助。 2)要实现长远的愿景,就要有承受近期苦难的能力。 3)有时候「放弃」也是一种智慧,有舍才能有得。 最后,黄仁勋用这样一句话结束了他的致辞:「跑起来,别用走的!为了寻找食物而跑,或者为了避免成为猎物而跑,无论为了什么都要跑起来。」 作为一名台南出生的企业家,黄仁勋对台湾有着特殊的感情。他曾在硅谷的一个台湾同乡聚会上说道「这场新的工业革命、AI革命,台湾就在中心,台湾所做的工作非常重要。」 在刚刚结束的台北国际电脑展(COMPUTEX 2024)上,黄仁勋也表示,「台湾是英伟达开始的地方,是台湾的合作伙伴们创造了世界级的AI基础架构」。 黄仁勋会有这样的感慨,并不是没有理由的。与英伟达合作了近30年的台积电,是全球最大的芯片代工企业。黄仁勋曾不止一次的在公开场合提到台积电对英伟达的帮助。 90年代末,英伟达研发RIVA 128芯片,由于生产的复杂性,他们急需一家专业的代工厂来辅助他们,他找遍了美国的代工企业,但没人理会他们这个初创小公司。 最后是台积电的张忠谋向黄仁勋伸出了援手。接到张忠谋电话时,黄仁勋立刻对旁边的人大叫道「嘘!大家都安静,Morris Chang打给我了!」 而这通电话就成了2家公司合作的开端。 成为科技圈新贵后,每次到访台湾,黄仁勋及其家人都会被大批粉丝和狗仔队跟随,而黄仁勋行事也相当亲民。 一次,他在台湾街头,偶然入镜了两位年轻歌手的直播,化身好奇宝宝地老黄还还点播了一首 Lady Gaga 的歌,跟着唱了起来。 去年,英伟达市值飙升至万亿市值的前夕,黄仁勋却跑到了台北夜市,拎着一袋麻花到处闲逛,此时的他也许想到的是项羽的那句感叹吧:富贵不归故乡,如衣绣夜行,谁知之者。 未来AI行业是否会一直沿着深度学习或者说连接主义学派的方向发展,还是一个未知数。 英伟达是否会一直站在行业巅峰也未可知 但无疑的一点是,老黄身上的特质正应了那句话:成小功可能是运气,成大功绝不会是偶然。
|