首页 > 业界新闻 > 详情

黄仁勋:曾被霸凌扫厕所,“熬出来”的图形芯片之王

导语


天不生我Jensen Huang,GPU界万古如长夜。




3月18日的GTC演讲上,已是花甲之年的黄仁勋头发花白,精神矍铄地用话语凿开技术的前路,勾勒出人类在超级GUP支持下以算力、AI与机器人编织而成的崭新未来。而台下,众多站在第四次工业革命最前端的从业者们不曾怀疑这名刚刚超越钟睒睒跃升为全球华人首富的CEO口中所述的一切。







因为在聚光灯下,黄仁勋那一如甲胄的黑色皮衣数十年如一日,在他背后,专注、忌妒与图形之眼正放射着科技的神光,名为英伟达(NVIDIA)的科技帝国方才迎着AI时代的强风获得了空前的增长,GB200GraceBlackwell超级芯片系统就是他最锐利的剑,2万亿美金市值已成为他最坚固的盾,在2080亿个晶体管铸就的高达20 PFLOPS的算力洪流冲刷下,众人知晓,英伟达已经登上了前往面见欧姆弥赛亚的通天长阶。







曾几何时,这家打造了GPU概念的公司只为电子游戏玩家所熟识,而如今它已经渗透进了现代社会的各个角落,成为推动人类数字世界发展的强大引擎。罗马成城非一日之功,冰冻三尺非一日之寒,黄仁勋作为英伟达的领导者,是如何一步步走到今天的?在那计算机的洪荒年代,他又是怎样开创属于GPU的崭新时代的?这一切,都要从中国台湾省的台南市说起。




01


台南囝仔,颠沛流离




1963年2月17日,台南市化学工程师黄兴泰与小学教师罗采秀夫妇的次子降生,黄兴泰为其起名黄仁勋。在那个年代,黄仁勋的家境其实算不上普通,父亲黄兴泰是台南成功大学化工系的优秀毕业生,早早便进入了知名的美国冷气制造商开立(Carrier)台湾分公司就职,母亲更出身于台南水仙宫的望族罗氏家族,这样的家庭条件,也是黄家能够移民海外的重要原因。




黄仁勋和父母




如果一直呆在台南,想必黄仁勋会度过一个富足且安逸的童年,但在黄仁勋五岁时,黄父决定举家迁居泰国以寻求更好的工作前景。然而事与愿违,上世纪60年代末的泰国政局动荡,东南亚整体的地缘状况也并不太平,越战的炮火正愈演愈烈,1973年10月14日“泰国学运”的爆发让黄父毅然决定将两个儿子送往美国,由刚刚移民美国的叔父叔母照顾。




在2010年接受BBC采访时,黄仁勋回忆道:“我当时还是个孩子,美国金碧辉煌,麦当劳、必胜客这样的餐厅令我惊叹。但我依然记得当时更多的是害怕和难过。”







和黄仁勋的感受相仿,美国的生活并未报黄氏兄弟以歌,那时美国种族歧视的烈度数倍于如今,刚刚移民的叔父母又囊中羞涩,黄仁勋只能进入肯塔基州奥奈达浸信会学院开始寄宿生活。黄仁勋的叔父似乎认为这所乡下的著名学校出类拔萃,但是实际上它是一所宗教管教学校,收容了很多问题儿童,至今仍是“世界上最便宜的十五所寄宿学校”之一。







“那里几乎所有学生都抽烟,而且我想我是学校里唯一没有带刀的男孩。”黄仁勋曾告诉《纽约客》的记者,“我的室友是个17岁的大孩子,刚刚出狱,在我入住第一晚就掀起衣襟给我看他身上鳞次栉比的刀疤。”




那时,奥奈达浸信会学校并没有为10岁左右孩子开设的课程,因而黄仁勋需要前往附近的公立学校上课,公立学校的孩子们大多来自周边贫困地区的贫困家庭,其中许多人的父母都是烟农,对于他们来讲,黄仁勋又瘦又小,父母远在天边,操着一口蹩脚的亚洲口音英语,是绝佳的欺凌对象。




在学校里,黄仁勋这些中国孩子被叫做“Chinks”“(侮辱性质和叫黑人“nigger”一个水平),不满十岁的他每天都要被迫打扫厕所。此外,一座跨越深涧、连木板都缺失的吊桥是他上学的必经之路,这段路也并不太平,当黄仁勋过桥时,当地的孩子总会疯狂摇晃吊桥,黄仁勋必须紧紧抓住那些脆弱不堪的护栏绳以防摔死。




今天奥奈达浸信会学院官网还展示着一座吊桥




在这样的环境下,黄仁勋不但没有消沉,反而展现出了惊人的韧性。




“我和我的室友达成了协议,他是文盲,作为教他读书的交换条件,他教我如何卧推。后来我每晚睡觉前都会做一百个俯卧撑。”黄仁勋说, “那时没有能寻求帮助的辅导员或者老师什么的,我能做的只有坚强起来,继续前进。”




而后黄仁勋也学会了偷东西、抽烟、打架,用他自己的说法是:“这不是学坏,而是入乡随俗、随机应变,环境不会来适应你。”




有句话叫读书是为了心平气和地和傻逼说话,健身是为了让傻逼和你心平气地和你说话。健康的躯体是健全精神的外在投射,虽然黄仁勋在奥奈达后续的细节不为人知,但能肯定的是他渐渐走出了被霸凌的境遇。







黄仁勋从未雪藏过儿时的这段经历,他曾公开表示,在奥奈达的岁月对他的人生至关重要,他在接受斯坦福的采访时说:“我认为我的一大优点是我对生活抱有的期望值很低,大多数斯坦福大学的毕业生都抱有很高的期望,也理应如此,因为他们来自一所很棒的学校,周围都是优秀的孩子,但期望值非常高的人,韧性(抗压能力)往往非常低,而韧性对于成功至关重要。对于一个人来讲,经历磨难是很重要的。”




弗洛伊德认为一个人的人格底盘在6岁时便已基本形成,个体心理学创始人阿德勒也认为童年时期对人整体性格的形成至关重要,黄仁勋被称为是“硅谷最好斗华人”,有人说黄仁勋能够成功靠的就是一股没来由的狠劲,或许正是亲历亚洲纷乱时局并早早孤身对抗来自外界恶意的童年岁月赋予了他出类拔萃的全球视野、洞见能力和抗压能力,不可否认的是,后来英伟达的道路颇为坎坷,一度濒临破产的边缘,正是这些内在力量支撑着他走到今天。




02


视觉之眼,启于餐厅




英伟达公司名称NVIDIA源自拉丁文词根Invidia,语义为忌妒、目不转睛,而LOGO正对应这个词语,更与公司核心业务图形芯片GPU相呼应,为一只眼睛,其代表着视觉感知、洞察与专注,象征着英伟达的品牌形象与核心价值。







一个众所周知的秘密是,英伟达诞生于一家名为Denny's的连锁餐厅,这家餐厅类似国内的老乡鸡,黄仁勋的第一份工作就是在这里当洗碗工。




洗碗工的工作黄仁勋干得也很不错,有才能的人到哪都能脱颖而出这句话说得就是他,黄仁勋入职不久便荣获餐厅的“最佳洗碗工”称号,并被提拔为勤杂工。同样在接受斯坦福采访时,他有些骄傲地说:“我制定工作计划,做事有条不紊,工作效率极其高,从未两手空空离开洗碗台,也从未两手空空回到洗碗台,那些盘子被我洗得干干净净。”







黄仁勋认为在Denny's的工作锻炼了他的交流谈判能力,培养了他的口条,由于常常要兼任服务生的工作,他见识到了形形色色的人,一改内向的性格,在后来代表英伟达进行商务谈判时,Denny's的生活让他受益匪浅,这也让黄仁勋对这家餐厅充满情怀。




“如果我一直在Denny's,或许会成为那儿的CEO。”




虽然这么说,但黄仁勋的天赋让他无法囿于洗碗槽前。随着父母成功拿到美国身份定居俄勒冈州,黄仁勋得以进入一所正常的高中学习,在正常的校园环境中,黄仁勋逐渐崭露头角,他不仅在高中连跳两级,活跃在计算机、数学社团,还是全美都排得上号的高中乒乓球运动员(种族天赋)。16岁时,黄仁勋以优异的成绩进入俄勒冈州立大学,主修电气工程,他选择那里的主要原因也是因为学费便宜,但在俄大,他遇到了一生的爱人Lori Mills。







毕业后,黄仁勋先进入AMD担任微芯片设计师,后来来到了LSI Logic,在LSI Logic的工作中,他结识了时任Sun Microsystems Inc.(以下简称SunSoft)工程师、后来成为英伟达联合创始人的Chris Malchowsky和Curtis Priem。







上世纪八九十年代,除了 IBM 之外,很少有公司有能力制造自己的芯片。两位联合创始人所在的SunSoft是高端计算机生产商,而黄仁勋所在的LSI Logic 专门生产半导体,SunSoft那时正冒险为他们的计算机制造芯片,黄仁勋就作为合作工程师被派到了Chris手下工作。




彼时,大多数公司专注于开发的芯片是中央处理器(CPU)这种执行输入计算机的命令的通用芯片。但在 90 年代初,三人被委派的任务是构建更具挑战性的东西,一种可以与 CPU 一起插入 SunSoft 工作站以在屏幕上渲染图形的芯片,距离英伟达开创所谓图形处理器(GPU)的概念还有一段时间。




黄仁勋三个人开始构建这个图形子系统,但事情并不顺利,SunSoft很快对这种系统失去了兴趣,两C主导的架构被上层放弃,二人打算离开公司自立门户,并向黄仁勋抛出了橄榄枝。







黄仁勋起初并没有和他们出来单干的打算,他在接受红衫资本采访时表示:“我那时有孩子要养,工作稳定、薪酬也不错,晚上还要去斯坦福完成我的硕士课程,更别提我们三个凑一块儿根本不知道要做什么,所以我准备维持现状。”(看来东亚人追求稳定是刻在骨子里的)




然而双C不打算放过这个才华横溢的年轻人,在他们的死缠烂打下,黄仁勋决定先和他们商量出一条可行的道路。于是三位人在保留现有工作的状态下开始“密谋”单干事宜,聚会地点就是位一家于东圣何塞国会大厦与贝里艾萨区拐角的Denny's餐厅。




因为曾在Denny's工作过的黄仁勋知道Denny's的咖啡可以无限续杯,他们每次去都点一份最便宜的“大满贯”套餐,然后一座就是半天,续上十几次咖啡。







黄仁勋最初确定的原点,是要进入一个“目前市值还是0的市场”,这与黄仁勋恪守的人生哲理不无关系,黄仁勋一直认为,如果要创造不同,就需要创建属于自己的道路,而不是重复别人的老路。




在英伟达的酝酿阶段,计算机的图形功能、多媒体功能基本还不存在,基本上只能算是一个文本终端,而个人计算机市场朝阳初升,普及化就在眼前,进入这个市场是最佳选项。




但我们的三位创始人还没有一个人使用过个人计算机,更别提Win系统或者DOS系统的语言编写了。所以事业开始的第一步是,黄仁勋跑去买了一台Gateway 2000个人电脑,他们将这台电脑拆了个精光,开始了解个人计算机行业。




Gateway 2000




1993年,出于对电子游戏的喜爱,结合曾经的工作经验,黄仁勋等人决定为个人计算机提供更好的图形塑造方案,那时计算机 2D 图形市场已经非常拥挤,遵循“从零开始”的原则,他们决定打造真正的3D 图形芯片。




最初,黄仁勋他们的公司名字是“Nvision”,代表产品指向“Next Version”下一代,但很快黄三人发现有许多公司都叫这个名字,包括一家造卫生纸的,后来,由于三人共同的愿望都是想要公司成为令所有同行羡慕的存在,指代妒忌envy的拉丁词语Invidia便成为了公司的新名称,而绿色的图视之眼的设计来源或许是莎翁戏剧《奥赛罗》中:“啊,主帅,您要留心嫉妒啊;那是一个绿眼的妖魔,谁做了它的牺牲,就要受它的玩弄。”的台词。




总之,LSI Logic 的负责人 Wilfred Corrigan将黄仁勋介绍给了红衫资本的创始人Don Valentine,并从他那里获得了启动资金,30岁的黄仁勋和Chris Malchowsky、Curtis Priem一起签下了英伟达的创始文件,翠绿的眼瞳随之在Denny's初次睁开,一语成谶的是,正如这家公司名字的词源,它在今天的确成为了让世界同行无比羡慕的对象。




但是另一个一语成谶是,Don Valentine在给钱的时候警告黄仁勋:“如果你把我的钱赌输了,我会杀了你。”




03


历经坎坷,终登王座




和任何初创公司一样,英伟达起步就掉进了大坑,首先的问题是逐渐拥挤的市场环境,早在 20 世纪 80 年代,市场上就已经涌现出了大量芯片公司,比如Xilinx、Altera、Cirrus Logic 和 Chips and Technologies。




其次是英伟达最初选择的目标受众和芯片的预期用途。




那时,高超的计算机3D图形芯片的应用空间十分狭窄,基本只服务于电子游戏领域,英伟达的对象市场也是电子游戏产业。游戏市场依旧是家用电子游戏机的天下,虽然天才程序员约翰卡马克的Id Software已经在DOS平台上研发出了市场反响非常好的3D游戏《基恩指挥官》和《德军总部3D》,但PC游戏市场依旧几乎可以忽略不计。




德军总部3D




盘子小、竞争激烈的市场让英伟达的起步步履维艰, 更别说黄仁勋还在一开始完全选错了技术方向,当时包括因特尔在内,许多英伟达的竞争对手都在使用逆纹理映射的三角形基元建构多边形,但黄仁勋决定反其道而行,使用自研的四边形、即前向纹理映射和曲线技术(QTM)。




1995年,微软Win 95逐渐取代Linux和DOS系统成为当之无愧的主流操作系统,伴随他的是名为DirectX的API,可以说那时除了英伟达以外,几乎所有的公司都在使用它,而它仅支持三角形渲染,这无疑给了英伟达一记沉重的打击,直接导致了英伟达推出第一款产品NV1出道折戟,哪怕它同时具备2D和3D图像处理能力,还集成了音频处理功能。




世嘉的《VR战士》是首款应用在英伟达显卡上的3D游戏




黄仁勋本人后来形容NV1像是一只章鱼,因为它有3D图形、视频处理、音频波表处理、IO口、游戏口,用户将他链接到电脑上就要花费大功夫,市面上也没有几个它专门支持的应用程序,的确是“一款糟糕的产品”。




NV1的失败让英伟达几乎破产,大量零售商将滞销的NV1退回给英伟达,英伟达成立三年后,图形芯片公司数量由24家暴涨至70家。黄仁勋在那时不断质问问自己,为什么世界需要英伟达?为什么世界需要另一家图形芯片公司?




在错误决策的阴影下,愈发恶化的财务状况让黄仁勋不得不开始裁员,1996 年,黄仁勋解雇了英伟达一半以上的员工。团队人数从百人锐减到二三十人。




在这一生死存亡关头,拯救了黄仁勋的是当时英伟达的合作伙伴世嘉,世嘉之前因为QTM技术与英伟达建立了合作关系。虽然NV1失败了,但世嘉依旧让英伟达继续为它研发图形芯片NV2,然而正如上文所说的,承袭自NV1架构的NV2同样偏离于主流的图形API标准,黄仁勋认为如果背离市场一意孤行,英伟达只有破产一条路能走了。




NV2




黄仁勋选择直接走进当时世嘉CEO入交昭一郎的办公室,告诉他NV2的项目行不通,英伟达准备从头重新开发一款新的图形芯片,因为世界已经选择了逆渲染、逆纹理映射的方法,QTM无论再如何独树一帜,都无法与市场选择相抗衡。此外,那时英伟达的启动资金基本已经烧了个精光,仓库里堆积如山的NV1都成了废铁,为了破局,黄仁勋向入交提出了一个离谱的要求:他希望世嘉能解除与英伟达早先的合同,并预先支付开发费用。




让人难以想象的是世嘉居然同意了,并在之后陆续向英伟达支付了大约500万美元。黄仁勋自己也摸不着头脑,他曾就此事说:“当时世嘉完全没有理由这么做,这事对他们来说完全没有任何好处,但他们还是这样做了。我只能说,当我们创办公司时,绝不能低估来自他人的善意。”




1997年,借由世嘉的这笔资金,英伟达孤注一掷打造的RIVA 128 面世了,在这款传奇产品上线前,黄仁勋和员工调笑道“我们公司还有30天就倒闭了”,然后和愁眉苦脸的员工一起当运货工,把RIVA 128运往零售商那里。那时英伟达的全部资金只够再支付一个月的员工工资。




但好在,四个月内,RIVA 128狂销 100 万颗 。







RIVA128能火并不奇怪,它支持AGP 1x规范,有着极佳的兼容性,可以配合Intel的LX芯片组主板使用。性能方面,RIVA128的像素填充率达到了100Mpixel/s,整体性能已经几乎持平3dfx当时著名的Voodoo,在非GLIDE API的游戏中,RIVA 128更能够完全超越3dfx Voodoo,并且有着明显的价格优势。在1997年底,Dell、Gateway、Micron等知名整机厂商都开始使用RIVA 128,同时,RIVA 128也获得了包括Diamond、STB、ASUS、ELSA和Canopus等零售商的大力支持。




“NV1的失败让我明白了要在市场竞争中找准自己产品的定位,因为客户总是在考虑替代方案,现在人们将此称为产品的市场契合度,我们需要考虑产品策略、定价、以及到底如何进入市场参与竞争。那个时候的人就想要简单、便宜又劲大的家伙。”黄仁勋在红衫资本采访中总结。




自此,英伟达开始了在图形芯片领域的一骑绝尘。




1998年,黄仁勋与台积电的创始人张忠谋达成深度合作,台积电成为英伟达芯片的指定制造商。1999年,Geforce 256 问世,作为世界首款全球首款集成了变换、照明、三角设置/裁剪和渲染引擎的单芯片,Geforce 256正式开启了属于GPU的时代。




在此之前,电脑中处理视频输出的显示芯片通常很少被视为是一个独立的运算单元,GPU极大提升了计算机的图形处理能力,它将复杂的数学任务分解为小型计算,然后以一种被称为并行的方法一次性处理所有这些计算,如果把CPU 的功能比作送货卡车在货物始发地不停来回, GPU 更像是同时出发的摩托车车队,一次到岸。




NVIDIA Geforce 256 SDR




Geforce 256的成功,让英伟达在同年进行了IPO,成功上市,1999年市值为16亿美元。




而2004年对CUDA技术的投资,则是黄仁勋走对的另一步棋,其直接建立了英伟达在AI领域的技术护城河,对于笔者这种麻瓜来说,要说清楚它的具体技术逻辑着实有些强人所难,简单说来,这项技术大大降低了GPU的使用门槛,原本需要专业的OpenGL图形编程语言才能调用的GPU被CUDA开放给了Java与C++语言。




这让英伟达的GPU得以更简单地进行图形处理以外的计算,使GPU成为一颗普及化的超级计算核心。但CUDA技术起初并不受股东看好,正是黄仁勋力排众议,英伟达才加大了对CUDA技术的投入,不过在2006年正式发布时,CUDA的社会反响平平。




CUDA技术的大概逻辑




原因很简单,CUDA带来的强大运算能力在当时没有用武之地,它基本都被应用在了石油勘探等工业领域以处理巨量的数据。而人工智能还蜷缩在技术殿堂的角落少有人问津,连许多计算机科学家都认为神经网络是不可信的,但CUDA在无形间已经为人工智能的发展奠定了基础。




在CUDA被正式应用到人工智能技术之前,英伟达的市值已经一路萎缩,甚至不及刚刚上市时的16亿市值,仅在10亿美元上下浮动,到 2008 年底,Nvidia 的股价已经下跌了 70%。股价一度跌至6美元,前 NFL 营销主管Dawn Hudson在 2013 年加入英伟达董事会时评论道:“这是一家明显扁平、停滞不前的公司。”




山雨欲来风满楼。转机其实早在2009年就已经初露端倪,多伦多大学一位研究计算机神经网络的研究员Geoffrey Hinton和他的学生在使用英伟达GPU和CUDA技术进行视觉识别训练后发现结果斐然,他们用数千美元的硬件和CUDA平台做出来的AlexNet(深度卷积神经网络)在ImageNet 视觉识别竞赛中暴打了数百万美元的CPU架构,让许多人怀疑他们作弊。




Geoffrey Hinton本人被认为是AI深度学习的奠基人之一,他在2018年获得了图灵奖,而这些见证了英伟达曙光的学生中有一个叫做Ilya Sutskever的,这哥们是如今Open AI的联合创始人之一。




Geoffrey Hinton(右一)、Ilya Sutskever(左一)




那年早些时候,深度学习领域的大牛吴恩达也训练了一个神经网络来从1000万张图片中识别出猫的图片,但这项工作使用了一千台电脑大约一万六千个 CPU,也花费了上百万美元,而他后来只用了几张GeForce显卡,大概64个GPU就取得了更好的结果。




AI深度学习依赖于算力,如果说人类智能的出现建立于高度进化的大脑和高体重占比的脑容量,可以说GPU高效的并行计算就是计算机产生“智能”的物质基础。




AlexNet之后,GPU与CUDA打通了人工智能发展的康庄大道,众多风投公司的资金开始注入这个曾经的小众领域,资本自然也注意到了隐藏在翻滚的人工智能海洋洋流之下的英伟达,黄仁勋自然迅速跟进,宣布英伟达从主要服务电子游戏领域的GPU制造商转向人工智能。2012年,人工智能芯片市场是一个空无一人的跑道,而因为黄仁勋对CUDA的固执,英伟达回过神来才发现自己几乎已经站在了终点。




黄仁勋是否是因为早早预料到了人工智能的兴起,而在股东众口铄金之下固执地坚持CUDA技术的研发,茶馆无从得知。明面上的事实是,如今的英伟达已经成为人工智能技术大厦的地基。




2016年,英伟达向时任Open AI董事长埃隆·马斯克交付了专门用于人工智能研究和应用设计的超级计算机DGX-1。







2017 年,谷歌推出了一种新的神经网络训练架构Transformer。次年,OpenAI基于 Google 的这一框架构建了第一个“基于转换器的生成式预训练模型”,即GPT。GPT在英伟达的超级计算机上不断进行训练、吸收大量文本并学习如何建立类似人类的连接, 2022 年末,经过多个版本后,ChatGPT 发布。




2024年2月,英伟达市值逼近2万亿美元,市值相当于一个中等经济体国家的经济总量。




8年时间,在英伟达的参与下,人工智能算力提升了1000倍。在今年GTC,黄仁勋一边说着“加速计算已达临界,通用计算已经被时代淘汰。”一边掏出了Blackwell,这种建立于芯片连接技术的超级GPU架构,能让两块GPU“以为”自己是一个整体,从而赋予整个架构每秒两千万亿次的浮点运算能力。







由Blackwell架构组成的单一机柜,FP8精度的训练算力就高达720PFlops,这是什么概念呢?在之前,一整个DGX SuperPod超级计算机集群的算力也不过1000 PFlops。







据英伟达称,Blackwell支持多达10万亿参数的模型进行AI训练和实时大语言模型(LLM)推理。其所提供800 teraflops的8位浮点AI性能,能够支持英伟达GR00T机器人理解多模态生成式AI模型。




如今,单机柜匹敌一个堆栈集群算力的时代已经到来,或许不久后,人工智能将真正具备在现实世界中行动的“肉身”。




有华尔街的分析师曾这样比喻:“人工智能领域的发展好比一场战争,而英伟达是唯一的军火商。”




结语




黄仁勋如今已经61岁,英伟达的员工表示与他的交流依然像“把手指插进电源插座”,有许多员工表示他的性子激进,偶尔发怒让人感到害怕。




而他“皮衣刀客”的名称不仅来自于那身万年不变的黑色皮夹克,更在于他在显卡迭代上展现的“精准刀法”,历代的英伟达显卡迭代带来的性能提升被老黄限制在一个非常有限的程度。虽然有人诟病他逐渐沦为挤牙膏的,但这种产品细分能力还是让人咂舌(高情商)。




图片来源chiphell




茶馆从未想要借老黄或是其他一些已经功成名就的商业巨鳄来给各位猛灌鸡汤,因为鸡汤没法将人带向成功,就事实而言,每个人成功的道路时也运也,几乎没法复制,但茶馆在茶馆看来,老黄几乎将人生的每一段经历都化作了指导实践开展的经验,不论这些经历是好是坏,在不断的总结、复盘中坚定自己的道路,老黄真正做到了心诚求之,虽不中,亦不远矣。




“伟大都是熬过来的。”黄仁勋说。

QR code