最近,有关英伟达及其创始人兼首席执行官黄仁勋的消息成为网络热搜词条。
人们关注的焦点之一是财富。英伟达的股价过去一年上涨近140%,目前市值约3.2万亿美元。2024年,英伟达股价几度超越苹果成为全球市值最高公司。投资人最新透露,英伟达有近80%的员工已成为“百万美元富翁”,其中一半的人净资产达到2500万美元,约合1.8亿元人民币。
技术是财富的基石。英伟达正在研发物理ChatGPT,或机器人ChatGPT,这可能使人工智能(AI)在新的一年或未来几年彻底改变世界。英伟达研发物理ChatGPT既是其一以贯之的风格和技术路线,也是英伟达的大部分员工能成为百万富翁的秘诀,更是推动社会进步和经济发展的动力。同时,这也是《黄仁勋:英伟达之芯》一书的核心内容。
《黄仁勋:英伟达之芯》,[美]斯蒂芬·威特著,周健工译,中国财政经济出版社2024年12月出版,定价:89.9元。出版社供图
?
一
OpenAI研发的ChatGPT等生成式AI只是一种大语言模型,能够理解并生成自然语言文本,为人类做许多文本工作,也能参与各种对话和交流场景,但仍然不能与人进行真实和实时的交流。而2019年,英伟达首次推出的开源AI系统Megatron就是训练大规模模型技术,对诸如ChatGPT底层架构等AI领域的发展产生重大影响,为包括OpenAI在内的公司在大语言模型研发方面取得突破奠定了基础。
不过,黄仁勋现在更看重的是通用人形机器人技术,这是未来人类最需要、最为实用的技术,但很难突破和实现。
黄仁勋认为,随着Transformer模型、大语言模型以及基础模型方面的突破,英伟达能够在该领域取得突破并作出真正贡献的核心技术,就是物理AI或物理ChatGPT,即能让机器人通过在虚拟世界的学习,获得真实物理世界物与物、物与人的交互能力,以及交融和对接的能力,成为人类最实用和最有效的AI工具。
具体而言,英伟达将要推出宇宙和全景宇宙平台,即物理ChatGPT,它能够在虚拟环境中模拟真实世界,大大缩短了机器学习的时间。如果让人形机器人像人一样行动,它需要按照人类的时间进度线性学习,需要在现实世界中训练机器人学习,如学习行走、取物、做家务等。但在虚拟仿真环境的全景宇宙中,英伟达可以创建多个不同的多元宇宙,让机器人并行学习,可能同时以10万种不同的方式学习。如此,就可以将原本需要10年才能训练机器人完成的任务,缩短至几个小时,极大地提高效率和可行性。
读完《黄仁勋:英伟达之芯》一书,就会知道推出物理ChatGPT和人形机器人指日可待。因为本书描述的一个核心问题就是黄仁勋和英伟达创新的速度,这在过去体现为“黄氏定律”,这一定律在现在和未来也会体现出来。
该书通过传记的形式,详细介绍了黄仁勋创业和对计算机、AI的贡献。其中,仅英伟达开发的可以高速进行数学计算的电子电路的图形处理单元GPU技术,就为无数科研和商业应用提供了强大的计算能力,黄仁勋也因此赢得了“AI教父”的称号。
“某某之父”或“某某之母”是指某一事业和产品,或某一潮流、某个时代的开创者、奠基者。今天,人们已经进入AI时代,而开创这个时代的绝非一个人或几个人,至少是几十或上百位计算机科学、物理学、电子学、半导体、机器学习、神经科学、认知科学、心理学、哲学、语言学等方面的科学家、工程师、技术人员、学者。在这些方面卓有贡献者都可以称为“AI之父”。
正因如此,美国《时代》杂志在2023和2024年都公布了AI百大影响力人物,共分为四大类——领导者、创新者、塑造者及思想家。黄仁勋两次均入选领导者,也即人们俗称的“教父”。这100人中也包括OpenAI首席执行官奥特曼、Google DeepMind首席执行官兼联合创始人哈萨比斯、台积电董事长魏哲家等。
二
AI离不开芯片或晶片、晶圆,通过将包括半导体设备、被动组件等电路小型化的方式,将电路集成在半导体芯片上,这是AI的物质基础和运行基础。
今天,就全球的大部分技术潮流,如云计算、加密货币、元宇宙、AI、o?po云服务而言,英伟达都是领先者和深度参与者。更重要的是,全球大部分AI模型,几乎都是用英伟达的显卡训练出来的。
要理解这一点,还是要用数据说话。按照摩尔定律,芯片的算力每10年约有100倍的增长。而根据英伟达的数据,在过去8年里,英伟达芯片的算力已经增长了1000倍。10年100倍是摩尔定律,8年1000倍是前者的10倍。这是什么呢?这就是“黄氏定律”。也因此,在算力上,可以说已经从摩尔定律时代进入“黄氏定律”时代。
进一步看,2024年诺贝尔物理学奖和化学奖都颁发给了与AI有关的研究成果,其中加拿大多伦多大学的杰弗里·欣顿由于发明了能捕捉有特征意义的图片和数据的深度卷积神经网络(AlexNet),而与美国普林斯顿大学的约翰·霍普菲尔德共同获得诺贝尔物理学奖。
然而,如果没有黄仁勋和英伟达研发的GPU,AlexNet在实际用途上并不被看好,甚至连欣顿也认为用处不大。不过,在2012年,采用两块英伟达生产的GTX580GPU训练AlexNet需要6天,但是到2018年,采用常用的英伟达DGX-2GPU训练AlexNet,只需要18分钟。英伟达芯片的算力不只是让AlexNet进入实用阶段,而且让今天的语音助手、刷脸支付、人脸识别,以及整个AI技术走向了产业化和实用化。
从上述及AI发展历程来看,可以认为,没有黄仁勋和英伟达,就没有今天的AI。从时间点看,黄仁勋有一些关键的人生节点:出生于中国台湾,5岁从台湾跟随父母到泰国,10岁跟随父母移民到美国,20岁大学毕业入职第一家公司硅谷AMD,30岁创立英伟达,35岁决定独霸图形市场,36岁公司上市,跻身千万富翁行列,38岁成为标准普尔最年轻的首席执行官,50岁顿悟神经网络研发,押注AI,55岁创造“黄氏定律”,60岁入选《时代》周刊全球AI领袖。
而从技术节点看,黄仁勋和英伟达实现了从芯片到超级计算机,再从统一计算架构到一系列人工智能软件,包括为神经网络学习提供超级算力的一系列芯片。在这些关键点上,每踩准一个点,就不只是创造伟大的业绩,推动技术进步和经济极快增长,还可以成为一个新时代的开创者。
英伟达在2006年至2009年研发的CUDA就不是单一的技术,而是一种整合技术,是该公司对通用图形处理器GPGPU的正式统合。通过这一技术,使用者可利用英伟达GeForce 8以后的GPU和较新的Quadro GPU进行计算,而C语言仍是其基础,可以让大多数人直接以熟悉的C语言写出在显示芯片上执行的编程,而不需要学习特定的显示芯片的指令或特殊的结构。这实际上就是一种技术和应用的腾飞。
早在2007年,欣顿及团队就意识到CUDA对图像识别的重要性。2008年,CUDA就在欣顿的实验室得到应用。欣顿要求他的两位学生苏茨克弗和克里泽夫斯基利用英伟达的GPU训练计算机学会图像识别。2012年初,克里泽夫斯基改造了一个原本仅用于教学练习的经典学术图像识别网络,使其能够在CUDA上顺畅运行。
令人震惊的是,GPU仅用30秒就完成了训练。接下来,欣顿和苏茨克弗及克里泽夫斯基对英伟达的GPU算力更是惊得目瞪口呆,因为他们创建了一个神经网络,命名为Super Vision,在机器学习中利用图像网络这样带标签的数据集进行训练称为“监督学习”。而在理想状态下,英伟达的两个GeForce 8GPU每秒能执行3万亿次操作。换算下来,英伟达的GPU能在不到一周时间内完成1亿个不同的数学步骤。这相当于将人类原本需要90亿年才能完成的计算量,都编码进了Super Vision那“脆弱”的合成大脑之中。但是,如果没有CUDA,这个合成大脑就无法运转。
黄仁勋的这部传记其实再次提出了一个科学与技术的区分和关联问题。科学是解决是什么和为什么的问题,技术是解决做什么和怎么做的问题。欣顿提出了AlexNet是什么和为什么的原理,但黄仁勋和英伟达给予了这一科学原理要做什么和怎么做的路径,包括打开方式和执行运营方式,如此才能在图形识别和人脸识别,以及AI其他领域进行全面的社会应用。
2015年后,黄仁勋和英伟达全面投入到AI的做法,意味着不只是今天的信息技术、互联网、个人电脑、智能手机等在以更快更好的速度更新并服务于每一个人,也意味着以芯片算力为基础的技术和AI仅仅是一个开端。未来,这些技术会更全面和深入地改变人们的生活,也改变世界。
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。