新智元报道
新智元报道
【新智元导读】 硕士毕业的老黄,不仅是院士,现在还是香港科技大学的荣誉博士。
11月23日,在香港科技大学举行的博士学位授予仪式上,不仅梁朝伟被授予人文学荣誉博士学位,作为英伟达创始人兼CEO的老黄也被授予工程学荣誉博士学位。
授予仪式结束后,老黄与HKUST校董会主席沈向洋进行了一场长达1小时的炉边对谈。
沈向洋坦言,今天活动之前自己辗转反侧,因为大家告诉他最近苹果股价涨势迅猛,英伟达的情况反而有点不妙。但是还好,对谈当天时英伟达仍是市值第一的公司。
然而根据最新的数据,市值第一的宝座又一次易主,英伟达目前低于苹果屈居第二。
作为新晋校友,老黄对自己的新母校和新校董也不吝溢美之词,不仅对谈中将香港科技大学比作「亚洲的MIT」,还称赞沈向洋是「我们这个时代最伟大的计算机科学家之一」,而且很长时间以来都是自己和很多其他人心目中的英雄。
一小时的对谈中全程高能,善于提问的沈向洋和善用比喻的老黄经常引发观众们的掌声爆笑,最后的抽奖环节更是直接豪横送出10张英伟达RTX 4060ti显卡,点燃全场。
不同于以往在会议论坛中的对谈,回到「母校」的老黄非常放松,不仅分享了自己对AI产业和团队管理的见解,更是罕见地透露了很多个人八卦。
这个时代,AI究竟意味着什么
如今,AI已经有能力理解语言、图像、蛋白质序列等各种数据时,GenAI能够将一种信息模式转换为另一种信息模式,比如文本到图像、文本到蛋白质、文本到化学物质等等,因此获得了变革性、开创性的能力。
最初,AI仅仅是通用的函数逼近器,现在则演变为通用的语言翻译器,可以理解各种信息的含义。那么问题是,我们可以用它做什么?
从计算机科学的角度看,开发软件的方式已经发生了根本性的变化,不再依赖于传统的代码编写方式,而是转向了机器学习和自动生成。
这不再是简单的软件问题,我们是重新发明了整个技术堆栈。计算机可以自动生成神经网络,并在GPU上进行处理。从编码到机器学习,从CPU到GPU,标志着一个全新的时代的到来。
由于GPU能力强大得多,所以我们可以开发出和以前完全不同的软件,在这些软件之上就是人工智能。那么,什么是AI?当我们在竞相发现新的AI时,这个行业之后会发生什么?
AI做的事情之一是「认知自动化」,或者说解决问题的自动化。
解决问题的过程可以被归结为三个步骤:感知、推理和规划。比如,自动驾驶需要汽车感知周围环境,然后推理自己和其它汽车的位置,再规划驾驶过程。
实际上,不仅是自动驾驶,任何事情都可以有相应的表达式,然后交给AI来执行。
300年前,通用电气和西屋公司发明了一种新设备,最终改进为交流发电机,搭配上后来发明的灯泡、烤面包机的等用电设备,从而创造了一整个用电生态系统。
人工智能的情况也很类似,我们如今正在创造一个「数字智能」的生态系统。Copilot和ChatGPT等应用就像是各种电器,而发电机对应的是数字智能工厂(digital intelligence factory)。
从工业的角度来看,我们正在创造一个全新的、从未存在过的产业,这个产业以能源为输入并产生数字智能,未来将会实现庞大的消费量。
AI4Science前景广阔
近两年,越来越多的人提到AI4Science,不仅英伟达在发布会上多次展示与气象科学、生物学交叉的成果,老黄本人也经常谈起AI和生物的结合。
对谈中,老黄回忆起自己在2018年的世界科学计算会议上介绍了人工智能,但当时由于AI的「黑箱」属性饱受质疑。但今天的人工智能,已经不那么像黑箱了。
原因在于,你可以「邀请」当下的LLM一起进行推理,让它输出得到答案的每个步骤,这就是一种「探查」,让我们理解AI的思维过程。(老黄的描述,或许就类似于我们常说的CoT「思维链」)
虽说「黑箱」的属性减弱了,但人工智能依旧是「黑箱」,因为它还无法从第一性原理中产生答案的能力,而是通过观察数据、学习规律来产生答案。因此,它并不是在模拟第一性原理求解器,而是在模拟智能、模拟物理。
那么关键的问题是:模拟对科学有价值吗。我的答案是,模拟对科学而言是无价的。
在许多科学领域,我们已经理解并掌握了第一性原理,比如薛定谔方程、麦克斯韦方程等,但无法在庞大的系统中模拟这些方程。所以,与其从第一性原理出发去解决这些计算上受限的问题,不如让人工智能模拟。
我们可以训练理解物理的人工智能,用它来模拟非常大的系统,以便理解大系统和大尺度。
再比如,生物学有一个从纳米开始的尺度,从纳秒到年,用第一性原理求解器去求解这样的系统几乎是不可能的。那我们能否使用AI来模拟人类生物学,以便更好地理解这些非常复杂的多尺度系统,甚至创建一个人类生物学的数字孪生。
这是一个伟大的希望,如果能够实现,生物学家、气候科学家将第一次真正理解自己所研究的大尺度物理系统。
「实体智能」和大湾区的未来
沈向洋提到,大湾区近年来已经发展出庞大的硬件生态系统。比如,大疆公司就是凭借无人机技术从这里起步,成为全球领先的企业。
对于硬件生态和「实体智能」这个领域,以及「大湾区」这个独特的地理位置,老黄有怎样的看法?
他表示,大湾区对于中国乃至世界来说都是一个绝佳的机会,因为这个区域在机电一体化(mechatronics)方面非常成熟,这是机械与电子技术的交汇点。
大湾区是世界上唯一一个机电技术和AI同时蓬勃发展的地区。其他两个主要的机电技术产业中心 —— 日本和德国,在人工智能领域落后了不少,而大湾区不存在这个问题。正如沈向洋形容的,这是一个「以迭代软件的速度来迭代硬件的地方」。
老黄认为,这是一个非常独特的机会,而且强烈建议大家抓住这个机会并充分利用它。
机器人技术的关键就在于加入一个能理解物理世界的AI。目前如ChatGPT之类的大语言模型擅长处理知识和认知智能,但并不理解物理智能(physical intelligence)。比如把一个杯子放到桌子上,AI无法理解杯子不会穿过桌子这一事实。
但其实这个领域已经取得了很大的进展,也就是我们看到的文生视频模型。如果输入文字指令「Jensen拿起咖啡杯喝一口」,AI就能生成相应的视频,那么同样也可以生成指令来控制机械臂完成相同的动作。因此,从GenAI到通用机器人,这一步已经非常接近了。
而且,规模化量产非常重要,因为只有大规模生产才能形成技术飞轮(flywheel),摊平高额的研发投入,从而带来更大的技术突破,进一步扩大生产规模。这个研发飞轮对任何行业都是至关重要的。
我们现在有三种类型的机器人可以实现大规模生产,而且只有这三种,其中两种的产量会是最高的。其他类型的机器人都很难实现规模化生产。
这三类机器人分别是:汽车,因为过去150年的世界是为汽车设计的;无人机,因为天空几乎没有限制;以及体量最大的,人形机器人,因为我们的世界是为人类设计的。
这三类机器人很容易实现「棕地部署」(brownfield deployment),即在现有的环境设施基础上进行应用,而不需要从头开始创建全新的环境。这三种类型可以将机器人扩展到极大的体量,这是像大湾区这样的制造业生态系统真正拥有的优势之一。
再论「黄氏定律」
2020年,华尔街日报发文,称摩尔定律正逐渐失效,而「黄氏定律」(Huang’s Law)或将取代摩尔定律的位置,主宰未来的互联网创新发展。
去年,黄仁勋在CES 2019展会上表示,「摩尔定律过去是每5年增长10倍,每10年增长100倍。而如今,摩尔定律每年只能增长几个百分点,每10年可能只有2倍。因此,摩尔定律结束了。」
4年前的Huang’s Law是这样预言的:由于硬件和软件的升级,人工智能芯片的性能每两年的可提高一倍多。
而如今站在2024年回看过去的10到12年,从消费的角度出发并算上所有的大语言模型,每年的计算需求实际上远远不止翻了一番,而是是增长了四倍。如果每年增长四倍,那么在十年的时间里,这个数字将变成惊人的一百万倍。
摩尔定律失效了,「黄氏定律」会持续有效吗?沈向洋将这个难以回答的问题抛给了老黄本人。
首先,老黄分析了一下摩尔定律起作用的原因,它依赖于两个概念:一是VSI缩放(大规模集成电路缩放),这得益于Carver Mead和Lynn Conway的研究;另一个是Dennard缩放(恒定电流密度缩放)。这些技术的结合让我们每隔几年就能将半导体的性能翻倍。
目前为人熟知的一种经验法则「Scaling Law」告诉我们,神经网络的规模越大,训练数据越多,AI的性能似乎就越强大,而 Scaling Law 似乎仍在持续发挥作用。
然而,仅指望收集到所用的数据然后通过预训练从中自动发现知识是不够的。我们还需要后训练,也就是深入一个领域,理解其中的某些内容,并学习特定技能的过程,涉及到强化学习、人类反馈、人工智能反馈、合成数据生成、多路径学习等多种技术。
这就好比上大学,完成学业、拿到学位是一个重要的里程碑,但这还远远不够。一旦你选择了一份职业,就还需要再次进行大量的学习。
然后,在后训练阶段,就到了我们所说的「思考」,这可以被称为test-time scaling。这个阶段的一些问题需要将其分解,逐步追溯到第一性原理,然后再从原点出发,为每个问题找到解决方案。
因为答案是不可预测的,这可能需要你进行迭代和分情况讨论,模拟不同的结果,这就是我们所说的「思考」,而且往往思考时间越长,答案的质量可能就越高。
现在AI已经能提供能力范围内最好的答案,但我们还需要知道是否有幻觉、答案是否合理,以及我们多大程度上能信任这个答案。我认为我们距离这一目标还有几年的时间,在此之前依旧不得不持续投入。
GPU:算力太少怎么解
过去的10年中,Huang’s Law不仅意味着计算能力的增长,也是计算成本上百万倍的降低。
想象一下,在这个世界上,任何你依赖的东西,无论是电力、机票,还是其他任何东西,如果成本降低了上百万倍,就会让你的行为习惯会发生根本性的改变。
最明显的是,计算能力的提高带来了机器学习蓬勃发展,研究员们可以毫不犹豫地使用机器学习方法分析处理数据。
但不可否认的是,GPU算力少,依旧困扰着高校中的研究人员。今年5月的一次采访中,李飞飞曾直言,「美国的公立机构和学术界正在AI资源方面跌落悬崖」,斯坦福的NLP实验室也仅有64块GPU可用。
GPU:耗能太多怎么破
公开英伟达独特管理经
(文:新智元)