《人工智能:现代方法》(Artificial Intelligence: A Modern Approach)第四版中文版于近期问世,机器之心对作者 Stuart Russell 教授进行了专访。作为 AI 领域的经典,《人工智能:现代方法》几经再版,内容和结构反映出两位作者不断发展的理解。最新第四版是他们把近十年 AI 进展,尤其是深度学习所带来的影响纳入整体框架后给出的最新阐释,体现了两位大师对人工智能趋势和学科体系发展的洞见。
本次采访也依循「a modern approach」,希望从一种切合技术和时代发展的视角,展现 Russell 教授对技术动向、智能理论,以及流行 VS 经典的思考,为 AI 研究人员和从业者带来启发。
Russell 教授相信在接下来的十年,人们的关注点将从对端到端深度学习的倚重,重新回到由模块化的、基于数理逻辑的、语义明确定义的表示(representation)所构成的系统,而深度学习将在获取原始感知数据方面扮演至关重要的作用。需要强调的是,模块化的、语义明确定义的表示不一定是由手工设计或不灵活的,这样的表示完全可以从数据中学习。
Stuart Russell:我不确定 ChatGPT 是否可以被称为工程,因为通常讲,我们认为「工程」是一门应用工程科学的学科,将物理学、化学、机械学、电子学等知识组合起来,以复杂而巧妙的方式制造出对人类有用的东西。同时,这些东西为什么会有用,我们是理解的,因为它们那些有用的性质是我们通过特定的方法实现的,并且可以复现。
Stuart Russell:OpenAI 正在做的,你可以称其为烹饪(Cookery),因为我们真的不知道这些模型的原理。就好比我做蛋糕的时候,我不知道它是怎么变成蛋糕的,人类做蛋糕已经有几千年历史了,在尝试了许多不同的原料和许多不同的方法,在各种原料和方法上做大量的梯度下降后,有一天发现了一个神奇的东西——蛋糕,这就是烹饪。现在我们对蛋糕的底层原理有了更多的了解,但仍不完美。通过烹饪,我们能得到的有限,这个过程也不具有大的知识价值。
ChatGPT 这整件事令人意外的地方在于,我认为这是 AI 系统第一次真正进入了公众的视野,这是一个很大的变化。OpenAI 自己有句话说得好,那就是尽管 ChatGPT 不是真正的智能,但它让人体尝到了真正的(人工)智能实现后,每个人都能用那种智能做各种他们想做的事情的滋味。
机器之心:另一个很多人关注的点是 LLM 所带来的中间任务的消失。您认为这些中间任务,比如语义分析、句法分析,从一种技术迭代的视角,现在还有多大价值,将来真的会消失吗?那些处在中间的 AI 研究人员和从业者,那些没有强大硬件资源,也没有强大领域知识的人,是否存在失去工作的危险?
Stuart Russell:这是一个好问题。事实是现在很难发表语义分析的论文,实际上,现在很难让 NLP 社区的人听进去任何事情,除非你讲语言大模型,或者用大模型刷新大基准。几乎所有的论文都是关于刷新大基准的,你很难发表一篇不是关于刷新大基准的文章,比如语言结构、语言理解,或者语义分析、句法分析,等等,于是评测大模型的大基准成了写论文的唯一选择,而这些大基准其实跟语言没有任何关系。
机器之心:《人工智能:现代方法》第四版有一个重要的更新,那就是不再假设 AI 系统或智能体拥有固定的目标。此前人工智能的目的被定义为「创建一些试图最大化期望效用的系统,其目标由人设定」,现在我们不再给 AI 系统设定目标,为什么会有这样的一种转变?
Stuart Russell:原因有几点。首先,随着人工智能走出实验室,走入现实世界,我们发现其实很难完全正确地定义我们的目标。例如,当你在路上开车时,你想快速到达目的地,但这并不意味着你应该以每小时 200 英里的速度行驶,而你如果告诉自动驾驶汽车安全第一,它可能永远停在车库里。在安全和快速到达目的地,以及对其他司机友好、不让乘客感到不舒服、遵守法律法规……等等各种目标之间需要权衡。路上总会有一些风险,会发生一些无法避免的意外,很难把你在驾驶时的目标全部写下来,而驾驶只是生活中一件很小、很简单的事情。所以,从实际操作的角度讲,给 AI 系统设定目标是不合理的。
其次则涉及到我在书中举的迈达斯王的例子(King Midas Problem)。迈达斯是希腊神话中的一位国王,他非常贪婪,求神赐予他点物成金的力量,神满足了他的愿望,他碰到的一切都变成了金子,他实现了他的目标,但后来他的水、他的食物也成了金子,他的家人被他碰了之后也成了金子,最后他在黄金围绕中悲惨地死去。这警示我们,当你为非常强大的系统定义目标时,你最好确保你所定义的目标是绝对正确的。但既然我们已经知道我们做不到这一点,那么随着 AI 系统越变越强大,它们不知道真正的目标是什么就越来越重要。
但标准模型其实是错误的。正如刚才所说,我们几乎不可能完全正确地指定我们的目标,而当机器的目标与我们真正期望的目标不符时,我们可能会失去对机器的掌控,因为机器会先发制人,采取措施,不惜一切代价确保其实现既定目标。几乎所有的现有 AI 系统都在标准模型的框架中开发的,这就带来了很大的问题。
在《人工智能:现代方法(第 4 版)》中,我们提出人工智能需要新的模型,新的模型强调 AI 系统对目标的不确定性,这种不确定使机器会去学习人类的偏好,采取行动前征求人类的意见。在 AI 系统运行期间,必须有一些信息从人类流向机器,说明人类的真正偏好,而不是人类在最初设定目标后就无关紧要了。这需要让机器与固定的目标解耦,以及让机器与人类实现二元耦合。标准模型可以被视为一种极端的情况,也即在机器的作用范围内,可以完全正确地指定人类所期望的目标,例如下围棋或解谜。
我认为在构建 AI 系统时,我们需要关注那些具有基本表示能力的方法,其核心在于能够对所有的对象(object)进行声明。假设我要把围棋的规则写下来,那么这些规则必须适用于棋盘上的每一格,我可以说对于每个 x 每个 y 会怎样,我也可以用 C 或 Python 来写,我还可以用英语写,用一阶逻辑写。这些语言都能让我以非常简洁的方式写下规则,因为它们都具有表达这些规则的表示能力。但是,我无法在电路中做到这一点,基于电路的表示(包括深度学习系统)不能表示这一类的泛化。