作者 | 周熠
上海脑科学与类脑研究中心
张江实验室脑与智能科技研究院
机器可以做人类所有能做的事情。
——Geoffrey Hinton
不管黑猫白猫,能捉老鼠的就是好猫。
导语:
- 什么是机器?
- 在我们谈到实现人工智能所使用的机器的时候,一般就是指电子计算机。
- 机器和用机器建立的人工智能系统,包括人本身,统称“智能体”。
- 智能体从环境中感知信息得到输入,同时也输出行动来影响环境。
- 什么是复现?
- 方式、自治性和效果是复现的三个主要维度。
- 从复现的方式来看,人工智能可以分为弱人工智能和强人工智能等。在复现效果的几个重要节点中,超越人类水准往往最为激动人心。
- 机器完全自治很困难。为了解决问题,一般需要人类和机器不同程度协作。
什么是机器?
在“机器复现智能”这几个词之中, “机器”可能最容易诠释,因为它有一个无可争议的代表,即电子计算机。在“梦想篇”中,我们提到,电子计算机是人类有史以来最强大的机器和工具,也是实现人工智能梦想的最理想的工具。因此,在我们谈到实现人工智能所使用的机器的时候,一般就是指电子计算机。
但是,除电子计算机之外,其他的工具或事物能不能也算“机器”呢?比如已有的洗衣机、微波炉、工业机器人,以及将来可能出现的量子计算机,甚至是生物如狗、马、克隆人等?又或者是从赛博坦星球来的变形金刚呢?
这些是机器吗?
为了回答这个问题,我们采用前文提到的第二个观点,即概念允许有涵盖范围不同的多种解释。狭义上来讲,只有电子计算机或者以电子计算机为主要控制中心的工具才是我们所说的机器。但广义上来讲,每个人都可以定义自己对机器的解释,甚至可以包括之上提到的所有。
就本文作者而言,人工智能所使用的机器需要满足以下一些要求:
(a)能够自动或半自动完成某些行为;
(b)人类能够用批量的方法制造;
(c)人类能够用规范的方法论以其为工具构建系统;
(d)人类能理解、设计和还原其工作原理;
(e)人类能够完全控制;
(f)有相当程度的通用性。
(a)是作为机器的基本功能;(b)和(c)是从使用机器的角度出发;(d)和(e)是从人工智能伦理的角度出发;(f)也许有一定争议,它是人工智能所需要的机器的特殊属性。
以此为标准,之上提到的所有事物都满足(a);洗衣机、微波炉等家电不满足(f);生物包括克隆人不满足(d)和(e);变形金刚不满足(b)-(e);工业机器人则需要看它们的通用性;而电子计算机满足全部要求。
当然,不排除将来会出现满足所有这些条件,而超脱于现有电子计算机的新型机器出现,比如量子计算机、生物计算机等。但话说回来,有些工具(包括家电、摄像头、汽车,等等)虽然不能满足这些所有条件,不足以成为实现人工智能的完整的“机器”,但在它们之中也可以大量使用人工智能技术。
总而言之,在人工智能第一层定义(即“机器复现智能”)中,机器目前就是指以电子计算机为代表的工具/机器的统称。
智能体和环境
按照上述定义,机器需要一定程度上复现智能。为了证明机器确确实实做到了这一点,不能仅仅把机器造出来,声称它具有智能就行了。该机器还需要和环境互动,切切实实地展现出智能行为来影响环境。
我们通常把“机器”和用“机器”建立的人工智能系统,包括人本身,统一抽象称为“智能体”(英文:“agent”,也翻译为“主体”或“代理”)。下图描绘了智能体和环境互动的一个简单模型。智能体从环境中感知信息得到输入,同时也输出行动来影响环境[1]。而人工智能的任务就是建造这样的智能体,某种程度上“复现”“智能”行为。
智能体与环境的简单互动模型
感知输入可以进一步细分为两种:一种是纯粹的感知信息,一种是环境的反馈信息。以智能体“人”在大街上过马路的场景作为例子,前者包括人所看到的交通灯、斑马线、车辆、行人,听到的喇叭、刹车声,等等,而后者包括人在做了一些行为后的结果反馈,如闯红灯会被交警罚;更复杂一点,如以当前速度横穿马路,不会被车撞等等。又以智能体程序下围棋为例子,感知信息包括棋盘和落子情况等,而反馈信息包括某些子被围掉以及最终的输赢。因此,如下图所示,建造一个智能系统,与其直接相关的部分包括输入、输出和反馈。
智能系统:输入、输出与反馈
什么是复现?
“复现”乍看上去很简单,不应该有任何歧义。但是,正是因为这个词,导致了“强人工智能”与“弱人工智能”之争,而其关键在于复现的方式。
一种复现的方式是目的驱动。不管复现的方式如何,只要最终的结果能够体现出智能行为即可:人下棋、机器也下棋;人玩游戏、机器也玩游戏;人识别人脸、机器也识别人脸,只要能够在这些方面接近、达到或超过人类,那么就认为这是一种人工智能。我们把这种复现的方式称为“实现”。只要求实现这些功能,而不太在乎其背后的原理或实现机制。不管黑猫白猫,能捉老鼠就是好猫。这就是大家所说的“弱人工智能”。
在弱人工智能内,也进一步细分成为两种,即“专用弱人工智能”和“通用弱人工智能”。前者所采用的方法论和技术不具备普适性,只适用于某一个或某一类具体问题。例如,专用弱人工智能中的下棋技术不能用在玩游戏,也不能用在人脸识别,反之亦然。而后者要求所采用的方法论和技术有一定的通用性,能够推广到至少同属一大类的不同领域,例如,通用弱人工智能技术既能下棋,又能玩游戏和人脸识别,还能实现其他的智能行为。
与之相对应的另外一种复现的方式是原理驱动。与目的驱动不同,原理驱动要求机器按照人类实现智能的方式来复现智能。我们称这种复现的方式为“还原”。这就是大家所说的“强人工智能”。大体上说,强人工智能应该能推理、学习、联想、决策,等等。但是否这些就是它的全部,以及这些能力人类本身是如何实现的,我们并没有确定的答案。这是由于我们迄今为止并没有深入了解人类到底是如何实现智能的。
有趣的是,虽然我们不知道强人工智能是什么,但是我们知道什么不是强人工智能。例如阿尔法狗(AlphaGo)所用的下围棋技术,也许是通往强人工智能的道路之一,但是至少现在看来,这不是强人工智能,因为我们自己就不是这么下围棋的。另一件有趣的事情是:很多人工智能技术,如产生式系统和启发式搜索等等,在没有做出来之前,普遍被认为需要用到高深人工智能技术;而一旦实现了,就不再被认为是人工智能了。虽然有点翻脸不认人的味道,但这也很大程度上是因为它们复现的方式还停留在弱人工智能层面。
效果驱动:弱人工智能
原理驱动:强人工智能
强人工智能和弱人工智能只是一种相对粗略的分法。取决于复现方式是否更接近于人类实现智能的方式,在强人工智能和弱人工智能之间可以进一步细分成更多层次。例如,比强人工智能稍微弱化一点的复现方式“模拟”,这种方式不要求完全还原人类实现智能的原理,但需要在其基础上,模拟出智能系统,从而展现智能行为,可以称之为“拟人工智能”。而更弱化一点,又比弱人工智能强一点的复现方式是“近似”。有一些方法,比如基于规则的推理、强化学习、分布式概念表示等等,有一定的共性,看上去比较接近人类实现智能的方式(当然,也是仁者见仁,智者见智,存在一些争议),所以它们比完全的弱人工智能更接近强人工智能一点,我们可以称之为“类人工智能”。对于复现智能行为,人类的方式也只是众多可能方式中的一种生物意义上的模拟,并不一定是最佳的,无论是从效果上还是从原理上。例如,人类在记忆和运算上远远不如机器。因此,在强人工智能之上还存在“超人工智能”,其复现的方式可以简单归纳为“超脱”。大体来说,从难度和意义上来看,“实现”<“近似”<“模拟”<“还原”<“超脱”,也就是说,从智能的层次上,大体来说,“弱人工智能”<“类人工智能”<“拟人工智能”<“强人工智能”<“超人工智能”。
但是,对某些具体的技术来说,无论从难度,还是从价值上看,并没有高下之分,并不是说超人工智能中的每个技术都比弱人工智能中的所有技术厉害。
复现三维度之方式
回到人工智能的定义这个问题上来。如上所述,关于“复现”也存在多种解释,包括“实现”、“近似”、“模拟”、“还原”、“超脱”等。哪些是人工智能所认可的“复现”呢?我们同样采用之上提到的第二个观点,仁者见仁、智者见智。狭义上,“还原”应当是最为接近人工智能最初构想的。广义上,所有都可以算是。本文作者赞同广义上的看法,即以上所有复现方式都是人工智能研究的范畴,但更偏好靠后的复现方式。
除了方式这个维度之外,“复现”的另一个维度是自动化的程度,称之为自治性(Autonomous)。诚然,我们期望智能体能完全自治,即不需要人类任何参与,就能够完全自动化地像人一样复现各式各样的智能行为,包括和其它智能体交互,在环境中感知信息,然后通过内部的处理,做出理性(Rational)的行动影响环境。
然而,完全自治是一件非常困难的事情。为了让机器帮助人类解决问题,人类往往需要和机器一起协作。按自治性程度高低,这种协作方式可分为:
(1)机器主导,人类辅助,自主复现智能来解决问题;
(2)人机耦合,协同解决问题;
(3)人类主导,机器辅助来解决问题。
例如,上面提到的阿尔法狗、IBM深蓝和IBM沃森,都属于第一类。它们分别复现了下围棋、下象棋和知识竞赛三种不同的智能行为。而某公司需要一个信息化报销系统。人类设计方案,实现相应软件系统,机器正常运行系统,这属于第二类。朋友问了某问题(如关于汇率),以我们自己的知识无法解决,而通过机器从网上搜索,综合信息得到答案,解决此问题,这属于第三类。而人工智能主要关心第一类。
复现三维度之自治性
即使在第一类中,人类往往也需要一定程度参与,包括:
(1.1)清楚定义问题,包括输入和输出的内容以及格式;
(1.2)给出包括问题分解等的问题解决框架或方法;
(1.3)给定某些先验模型、知识或数据;
(1.4)设计机器独立解决问题的逐步算法。
例如,IBM深蓝需要以上四种;IBM沃森整体需要前三种,其中部分子程序需要第四种;阿尔法狗原始版本需要前三种,而升级版阿尔法狗零(AlphaGo Zero)主要需要前两种。
以上仅仅是一个大致的分类。每一种都可以继续拆分。例如,在(1.3)中,给定先验模型,先验知识和训练数据有很大的区别。更细一点,即使在给定训练数据之中,也分为直接(如有监督学习)和间接(如强化学习)等多种不同方式。
综上,自治性不是一个“是”或者“否”的答案,而是根据人机耦合的和人类参与的程度,分成很多层次。
自治性也牵涉到一个伦理问题:我们到底希望机器有多自治?如果机器自治了,会不会做出危险的事情,甚至反过来奴役人类?我们将在后面的章节讨论该问题,在这先留一丝悬念。
效果也是复现的另一个重要维度。例如,在阿尔法狗之前,围棋程序已经做了相当长的时间,并且阿尔法狗用到的主要两种技术思想,即蒙特卡洛树搜索(Monte Carlo tree search)与深度学习(Deep learning)都已经出现一段时间,且都已经用到围棋程序之上。然而,它们并未取得惊人的效果和很大的影响力。阿尔法狗更好地将这两种方法结合在一起,并在工程上做了大量工作,击败了人类世界冠军李世石,才取得了一鸣惊人的效果,产生了巨大的影响力。
复现三维度之效果
从弱人工智能的角度,针对某一个具体的智能行为任务,如下围棋、知识抢答或高考数学答题等,在效果上有四个重要的节点。第一个节点是:某智能体在该具体的智能任务上能和人开始媲美了,例如和人类水准最差的10%(这需要设立一个可以度量的标准,如100个人类选手的随机采样中取排名第90位者)水准大致相当,我们称在这个具体的任务上,机器“接近人类水准”。第二个节点是:某智能体达到了人类平均水准(这同样需要一个对平均的定义,如100人的随机采样中取排名第50位者),我们可以认为在这个任务上,机器“达到人类水准”。第三个节点是:机器击败了人类在该任务上最优秀的选手,这时,机器“超越人类水准”。最后一个节点是:机器找到了该任务的最优解,即机器在理论上已经不可能更好了,我们称机器“最优”。一般来说,第三个节点最为激动人心。上面提到的阿尔法狗、IBM深蓝和IBM沃森都分别在围棋、国际象棋和知识抢答中超越人类水准,但都没有达到最优。而在西洋跳棋(Checker)上,机器已经最优。
[1] 罗素, 诺维格. 人工智能: 一种现代的方法[M]. 殷建平, 等译. 清华大学出版社, 2013.
作者介绍
周熠,现任张江实验室脑与智能科技研究院/上海脑科学与类脑研究中心认知智能研究组课题组长,研究员,中国科学技术大学兼职教授。研究方向为认知人工智能,主要的研究兴趣为如何受脑启发,深度融合基于逻辑的符号流派和基于神经网络的连接流派,及其在认知人工智能领域中的应用,包括AI+教育、自动智商测试、智能语言处理等。
(周三晚上7:00—8:00,有周熠老师的直播科普课程, 讲述从歌舞偶到王者荣耀,人工智能如何成为现实。请关注“墨子沙龙”每周的直播预告~~)
关于“墨子沙龙”
墨子沙龙是由中国科学技术大学上海研究院主办、上海市浦东新区科学技术协会及中国科大新创校友基金会协办的公益性大型科普论坛。沙龙的科普对象为对科学有浓厚兴趣、热爱科普的普通民众,力图打造具有中学生学力便可以了解当下全球最尖端科学资讯的科普讲坛。