“我，人工智能”专栏 | 破题篇 VII：“复现”“智能”一相逢 (第三部分)

发布时间：2020-07-29

2103 墨子沙龙

作者 | 周熠

上海脑科学与类脑研究中心

张江实验室脑与智能科技研究院

金风玉露一相逢，便胜却人间无数。

——秦观《鹊桥仙》

将“复现”作用于“智能”之上，也就是说，将不同的流派应用于不同的子领域，产生了人工智能众多重要的技术和工作。
行为流派包括反应式系统和包容式结构等工作，在机器人领域大放异彩。其朴素思想也用在了人工智能其它领域。
统计流派是机器学习中另一个主流方法。蒙特卡洛方法、回归、支持向量机等统计流派工作曾经一度占据机器学习的统治地位。由于统计流派重疗效，因此在如自然语言处理、行动选择等领域也应用很广。

行为流派

1、反应式系统（Reactive System）：行为流派在机器人等领域的应用。反应式系统和产生式系统一样，表示上都采用形如

A1,A2,…,An ->B

的规则，其中，A1,A2,…,An为前提条件，B为结论，更多的时候，B就是一个直接的行动。简而言之，它的直观含义是如果前提条件都满足，那么我们就执行行动B。

例如，用反应式系统设计一个简单的恒温器，将室内温度恒定在某个值，如20度。假设传感器可以接受并检测室内的温度，以及空调可以有升温和降温两个操作。那么，可以构建一个简单的反应式系统，包括两条反应式规则：

“传感器接收到的温度大于20度 -> 降温”

“传感器接收到的温度小于20度 -> 升温”

行为流派的反应式系统和符号流派的产生式系统的界限有些模糊，甚至有时候这两个术语在混淆使用。如果一定要深究它们的差别，主要在于以下几个方面：a）产生式系统一般是抽象规则（Schema rule），一条产生式规则可以实例化成多个具体规则，而反应式系统一般就是具体规则（Specific rule）；b）产生式系统很多时候有控制中心来控制规则触发，反应式系统一般不强调这点；c）产生式系统很多时候带有工作记忆，反应式系统一般不强调；d）产生式系统有时候会带有语法结构，而反应式系统没有；e）在产生式系统中，结论B往往也是一个后承条件，但在反应式系统中，结论B很多时候是一个行动；f）产生式系统往往会在执行规则后更新智能体状态，但反应式系统一般不保留状态。

2、包容式结构（Subsumption Architecture）：行为流派在机器人领域中的应用。包容式结构是对反应式系统的一个扩展。它们的基本思想一致，即不显式的表示智能体的内部状态和对环境的建模，仅仅通过简单的规则对外界环境的刺激（通过传感器被智能体接收）进行反应。但是，与反应式系统不一样的是，包容式结构是一个多层结构。不同的层次在不同的抽象层次对传感器得到的信息进行反应。

包容式结构

例如，对一个扫地机器人而言，最底下的一层可能仅仅是躲避障碍物；之上一层可能是在地板上随意闲逛；而再上一层就是探索整个地板空间。从这个意义上，包容式结构算一个自底向上智能体体系结构，这和传统符号逻辑的自顶向下的结构形成显著区别。

包容式结构着重强调了智能体的反应性、实时性、并行性、应景性、具化性、演化性和涌现性。然而，这种完全不考虑显式表示的做法也受到一些诟病。例如，看上去很难直接处理一些抽象的概念，如结构化知识等。

统计流派

1、蒙特卡洛方法（Monte Carlo Method）：统计流派在人工智能诸多领域的应用。蒙特卡洛方法是一个特别简单的随机抽样方法。基本的思想是以“频率”来计算概率。如果我们要判断一个事件发生的概率，我们可以通过频率实验的方法来近似。我们随机地实验N次，如果这个事件发生了M次，也就是这个事件的发生频率为M/N，那么我们可以简单地认为这件事情发生的概率近似为M/N。随着N越大，这个近似也就越准确。

例如，如需要计算下图阴影部分的面积，当然一种方式就是认定这是四分之一个圆，然后用圆形的面积公式计算。但蒙特卡洛方法独辟蹊径，在这个正方形中随机放入一些点，然后看这些点是否落在阴影区域之内。只要点放得足够多，也足够好，那么我们可以近似认为：

阴影部分面积=落在阴影中点的个数/所有点的总数

蒙特卡洛方法

虽然乍一看上去，蒙特卡洛方法和用圆形面积公式方法相比，只是一个近似方法，得不到精确解。但是，在很多应用场景，精确解只能是一个奢望。例如，上图中的阴影部分是一个非常不规则的图形。此时，蒙特卡洛方法至少可以可以帮助我们得到一个近似解。

除此之外，“足够多”和“足够好”非常重要。依然采用上面的例子，如果落点就10个，那不可能逼近我们想要的精确解π/4。如果落点不是完全随机的，比如偏右边多一点，那么所得到的结果也会谬以千里。

2、回归（Regression）：统计流派应用在机器学习子领域。回归是一种相对简单的统计方法，目的是在给定一些数据，找出两个或者多个变量之间的关系。更确切一点地说，给定一些数据和我们预想的函数类，在这个函数类里面找出一个最佳的函数，能够很好地模拟这些数据。假设这个模拟很好的话，我们就可以拿来做预测。

例如，我们观察发现A君在大学毕业时年龄25岁，体重150斤。随后每年体重逐步上升，如26岁体重151斤，27岁体重152斤，……，35岁体重160斤。基于这样的观察数据，我们可以试图拟合A君体重和A君年龄之间的关系，假设我们采用线性回归（Linear Regression），即假设:

A君体重=A君年龄*a+b

那么我们需要做的事情就是，找出最佳的参数a和b。按照上面给的数据，我们可以用最小二乘法等方法得到最佳的a=1，b=125，即：

A君体重=A君年龄+125

于是，我们可以预测，如果A君还不减肥的话，他的体重在40岁的时候就约摸为170斤。因此，某种意义上，我们可以通过回归预测未来了。

线性回归与逻辑回归

回归的关键在于这个预测是否准确。这取决于几个因素。首先，有可能我们要预测的对象（如A君的体重）不仅和某一个变量（如A君的年龄）相关，可能还和其它变量相关（如A君每天平均摄入的卡路里以及A君每天的运动量）。这样，就变成了多元回归。其次，有可能线性函数不是最佳的函数类，比如也许多项式函数更好，这就变成了非线性回归。此外，当我们需要预测的变量（比如A君是否肥胖）的值是离散（“是”或“否”）而不是连续的时候，我们就需要做逻辑回归。

3、支持向量机（Support Vector Machine，SVM）：统计流派在机器学习子领域的另一个重要应用。与逻辑回归类似，支持向量机也用来处理分类问题。

例如，我们在买西瓜的时候，希望通过望闻问切来在买瓜之前判断这个瓜到底是不是好瓜。于是我们可以通过一些观测手段得到西瓜的一些外在信息，如形状、重量、纹路、敲西瓜时候听到的声音等等。这些外在信息组成了一个高维空间中的向量，其中每一个维度代表一类信息。如下图所示，这些向量就对应着一个高维空间的点，我们需要做的事情是对这些点进行分类，把好瓜和不好的瓜区别开来。

支持向量机

如图所示，支持向量机在已有数据的基础上，通过一个超平面来做这个区分。这个超平面把整个空间分成两部分，一部分包含着一些点（如蓝色的点），对应着好瓜，而另一部分包含的点（如红色的点）对应着不好的瓜。这样，只要这个超平面画得好，那么新来了一个瓜，我们就可以通过望闻问切得到数据，再用超平面计算一下，看这个瓜到底在超平面的哪一边，即是不是好瓜。

4、决策论（Decision Theory）和马尔科夫决策过程（Markov Decision Process）：统计学在行动选择和智能体决策中的应用。决策是人工智能的核心问题之一。决策所关心的基本问题是在当前状态（可能包含历史信息）下，如何选取最佳的行动。决策也是人工智能最难的问题之一，这主要是由于真实环境下，状态和行动的建模有很多种复杂的可能性，以及智能体对信息掌握的不完备性。因此，在现阶段人工智能处理决策的时候，往往要设定一些假设来简化。由于假设的不同，可以分为基于符号流派的方法（包括人工智能规划、行动推理等等）和基于统计流派的方法（包括决策论、马尔科夫决策等等）。

如果我们直接知道在当前状态下哪个行动最优，那根本就毋需决策，直接选取该行动即可。然而，这个信息很难得到。但是，我们往往可以得到另外一个重要的信息，即当前状态执行某行动之后，大概会到达哪个状态，或者在哪些状态下的一个概率分布。如果对于这些状态，我们有一个期望的效应的话，那么我们可以对行动在某个状态下的整体期望效用计算，即该行动所有后果可能性的期望（后果状态的概率乘以后果状态的效用）总和，然后选择其中最优的。这就是最大期望效用决策论。

例如，小明在偷吃糖果，但是被爸爸抓到了。他可以选择坦白从宽或者抗拒从严。坦白从宽的后果只有一种，其后果可能是被爸爸教育一番，其期望值为-1。抗拒从严抵赖的话，后果可能有两种：a）爸爸被蒙混了过去，不会得到任何惩罚，其期望值为0，b）爸爸发现了真相，严厉地批评教育了小明，期望值为-2。但是以爸爸的睿智，前一种可能性不大，大约只有3成，而后者有7成。因此，坦白从宽的整体效用为-1；抗拒从严的整体效用为30%*0+70%*(-2)=-1.4。综上所得，前者整体效用较高，所以小明应该选择坦白从宽。

马尔科夫决策过程

把这个推广到多步行动，就得到了马尔科夫决策过程。和决策论一样，马尔科夫决策过程也是基于概率和效用来找出在状态下的最佳行动。但不一样的是，马尔科夫决策过程中，考虑多步行动的长期回报而不仅仅是一步行动。有的行动可能在当前回报并不是最佳，但长期回报会。因此，它仍然可能是当前状态的最佳选择。基于这个基本原理，马尔科夫决策过程会计算出所有状态下的最佳行动。如果满足假设，在每个状态下都执行最佳行动，最后一定能导致综合期望效用最大。

作者介绍

周熠，现任张江实验室脑与智能科技研究院/上海脑科学与类脑研究中心认知智能研究组课题组长，研究员，中国科学技术大学兼职教授。研究方向为认知人工智能，主要的研究兴趣为如何受脑启发，深度融合基于逻辑的符号流派和基于神经网络的连接流派，及其在认知人工智能领域中的应用，包括AI+教育、自动智商测试、智能语言处理等。

授权或合作请联系微信号MICIUS-SALON或mozi@ustc.edu.cn，转载微信原创文章可直接后台回复“转载”查看转载说明

墨子沙龙是以中国先贤“墨子”命名的大型公益性科普论坛，由中国科学技术大学上海研究院主办，中国科大新创校友基金会、中国科学技术大学教育基金会、浦东新区科学技术协会、中国科学技术协会及浦东新区科技和经济委员会等协办。

墨子是我国古代著名的思想家、科学家，其思想和成就是我国早期科学萌芽的体现，“墨子沙龙”的建立，旨在传承、发扬科学传统，建设崇尚科学的社会氛围，提升公民科学素养，倡导、弘扬科学精神。科普对象为热爱科学、有探索精神和好奇心的普通公众，我们希望能让具有中学及以上学力的公众了解、欣赏到当下全球最尖端的科学进展、科学思想。

关于“墨子沙龙”