会员登录
  • 没有账号? 去注册
会员注册
  • 已有账号? 去登录

科普文章

“我,人工智能”专栏 | 破题篇 VII:“复现”“智能”一相逢 (第三部分)
发布时间:2020-07-29    1218   墨子沙龙
“我,人工智能”专栏 | 破题篇 VII:“复现”“智能”一相逢 P7

作者 | 周熠

上海脑科学与类脑研究中心

张江实验室脑与智能科技研究院

金风玉露一相逢,便胜却人间无数。

——秦观《鹊桥仙》

行为流派

1、反应式系统(Reactive System):行为流派在机器人等领域的应用。反应式系统和产生式系统一样,表示上都采用形如

A1,A2,…,An ->B

的规则,其中,A1,A2,…,An为前提条件,B为结论,更多的时候,B就是一个直接的行动。简而言之,它的直观含义是如果前提条件都满足,那么我们就执行行动B。

例如,用反应式系统设计一个简单的恒温器,将室内温度恒定在某个值,如20度。假设传感器可以接受并检测室内的温度,以及空调可以有升温和降温两个操作。那么,可以构建一个简单的反应式系统,包括两条反应式规则:

“传感器接收到的温度大于20度 -> 降温”

“传感器接收到的温度小于20度 -> 升温”

行为流派的反应式系统和符号流派的产生式系统的界限有些模糊,甚至有时候这两个术语在混淆使用。如果一定要深究它们的差别,主要在于以下几个方面:a)产生式系统一般是抽象规则(Schema rule),一条产生式规则可以实例化成多个具体规则,而反应式系统一般就是具体规则(Specific rule);b)产生式系统很多时候有控制中心来控制规则触发,反应式系统一般不强调这点;c)产生式系统很多时候带有工作记忆,反应式系统一般不强调;d)产生式系统有时候会带有语法结构,而反应式系统没有;e)在产生式系统中,结论B往往也是一个后承条件,但在反应式系统中,结论B很多时候是一个行动;f)产生式系统往往会在执行规则后更新智能体状态,但反应式系统一般不保留状态。

2、包容式结构(Subsumption Architecture):行为流派在机器人领域中的应用。包容式结构是对反应式系统的一个扩展。它们的基本思想一致,即不显式的表示智能体的内部状态和对环境的建模,仅仅通过简单的规则对外界环境的刺激(通过传感器被智能体接收)进行反应。但是,与反应式系统不一样的是,包容式结构是一个多层结构。不同的层次在不同的抽象层次对传感器得到的信息进行反应。

“我,人工智能”专栏 | 破题篇 VII:“复现”“智能”一相逢 P7

包容式结构

例如,对一个扫地机器人而言,最底下的一层可能仅仅是躲避障碍物;之上一层可能是在地板上随意闲逛;而再上一层就是探索整个地板空间。从这个意义上,包容式结构算一个自底向上智能体体系结构,这和传统符号逻辑的自顶向下的结构形成显著区别。

包容式结构着重强调了智能体的反应性、实时性、并行性、应景性、具化性、演化性和涌现性。然而,这种完全不考虑显式表示的做法也受到一些诟病。例如,看上去很难直接处理一些抽象的概念,如结构化知识等。

统计流派

1、蒙特卡洛方法(Monte Carlo Method):统计流派在人工智能诸多领域的应用。蒙特卡洛方法是一个特别简单的随机抽样方法。基本的思想是以“频率”来计算概率。如果我们要判断一个事件发生的概率,我们可以通过频率实验的方法来近似。我们随机地实验N次,如果这个事件发生了M次,也就是这个事件的发生频率为M/N,那么我们可以简单地认为这件事情发生的概率近似为M/N。随着N越大,这个近似也就越准确。

例如,如需要计算下图阴影部分的面积,当然一种方式就是认定这是四分之一个圆,然后用圆形的面积公式计算。但蒙特卡洛方法独辟蹊径,在这个正方形中随机放入一些点,然后看这些点是否落在阴影区域之内。只要点放得足够多,也足够好,那么我们可以近似认为:

阴影部分面积=落在阴影中点的个数/所有点的总数

“我,人工智能”专栏 | 破题篇 VII:“复现”“智能”一相逢 P7

蒙特卡洛方法

虽然乍一看上去,蒙特卡洛方法和用圆形面积公式方法相比,只是一个近似方法,得不到精确解。但是,在很多应用场景,精确解只能是一个奢望。例如,上图中的阴影部分是一个非常不规则的图形。此时,蒙特卡洛方法至少可以可以帮助我们得到一个近似解。

除此之外,“足够多”和“足够好”非常重要。依然采用上面的例子,如果落点就10个,那不可能逼近我们想要的精确解π/4。如果落点不是完全随机的,比如偏右边多一点,那么所得到的结果也会谬以千里。

2、回归(Regression):统计流派应用在机器学习子领域。回归是一种相对简单的统计方法,目的是在给定一些数据,找出两个或者多个变量之间的关系。更确切一点地说,给定一些数据和我们预想的函数类,在这个函数类里面找出一个最佳的函数,能够很好地模拟这些数据。假设这个模拟很好的话,我们就可以拿来做预测。

例如,我们观察发现A君在大学毕业时年龄25岁,体重150斤。随后每年体重逐步上升,如26岁体重151斤,27岁体重152斤,……,35岁体重160斤。基于这样的观察数据,我们可以试图拟合A君体重和A君年龄之间的关系,假设我们采用线性回归(Linear Regression),即假设:

A君体重=A君年龄*a+b

那么我们需要做的事情就是,找出最佳的参数a和b。按照上面给的数据,我们可以用最小二乘法等方法得到最佳的a=1,b=125,即:

A君体重=A君年龄+125

于是,我们可以预测,如果A君还不减肥的话,他的体重在40岁的时候就约摸为170斤。因此,某种意义上,我们可以通过回归预测未来了。

“我,人工智能”专栏 | 破题篇 VII:“复现”“智能”一相逢 P7

线性回归与逻辑回归

回归的关键在于这个预测是否准确。这取决于几个因素。首先,有可能我们要预测的对象(如A君的体重)不仅和某一个变量(如A君的年龄)相关,可能还和其它变量相关(如A君每天平均摄入的卡路里以及A君每天的运动量)。这样,就变成了多元回归。其次,有可能线性函数不是最佳的函数类,比如也许多项式函数更好,这就变成了非线性回归。此外,当我们需要预测的变量(比如A君是否肥胖)的值是离散(“是”或“否”)而不是连续的时候,我们就需要做逻辑回归。

3、支持向量机(Support Vector Machine,SVM):统计流派在机器学习子领域的另一个重要应用。与逻辑回归类似,支持向量机也用来处理分类问题。

例如,我们在买西瓜的时候,希望通过望闻问切来在买瓜之前判断这个瓜到底是不是好瓜。于是我们可以通过一些观测手段得到西瓜的一些外在信息,如形状、重量、纹路、敲西瓜时候听到的声音等等。这些外在信息组成了一个高维空间中的向量,其中每一个维度代表一类信息。如下图所示,这些向量就对应着一个高维空间的点,我们需要做的事情是对这些点进行分类,把好瓜和不好的瓜区别开来。

“我,人工智能”专栏 | 破题篇 VII:“复现”“智能”一相逢 P7

支持向量机

如图所示,支持向量机在已有数据的基础上,通过一个超平面来做这个区分。这个超平面把整个空间分成两部分,一部分包含着一些点(如蓝色的点),对应着好瓜,而另一部分包含的点(如红色的点)对应着不好的瓜。这样,只要这个超平面画得好,那么新来了一个瓜,我们就可以通过望闻问切得到数据,再用超平面计算一下,看这个瓜到底在超平面的哪一边,即是不是好瓜。

4、决策论(Decision Theory)和马尔科夫决策过程(Markov Decision Process):统计学在行动选择和智能体决策中的应用。决策是人工智能的核心问题之一。决策所关心的基本问题是在当前状态(可能包含历史信息)下,如何选取最佳的行动。决策也是人工智能最难的问题之一,这主要是由于真实环境下,状态和行动的建模有很多种复杂的可能性,以及智能体对信息掌握的不完备性。因此,在现阶段人工智能处理决策的时候,往往要设定一些假设来简化。由于假设的不同,可以分为基于符号流派的方法(包括人工智能规划、行动推理等等)和基于统计流派的方法(包括决策论、马尔科夫决策等等)。

如果我们直接知道在当前状态下哪个行动最优,那根本就毋需决策,直接选取该行动即可。然而,这个信息很难得到。但是,我们往往可以得到另外一个重要的信息,即当前状态执行某行动之后,大概会到达哪个状态,或者在哪些状态下的一个概率分布。如果对于这些状态,我们有一个期望的效应的话,那么我们可以对行动在某个状态下的整体期望效用计算,即该行动所有后果可能性的期望(后果状态的概率乘以后果状态的效用)总和,然后选择其中最优的。这就是最大期望效用决策论。

例如,小明在偷吃糖果,但是被爸爸抓到了。他可以选择坦白从宽或者抗拒从严。坦白从宽的后果只有一种,其后果可能是被爸爸教育一番,其期望值为-1。抗拒从严抵赖的话,后果可能有两种:a)爸爸被蒙混了过去,不会得到任何惩罚,其期望值为0,b)爸爸发现了真相,严厉地批评教育了小明,期望值为-2。但是以爸爸的睿智,前一种可能性不大,大约只有3成,而后者有7成。因此,坦白从宽的整体效用为-1;抗拒从严的整体效用为30%*0+70%*(-2)=-1.4。综上所得,前者整体效用较高,所以小明应该选择坦白从宽。

“我,人工智能”专栏 | 破题篇 VII:“复现”“智能”一相逢 P7

马尔科夫决策过程

把这个推广到多步行动,就得到了马尔科夫决策过程。和决策论一样,马尔科夫决策过程也是基于概率和效用来找出在状态下的最佳行动。但不一样的是,马尔科夫决策过程中,考虑多步行动的长期回报而不仅仅是一步行动。有的行动可能在当前回报并不是最佳,但长期回报会。因此,它仍然可能是当前状态的最佳选择。基于这个基本原理,马尔科夫决策过程会计算出所有状态下的最佳行动。如果满足假设,在每个状态下都执行最佳行动,最后一定能导致综合期望效用最大。

“我,人工智能”专栏 | 破题篇 VII:“复现”“智能”一相逢 P7

作者介绍

周熠,现任张江实验室脑与智能科技研究院/上海脑科学与类脑研究中心认知智能研究组课题组长,研究员,中国科学技术大学兼职教授。研究方向为认知人工智能,主要的研究兴趣为如何受脑启发,深度融合基于逻辑的符号流派和基于神经网络的连接流派,及其在认知人工智能领域中的应用,包括AI+教育、自动智商测试、智能语言处理等。

授权或合作请联系微信号MICIUS-SALON或mozi@ustc.edu.cn,转载微信原创文章可直接后台回复“转载”查看转载说明

墨子沙龙是以中国先贤“墨子”命名的大型公益性科普论坛,由中国科学技术大学上海研究院主办,中国科大新创校友基金会、中国科学技术大学教育基金会、浦东新区科学技术协会、中国科学技术协会及浦东新区科技和经济委员会等协办。

墨子是我国古代著名的思想家、科学家,其思想和成就是我国早期科学萌芽的体现,“墨子沙龙”的建立,旨在传承、发扬科学传统,建设崇尚科学的社会氛围,提升公民科学素养,倡导、弘扬科学精神。科普对象为热爱科学、有探索精神和好奇心的普通公众,我们希望能让具有中学及以上学力的公众了解、欣赏到当下全球最尖端的科学进展、科学思想。

关于“墨子沙龙”