会员登录
  • 没有账号? 去注册
会员注册
  • 已有账号? 去登录

科普文章

“我,人工智能”专栏 | 破题篇 VIII:“复现”“智能”一相逢(第四部分)
发布时间:2020-08-06    1360   
“我,人工智能”专栏 | 破题篇 VIII:“复现”“智能”一相逢P4

作者 | 周熠

上海脑科学与类脑研究中心

张江实验室脑与智能科技研究院

金风玉露一相逢,便胜却人间无数。

——秦观《鹊桥仙》

仿生流派

仿生流派受各式各样的生物学现象和原理启发,应用于人工智能之上。严格意义上,连接流派也是仿生流派的一种,因为人工神经网络受生物神经元所启发。但由于连接流派过于重要,因此把它单独列了出来。除此之外,仿生流派还包括遗传算法、仿生视觉、人工生命等等。

在进化生物学中,我们认为种群的进化往往是朝着一个好的方向发展的。物竞天择,适者生存。新一代种群往往比旧一代更优秀。而在进化生物学中,实现这个的手段包括基于DNA的遗传、突变、自然选择和杂交等等。

这些思想可以应用到机器学习中,特别是优化问题上面。首先,我们需要把优化问题转化成一个种群进化问题。在这里,优化问题的解的集合就是一个种群,开始的时候,这个种群可以是比较随机的。在每次种群演化的过程中,我们给予一些导向,以至于每一次演化,这个种群都会朝最优解/较优解的方向演变。长此以往,经过多轮演化之后,所得到的种群就可能包含我们所需要的最优解/较优解。

“我,人工智能”专栏 | 破题篇 VIII:“复现”“智能”一相逢P4

遗传算法

为了达到这个目的,首先,我们需要对优化问题进行编码,每一个可能的解称之为个体,往往表示成一个变量序列,如000000或111111,叫做染色体。其次,我们需要初始化一个种群,可以通过随机或者某种预处理的方法产生。第三步最重要,有了初始种群之后,我们需要演化出一个下一代的种群并持续迭代。下一代的种群理论上需要优于上一代。为了评价是否优劣,我们需要对每个个体进行评价,这通常通过一个适应度函数来计算。在适应度函数下,我们可以把种群的个体按照适应度高低排序。有了这个铺垫,我们就可以产生下一代种群了,其主要通过选择和繁殖。选择是指选择出两个个体(父亲和母亲)出来,这往往基于适应度。适应度越高,被选择的几率就越大。被选择的两个个体可以“交配”得到新的个体。如000000和111111交配,我们从中间断开并互换,可以得到两个新的个体,即111000和000111,其中前者的前三位来自于111111,后三位来自于000000,而后者正好相反。这样我们就得到了下一代的两个候选个体。而新得到的个体可以发生突变,如111000可能最后一位发生突变,从而变成111001。这也是得到新个体的一种方法。这样,通过选择和繁殖(包括交配和突变),在适应度函数的控制下,就可以迭代得到一个新的种群。而这个新的种群往往优于旧的(可以把不优秀的通过“自然选择”淘汰掉)。持续这种迭代,我们就有希望能够找到优化问题的最优解/较优解。

博弈流派/经济流派

《美丽心灵》这部电影,讲述了天才却又神经质的传奇数学家纳什(Nash)的故事。纳什是博弈论的代表性人物,提出了纳什均衡(Nash equilibrium)的概念,也因此而获得了诺贝尔经济学奖。

下面是一个纳什均衡的著名例子——囚徒困境。假设有两个小偷被抓住了,他们可以选择“坦白”或者“撒谎”。如果两个都坦白的话,按照坦白从宽的原则,他们都可以获得-8的收益;如果两个都撒谎的话,就可以骗过警察,从而都获得-1的收益;但如果一个坦白而另一个撒谎的话,撒谎的人就会得到重罚,得到-10的收益,而坦白的人无罪释放,收益为0。乍一看上,好像两位小偷应该选择撒谎,这样他们的收益总和才能最大化。但纳什均衡告诉我们,并不是这样的。假设两位小偷彼此没有互相通气,也都是维护自己的利益的理性选择者的话,那么他们会想,万一另外一个人选择了坦白,那我的收益不就从-1变成-10了么?因此,撒谎不是合适的选择,两个人都撒谎不是纳什均衡态。在一个纳什均衡态中,对于每一个智能体,无论其它智能体选择怎么改变,该智能体的收益都不会降低。因此,一人撒谎一人坦白也不是均衡态。在囚徒困境中,只有两个小偷/囚徒都坦白才是纳什均衡态。

“我,人工智能”专栏 | 破题篇 VIII:“复现”“智能”一相逢P4

囚徒困境的纳什均衡

纳什均衡天生就是考虑多个智能体之间的博弈,是经济学最重要的数学基础之一。因此,它和多智能体决策息息相关。所以,应用在多智能体系统中是一个自然而然的事情。

除了均衡之外,经济学和博弈论中的谈判(Bargaining)和机制设计(Mechanism design)等等,也广泛应用在多智能体系统之中。

社会学流派

与经济学和博弈论类似,社会学也是研究群体的社会行为。因此,也自然而然地和多智能体系统息息相关。其中的社交网络(Social network)和社会选择(Social choice)等等,在人工智能中的多智能体系统领域大放异彩。

在一个多智能体系统中,往往需要群体来一起做一些重要的决策,如选举。但选举远没有想象的那么简单。假设我们有三个投票人甲、乙、丙和三位被选举人A、B、C。他们的投票结果分别如下:

甲:A>B>C

乙:B>C>A

丙:C>A>B

其中,>表示优先级顺序。这种情况下,由于甲乙都认为B好于C,根据少数服从多数原则,整个社会也应认为B好于C。同理,每一对偏好都有两个支持者。所以,以上的投票就无法选出最后的优胜者。这就是著名的孔多塞投票悖论。

事实上,社会选择远远没有那么容易。例如,2000年美国大选,戈尔领先小布什50多万选票,最终却输掉了选举。这是因为美国的总统选举制度而导致。最终统计的不是所有选民“选票”总和而是选举州“选举人票”总和。每个州,按照人口,拥有不同的数量的选举人票。如果一个候选人获得了该州的大多数选民选票,那么他就获得这个州的全部选举人票。因此,就会出现这种戈尔选票多但选举人票少的奇怪现象,从而落选总统。

也许有人会抨击美国选举制度不合理。但是,阿罗在投票悖论的基础上,理论上证明了关于投票的非常违反直觉的不可能性定理。不存在同时满足无限制原则、独立性原则、一致性原则和非独裁原则的投票系统。简而言之,不存在绝对合理的社会选择系统。

信息论流派

信息论是关于信息的理论,由我们前面提到的香农创立,主要研究信息的编码、传输、转换等等。而算法信息论主要关心字符串里面包含的信息该如何度量,以及如何从已有的字符串/信息中预测新的字符/信息。

《大话西游》中的唐僧,说得很多都是废话,其中包含的信息量很少。这事实上能启发我们思考算法信息论中的一个根本问题:给定要传递的信息,最少需要多少字符才能将其完整地表达出来?达特茅斯会议的参与者之一所罗门诺夫(Solomonoff)和苏联大数学家柯尔莫哥洛夫(Kolmogorov)深入研究了这个问题,并且给出了严格的数学刻画。

更有意思的是,我们是否能够从已有的字符串(如01001101001101001101)中,预测下一位字符究竟是0还是1?乍一看上去,这应该是不可能的。但是,如果我们知道一些规律(如上述字符串其实可能是“010011”的无限重复),我们就可以做某些预测(如在上面例子中,下一位为0的概率很大),至少比瞎猜要强上不少。

“我,人工智能”专栏 | 破题篇 VIII:“复现”“智能”一相逢P4

作者介绍

周熠,现任张江实验室脑与智能科技研究院/上海脑科学与类脑研究中心认知智能研究组课题组长,研究员,中国科学技术大学兼职教授。研究方向为认知人工智能,主要的研究兴趣为如何受脑启发,深度融合基于逻辑的符号流派和基于神经网络的连接流派,及其在认知人工智能领域中的应用,包括AI+教育、自动智商测试、智能语言处理等。

授权或合作请联系微信号MICIUS-SALON或mozi@ustc.edu.cn,转载微信原创文章可直接后台回复“转载”查看转载说明

关于“墨子沙龙”

墨子沙龙是以中国先贤“墨子”命名的大型公益性科普论坛,由中国科学技术大学上海研究院主办,中国科大新创校友基金会、中国科学技术大学教育基金会、浦东新区科学技术协会、中国科学技术协会及浦东新区科技和经济委员会等协办。

墨子是我国古代著名的思想家、科学家,其思想和成就是我国早期科学萌芽的体现,“墨子沙龙”的建立,旨在传承、发扬科学传统,建设崇尚科学的社会氛围,提升公民科学素养,倡导、弘扬科学精神。科普对象为热爱科学、有探索精神和好奇心的普通公众,我们希望能让具有中学及以上学力的公众了解、欣赏到当下全球最尖端的科学进展、科学思想。