会员登录
  • 没有账号? 去注册
会员注册
  • 已有账号? 去登录

科普文章

“我,人工智能”专栏 | 破题篇IX:“复现”“智能”一相逢(第五部分)
发布时间:2020-08-13    1470   
“我,人工智能”专栏 | 破题篇IX:“复现”“智能”一相逢 P5

作者 | 周熠

上海脑科学与类脑研究中心

张江实验室脑与智能科技研究院

金风玉露一相逢,便胜却人间无数。   ——秦观《鹊桥仙》

人工智能是一门交叉科学。凡是与人或智能相关的学科,都多多少少和人工智能有些关系,包括逻辑学、神经科学、统计学、生物学、心理学、经济学、社会学、认知科学、哲学等等。这些学科为“复现”人工智能提供了基本的思路,从而启发了人工智能的各种流派。

这些流派应用在人工智能的各个子领域中,产生了人工智能众多技术。例如,逻辑学启发了符号流派,应用在知识表示与推理中,产生了如逻辑推理、专家系统等技术。神经科学启发了连接流派,应用在机器学习、计算机视觉、自然语言处理等领域中,产生了各种结构的神经网络。行为主义心理学等启发了行为流派,产生了反应式系统和包容式体系结构。统计学、仿生学、博弈论等等和人工智能交叉,也产生了各种不同的人工智能技术。

这就像东坡先生写的那首诗一样:“横看成岭侧成峰”。这些交叉的学科就是不同的横侧面,从各自不同的角度来破题人工智能这座神秘的大山,得到了不同的岭和峰,也就是人工智能中形形色色的重要的技术。

“我,人工智能”专栏 | 破题篇IX:“复现”“智能”一相逢 P5

横看成岭侧成峰

然而,这些岭和峰也都是大山的一角,还远远没有识破大山的“真面目”。更重要的是,这些岭和峰“远近高低各不同”,但又切切实实地描绘了人工智能这座大山的某一个小的侧面。

那怎样才能真正识破人工智能这座大山呢?

至少有两种自然而然而又截然迥异的思路。第一种就是沿着某一个横侧面走到底,由小及大,从而勘破整个大山,期望在最后能够真正攻克人工智能。八十年代以专家系统为代表的符号流派,以及当前以深度学习为代表的连接流派,就是朝这个方向在努力。

而另外一种思路就是采各家所长,将不同的流派有机地结合起来,同时从不同的横侧面多方位结合,来勘察人工智能这座大山。从而期望能对人工智能的“真面目”有更深入的理解。

这就是交叉/融合流派。

交叉/融合流派:

1、决策树(Decision Tree)和随机森林(Random Forrest):符号流派与统计流派交叉在机器学习中的应用。

决策树是一个树形结构,其中的每个叶子节点是一个决策,而每个非叶子节点是一个选择,或者叫做测试。在每个非叶子节点,不同的选择,或者说测试结果,导致树不同的分叉。

在银行决定是否给客户发放贷款,第一个测试可能是该用户信用记录。如果该用户信用记录不好,那么就会产生一个分叉拒绝放贷,这就是一个决策叶子节点。如果该用户信用记录良好,那么就产生到另外一个分叉,有可能进行第二次选择,如用户资产。这时又会产生分叉,如用户资产和借贷额不满足一定条件,那么依然选择拒绝放贷;如满足条件,则继续测试。最终,这会形成一个决策树。

“我,人工智能”专栏 | 破题篇IX:“复现”“智能”一相逢 P5

一个决策树案例

2、贝叶斯网络(Bayesian Network):符号流派与统计流派交叉在机器学习和不确定性人工智能领域中的应用。

贝叶斯网络是一个有向无环图,其中顶点是描述一个领域内的变量,而边代表变量之间的条件相关性。贝叶斯网络的最重要的假设在于两个顶点不相连代表它们条件独立无关。因此,给定一个贝叶斯网络和一些变量的概率,可以通过贝叶斯公式展开来计算其它变量的概率。

例如,在疾病诊断领域,可以建立一个贝叶斯网络来表示症状与疾病之间的条件相关性。那么,给定某个患者的一些症状,就可以通过这个贝叶斯网络来计算该患者得某种疾病的可能性。同时,也可以根据症状和疾病相关性的数据来学习这个贝叶斯网络的参数(即条件相关性)以及网络结构。

“我,人工智能”专栏 | 破题篇IX:“复现”“智能”一相逢 P5

一个疾病诊断的贝叶斯网络

3、语义网络(Semantic Network)和知识图谱(Knowledge Graph):符号流派、认知流派、统计流派等交叉在知识工程中的应用。

语义网络部分起源于认知神经科学关于语言的研究。简而言之,一个语义网络可以表示成一个有向图,其中顶点是一些单词/概念,而其中的边代表了两个概念之间的关系,用标签标出。而这种<概念、关系、概念>关系三元组,即两个顶点与它们之间的关系,就构成了一条知识。例如,在定义篇里面提到的水果的内涵定义,就可以用如下的语义网络解释。它包含四个三元组,分别对应四条知识。

<水果,是,多汁>:水果是多汁的;

<水果,是,可食用>:水果是可食用的;

<水果,味觉,甜味/酸味>:水果的味道是甜味或者酸味;

<水果,是,植物果实>:水果是植物果实。

“我,人工智能”专栏 | 破题篇IX:“复现”“智能”一相逢 P5

用语义网络定义水果的内涵

语义网络由于其结构简单,方便易懂,在很多领域都有重要的应用。比如在自然语言理解领域应用很广的WordNet以及ConceptNet就是一个典型的语义网络。

而知识图谱可以看成是语义网络的一个扩充。从表示上来讲,知识图谱就是一个语义网络。然而,知识图谱主要强调两点:即网络的(半)自动获取以及网络的规模。

传统的语义网络的构建主要基于(各种方法)手动构建,而知识图谱更加强调用自动或半自动的手段在结构化、半结构化和非结构化数据中获取三元组知识。正因为如此,知识图谱与传统的语义网络相比,其规模可以达到相当大的程度。虽然知识图谱的思想甚至包括名称在学术界早已有之,但其真正的腾飞还是在2011年Google提出的知识图谱系统,并且将其成功应用在Google搜索领域。随后,国内外很多大公司紧随其后,开发了规模相当庞大的语义网络,其中概念的数目超过数千万,而三元组的数目达到10亿级别,而这个数目正在急剧攀升中。

4、阿尔法狗(AlphaGo):连接流派、符号流派和统计流派结合,在围棋等棋类游戏中的应用。

严格意义上,阿尔法狗以及它后面的姊妹阿尔法狗零(AlphaGo Zero)以及阿尔法零(Alpha Zero)是一个具体的工作,而很不是一类技术的统称。但是由于其颇具代表性,因此非常值得一提。

阿尔法狗系列事实上是连接流派(深度学习神经网络)、符号流派(搜索)和统计流派(蒙特卡洛方法)的一次巧妙结合。在其横空出世之前,已经有了一些在人工智能下围棋方面的重要尝试,包括蒙特卡洛方法和搜索结合的蒙特卡洛树搜索等。

“我,人工智能”专栏 | 破题篇IX:“复现”“智能”一相逢 P5

阿尔法狗 vs 李世石

对于下棋(围棋)而言,最重要之处在于如何落子,即在当前的棋盘状态下选择最好的位置,然后落下一枚(黑或白)棋子。理论上,棋类游戏存在必胜策略,也就是说,存在最佳的落子。但是由于其过于复杂,所以大家往往很难发现。

对人来说,落子主要依靠过往的知识,包括日积月累的下棋经验以及众多棋谱。而在之前用的蒙特卡洛树搜索方案中,这些经验并没有被充分利用。

阿尔法狗恰恰就利用了这些知识,再加上自己和自己重复无数次的对弈,采用深度学习的方法学习一个落子函数(其输入是当前的棋盘状态,而输出是最佳落子),从而完美地完成了逆袭,一举击败人类围棋世界冠军。而其后的姊妹阿尔法狗零更加是摒弃了过往的经验知识,直接从左右互博的对弈中,学习到了更好的落子方案。

除了这些之外,交叉/融合流派还有不少值得一提的工作,包括符号流派和统计流派结合的马尔可夫逻辑网络(Markov logic network)、模糊逻辑(Fuzzy logic)、归纳逻辑程序(Inductive logic programming)、概率上下文无关文法(Probabilistic context free grammar)等等。这些工作从不同的角度,试图采取众家之长处。

交叉/融合流派取得了很多成就。乍一看上去,这似乎为识破人工智能这座大山的真面目开了一扇大门。甚至,如果能将这些流派统一起来,那不是更好么?然而,交叉/融合流派的工作进展相当困难。其主要原因之一在于不同的流派(如符号流派和连接流派)所采取的假设相差很大,有的甚至是背道而驰。另一方面,融合的方式通过组合,可能性非常之多。因此,交叉/融合/统一流派的征程必将充满坎坷。路漫漫其修远兮,吾方上下而求索。

结束语:

“复现”(各流派)应用到“智能”(各领域),碰撞出很多火花,产生了很多人工智能的重要技术。这几节列举了其中不少,但它们只是人工智能中的一部分。虽然只有短短60多年的历史,但是人工智能已经成长为一个庞大的领域。由于篇幅等原因,不一一论述。

这样也带来了一个问题。对于具体的一个应用领域,到底该用哪种人工智能技术呢?带着这个问题,我们开启下一章“运用篇”。

“我,人工智能”专栏 | 破题篇IX:“复现”“智能”一相逢 P5

作者介绍

周熠,现任张江实验室脑与智能科技研究院/上海脑科学与类脑研究中心认知智能研究组课题组长,研究员,中国科学技术大学兼职教授。研究方向为认知人工智能,主要的研究兴趣为如何受脑启发,深度融合基于逻辑的符号流派和基于神经网络的连接流派,及其在认知人工智能领域中的应用,包括AI+教育、自动智商测试、智能语言处理等。

授权或合作请联系微信号MICIUS-SALON或mozi@ustc.edu.cn,转载微信原创文章可直接后台回复“转载”查看转载说明

墨子沙龙是以中国先贤“墨子”命名的大型公益性科普论坛,由中国科学技术大学上海研究院主办,中国科大新创校友基金会、中国科学技术大学教育基金会、浦东新区科学技术协会、中国科学技术协会及浦东新区科技和经济委员会等协办。

墨子是我国古代著名的思想家、科学家,其思想和成就是我国早期科学萌芽的体现,“墨子沙龙”的建立,旨在传承、发扬科学传统,建设崇尚科学的社会氛围,提升公民科学素养,倡导、弘扬科学精神。科普对象为热爱科学、有探索精神和好奇心的普通公众,我们希望能让具有中学及以上学力的公众了解、欣赏到当下全球最尖端的科学进展、科学思想。

关于“墨子沙龙”