演讲者:王飞跃(中国科学院自动化研究所复杂系统管理与控制国家重点实验室主任、国防科技大学军事计算实验与平行系统技术研究中心主任)
演讲时间:2016年6月
本期我为大家以学术家族树的形式列举众多在人工智能领域做出巨大贡献的科学家们,也将从哲学、现代各个角度讲述人工智能的产生和发展。此次报告一共分成三个部分:人工智能的“本源”、人工智能近代史和未来的人工智能。
1.人工智能的“本源”
2016年是人工智能会议召开的第60年,好多人把这个会议当作人工智能诞生60年,我认为不妥。我们人类智能从猴子时代(达尔文进化论)就开始了,怎么可能只有60年呢。这是当年参加会议的其中几个人的合照。
图1.2006年,Dartmouth会议
会议可以顺利开成,功劳最大的人是约翰·麦卡锡(John McCarthy),他是逻辑主义、符号主义的代表人。因为他是Lisp语言的创始人,所以人工智能都会用Lisp语言。
图2.约翰·麦肯锡John McCarthy
麦卡锡毕业于普林斯顿大学,跟明斯基(Marvin Lee Minsky)是同一个数学系毕业的,后来他去美国的汉诺威教书。最初他是做Automata的,就是自动机。1955年,他想打造一个领域,第一要跟Automata没关系,第二要与诺伯特·维纳(Norbert Wiener)的控制论没关系。
为什么要与控制论无关呢?因为当时维纳脾气特别不好,他觉得自己是全世界最聪明的人,谁只要不附和,他就脾气大的很,年轻人都想逃出他的魔掌。麦卡锡就想subject是怎么起来的,是靠conference做的。他也想制作一个东西,让全世界都来做,一跟自动机无关,二跟控制论无关。然后麦卡锡就想出Artificial Intelligence,于是给Rockefeller写了封信,说给我一笔钱,我来开个关于人工智能的研讨。麦卡锡列了一系列的题目,包括神经元网络、怎么下棋,以及逻辑编程。最初他们10个人一起写了个proposal,一群二十几岁的年轻人,想想没有名气,找个有名气的四十几岁的克劳德·香农(Claude Elwood Shannon)(信息论的创始人)一起弄。
香农跟维纳是死对头,因为他当年提信息论的时候是二战,那时香农是个学生,整天问维纳问题,借鉴维纳的想法。后来维纳拒绝见他,说香农每次来都是来挖他脑浆的,香农把维纳的想法变个符号,就变成他自己的。所以维纳对提信息论非常有意见,觉得都是剽窃他的东西。维纳提的熵正号,信息论的熵和物理的熵不要重叠,然后香农把正号变成负号,这就叫发明,维纳就不高兴了,说以后香农再回到学校来,再也不会见他了。
图3.克劳德·香农
所以麦卡锡就找香农牵头一起写proposal,办个两周的研讨会,10个人落款申请。最后他们申请了15,000,得到了7,500的经费,有十几个人参加。我认为这里面贡献最大的是明斯基,麦卡锡只是发起者。人工智能的三个主要学派,其中两个是明斯基创立的,比如说神经元网络,明斯基是第一个在博士论文里面提出随机神经元网络的。但是他差一点就拿不到博士学位,数学系的人说,这哪是数学系的博士论文。幸亏冯·诺依曼是博士委员会的,他说这个博士论文今天不是数学系的,未来就会成为数学系的,明斯基的答辩才能通过。明斯基还是认知科学家,其实是行为主义,但他很长一段时间都自称是认知科学家,而不是人工智能科学家。
Dartmouth会议60年后,我来德国汉诺威参加汉诺威工业展。因为汉诺威是提出工业4.0的地方,我想去看它的会展怎么样。Phoenix Contact这个公司邀请我去的,我非常喜欢这个公司的名字。人工智能60年,中国人说叫一个甲子,一个甲子就是一个轮回的开始。Phoenix Contact直接翻译成中文就是凤凰接触,接触凤凰之后就是要涅槃重生,后来我给他起个名字叫“凤凰涅槃,智慧天下”,这就是Phoenix Contact的解释。
图4.Phoenix Contact 和 王飞跃教授
然后我在跟大家聊的时候,照片左边那个人叫Frank,他是Phoenix Contact的CEO, 聊起智能的发展,他说莱布尼茨就生在汉诺威,我就说汉诺威这个地方很有意思,是现代人工智能的发源地,但是也是古代人工智能提出的地方。不过后来一查,莱布尼茨不是生在汉诺威,而是死在汉诺威,一生一死倒过来的。我为什么要提这个人,其实人工智能的古代史,近代史,就是这三个人。
图5.三点一线
第一个是亚里士多德,第二个是莱布尼茨,最后一个集大成者就是布尔。关于人工智能,我为什么要提这三个哲学家呢?亚里士多德是第一个把逻辑形式化的人,形式逻辑就是这么来的。哲学的原意是追求智慧的意思,它跟人工智能连起来是很自然的事情。所有的科学,近代的物理、化学都是从哲学,从爱智慧开始的。博士学位叫Ph.D.(Doctor of Philosophy),但大家学的是工程不是哲学。所以亚里士多德给古代人工智能史开了个头。之后就是莱布尼茨,大家都知道他跟牛顿为了争谁是第一个发明微积分打得一塌糊涂。他发表论文比牛顿还早,今天我们微积分的符号都是来自莱布尼茨。
牛顿那个符号没有人能看得懂,没有人愿意用的。但是牛顿的地位比他高。牛顿活的时候恨死莱布尼茨,都不准莱布尼茨来英国。所以当时莱布尼茨当的是法国的院士,而不是英国的院士。莱布尼茨研究过推理器微积分。我们现在计算机处理基于二进制,这也是莱布尼茨发明的,他在发明二进制之前还做了一个叫推理器微积分。咱们高中的微积分是计算数的,莱布尼茨说他还要发明一个微积分,是计算大脑怎么进行推理的。所以他起来了个名叫推理器微积分,可惜这个论文在哪里都不知道!现在大家只能找到几个名词来推断他曾发过这篇文章。他研究这个的目的是把思维也模式化。莱布尼茨当上法国科学院院士的时候提交的第一篇论文(1976年,《论中国人的自然神学》(“Discourse on the Natural Theology of the Chinese”),说二进制与我们的阴阳八卦是一致的。编辑收到论文一时不知所措,等了几年后还是发表了。
我为什么要提这件事呢,咱们中国有四大发明。其实我认为有第五大发明,那就是阴阳八卦。把二进制与阴阳八卦连在一起,我自己都不可置信。记得我在美国刚读书的时候,一个清华大学计算机来的学生和我说,二进制就是咱们中国人发明的八卦,然后我把人家骂了一通,我说不要搞的什么都是咱们中国人发明的!结果后来我与McNaughton (导师)讲,McNaughton说是啊,这个就是跟中国的阴阳八卦有关系的,莱布尼茨就讲过。
后来我去查证,才发现莱布尼茨确实写过这样一篇文章。阴阳八卦就是咱们讲的知识自动化的第一步。这个世界这么复杂,做个决策这么难,不如来算卦。算卦更多是心理暗示的作用,我们不应该局限在那个地方。
中国人的四大发明,其实是外国人说的。第一个发明是指南针,外国人用来航海,我们用来干嘛?算风水去了。第二大发明是火药,人家诺贝尔做炸药还发财,设个诺贝尔奖。我们呢,放爆竹去了。第三大发明是印刷术,为什么有印刷术?当时有钱人信佛教,需要抄经,抄的越多,福分越多。抄的太累,就有了印刷,所以印刷最初是用来做经卷的。咱们第四大发明是什么?造纸。造纸最初是用来烧钱的,给逝者送钱去。所以说我们的四大发明,都没有用到正道上去。
图6.四大发明
时光荏苒,转眼来到智能时代,八卦可以说是智能决策最早的元素。结果我们用八卦算命去了我认为,不是老子英雄,儿好汉,而是儿子英雄,老子好汉。我们不用整天说古代中国多厉害,你现在厉害了,人们自然认为古人的东西也很厉害。
我到了美国留学的前两周,借住在教堂里。教堂里有个图书馆,我就找到了这本《Laws of Thought》,这是主教的私人藏书。我当时就想,只听过有牛顿定理,竟然还有思维定律,一时好奇就看下去了。看了之后我觉得大部分是胡言乱语。后来我的舍友,一个叫Judy的男生,他说,我们系里有个教授是研究这方面的专家,就是McNaughton,McNaughton就是这样变成我的导师的,所以我非常感谢这本书。那几天我一直看这本书,主教说你喜欢就送给你吧,这是我收藏的第一本珍本书,快100年了。就是因为这本书,我把人工智能的古代历史去追究了一番。
回到前文,莱布尼茨虽然写了一些论文但他只是提出了几个名词,对人工智能的诞生最有贡献的是乔治·布尔,他写了一本书。当时写书时有很多人反对。但他有个非常有力的支持者,就是德·摩根(De Morgan),摩根是个非常有名的教授,他极力支持布尔把形式逻辑化。后来,查尔斯·巴贝奇(Charles Babbage),发明世界第一个计算机的人,把形式逻辑实践化了。
摩根有一个学生和巴贝奇合作,据说写了世界上第一个程序,所以她号称世界第一个程序员,她就是Ada Lovelace。现在好多ACM(Association for Computing Machinery ), 即国际计算机学会的奖,都是以她的名字命名的。
图7.Ada Lovelace(美国国防部发明的第一个面向对象的智能编程语言就叫Ada,她有一个很有名的爸爸,诗人拜伦。)
图8.人工智能学术家庭
这就是在人工智能发展史上最有名的两个家族,德·摩根(De Morgan)家族和泊松(Poisson)家族,泊松就是概率论里泊松分布那个人,泊松家族追溯上去第三代就是伽利略,第六代是牛顿,第七代是泰勒,泰勒就是咱们学的泰勒级数,这个家族上去的第一代人是欧拉,就是咱们学过的欧拉公式,大数学家,这些是数学家们;中间从亚里士多德开始,莱布尼茨,布尔,然后传下去,贡献最大的是戴维·希尔伯特(David Hilbert),1900年8月8日,他在巴黎第二次国际数学家大会上提出了23个数学问题,要把数学机械化,数学机械化差不多就是智能机械化,这激发了伯特兰·罗素(Bertrand Russell)的灵感。
图9.戴维·希尔伯特图 10.波兰特·罗素
咱们现在都知道罗素是个哲学家,其实罗素最初是个数学家,不过他得了诺贝尔文学奖,写了《西方哲学史》。罗素和他的老师被希尔伯特的思想给迷住了,花了10多年写了三卷本的《数学原理》,想把数学公理化、逻辑化。三卷的书,亏了五六百英镑,在那个时代这是一大笔钱,所以罗素说这是他这辈子做的最亏本的买卖。但是他自己亏本了,对人类却是个巨大的贡献,这个思想激发了很多人,想把数学机械化。这时出来一个人捣乱,库尔特·哥德尔(Kurt Godel),他23岁的时候就证明了这是不可能的,所以有个哥德尔不完备定理——用有限的系统把所有的结论都推出来是不可能的,不能自洽,一定有矛盾的。把它具体下来的,是图灵。
然而中间又杀出个维纳来,维纳也是受数学原理的启发,最初从哲学转到数学去,但他做的博士论文也是关于数学原理,他开始研究动物,后来研究哲学,最后又研究数学,研究生物系统的反馈,以及怎么利用反馈系统让高射炮打的准,其实他只是想象一通。战争里面从来都没用过,现在说他对战争有多少贡献,其实他没有什么贡献。美国军方把他的论文拿来之后,立即变成绝密的,只有很少几个人才知道,把他那本书叫做“黄祸”(yellow peril),当年形容咱们中国人就叫黄祸,因为人太多了。他的报告里面数学式子太多了,叫yellow peril。
他的报告激发大家去思考:大脑是怎么工作的,就是数学原理里面描述的那个故事。由此激发了维纳,沃伦·麦卡洛克(Warren McCulloch)和沃尔特·皮茨(Walter Pitts)。
图11.沃伦•麦卡洛克(Warren McCulloch) 图12.沃尔特·皮兹
第三个人沃尔特·皮茨(Walter Pitts)就更传奇了,以前是学心理学的,读了《数学原理》这本书之后,他觉得大脑一定像书里描述的那样,于是成了第一个将大脑功能图谱化的人,在芝加哥建立了第一个大脑实验室。后来这两个人写了第一篇有关神经元模型的文章。皮茨出身比较艰苦,他的父亲老揍他,有一次把他打急了,他就跑到图书馆里躲起来了。躲在那里的时候无意间发现一本厚厚的大书——《数学原理》,他就在那儿花几天时间无师自通全部看完了,并且写了笔记给罗素指出书中的错误。罗素看了之后大为感叹,世界上只有五个人看了他的三本书,这下撞上了一个,于是请他成为自己的研究生,但罗素根本不知道皮茨连中学都没有毕业,甚至连小学都没有上完。皮茨收到录取信,没有路费又不好意思跟罗素说明出身,于是未能成行。直到多年以后,罗素到芝加哥教书,给皮茨写了封信邀请他过去。这家伙收到信后逃出家门去往芝加哥,至死再没有回去过。
在芝加哥的学校遇到了麦卡洛克,就住到了他家去,麦卡洛克白天上班晚上讨论聊天,两人闲聊出了神经元网络模型,然后就写了世界第一本与之相关的书。不得不说皮茨是个天才。后来麦卡洛克就推荐皮茨给维纳作博士生。这个小学没上完,中学文凭都没有的人到MIT去做博士生,幸亏维纳非常权威,硬是让系里面破格录取。最后皮茨跟了维纳很长时间,专门研究认知和新型的计算机。维纳也是一个天才,17岁完成了博士论文并获得博士学位,自己也觉得挺了不起的,脾气有时比较古怪。当时麦卡洛克在芝加哥做教授做得好好的,为了跟维纳一起工作,放弃了自己的职位去往MIT做一个普通的研究员。
整个团队都过去了,军方也给了大量的经费,实验室采购了很多设备,开始研究大脑,成为了第一个把脑电波提取出来的研究组。我们今天研究脑电波等都要归功于维纳的研究小组。
皮茨很高兴他有全世界最好的设备,经费也充足。有一年维纳跑到墨西哥去,跟他另一个同事在那里完成一些与生物相关的工作。这时候皮茨给他写了封信,高兴地跟他说有多少新设备,没想到维纳看到这封信之后立即翻脸了,跟另外两个人也断绝了关系。所有人都不明白为什么会这样,从此金三角就断开了,断开后的结果是灾难性的,麦卡洛克和皮茨都垮了,皮茨从此之后也不太去实验室了,虽然后来也写过几篇论文,但意义不大。
整日酗酒,晚上在各处酒吧转悠。MIT说只要你签个字我就给你这个博士论文,他字也不签,把还没有完全完成的博士论文都烧了,才四十多岁就忧郁酗酒而死。所以这是一个很悲惨的故事。如果这三个人合作下去,就没有人工智能、更没有人工智能这个词了。
我讲这一段是想说明一些偶然事件能够改变整个科学进度,这就是我们为什么要有敬畏心和平常心。
冯·诺依曼(John von Neumann)受到维纳的启发,以此做出了计算机。冯·诺依曼做计算机最主要的工程师就是维纳的助手(朱利安·毕罗格),他的思想也受到了艾伦·麦席森·图灵(Alan Mathison Turing)的启发。哥德尔证明了不完备定理,然后图灵拿出图灵机说这是undecidable,不可决策的,更进一步证明了有限的资源不可能给出完整的解,但他给出一个可计算数的概念,所有可以计算的数都可以用图灵机来解。图灵机现在被说的很玄,实际上它只有理论价值,没有实际价值,谁能用图灵机来进行计算?但这激发了冯·诺依曼设计数字计算机的概念。所以最后是冯·诺依曼根据图灵的想法把计算机做出来的。
图13.冯·诺依曼 图14.图灵
图灵当时写的这篇论文,发现论文的结尾和阿隆佐·丘奇(Alonzo Church)的结论是一样的,邱奇的论文发表比他的提前了三个月,但邱奇用的是λ-Calculus,符号非常繁琐,没有图灵的图灵机那么简单。后来图灵在英国的导师说,你看邱奇已经做到了这一步,你跟着他做博士论文吧。所以图灵漂洋过海到了普林斯顿,跟着邱奇完成了博士论文。邱奇等于捡了个学生,所以有的时候学生厉害不是因为老师厉害,是因为老师lucky。这个老师幸运,捡了这么一个有名的学生,出了一个叫邱奇-图灵论题(Church-Turing Thesis)。
现在的信息学、计算机就是从Church-Turing Thesis这里起来的,这叫thesis,不是叫定理,只是个猜想,所有能计算的都能够通过图灵机计算。图灵机的实现功劳最大的是冯·诺依曼,他那个时候是大教授,办公室对面的小房间里坐了一个穷学生,就是图灵,冯·诺依曼从图灵的论文中找出可计算数可以被解出来,但怎么做还不知道,因为很多想法是来自于维纳,维纳想法很多但动手能力不强,他主要靠工程师,后来这个工程师到了冯·诺依曼那里,帮他做了世界上第一台真真正正的数字计算机,也有了所谓的冯·诺伊曼结构(Von Neumann Architecture)。到了今天的计算机用的还是冯·诺伊曼结构,所以这里面有一大半的功劳是维纳的,还有一些是维纳的工程师。
这就是整个的发展结果,现在大家把图灵机说得神乎其神,其实根本没有那么玄乎。中国人里面有一个贡献较大的就是王浩,他用WANG Tile,就是王浩瓷砖,他说瓷砖的规则排列就是图灵机,智能就是这么来的,这个功劳是王浩跟他的一个学生做的,但是把这件事宣传出来就是Minsky(人工智能十杰之一)。
提到这里不得不说王浩的一个学生库克,也是挺有意思的。先是到伯克利做了教授,之后被赶走了,到加拿大多伦多大学去教书,赶走后第一年就发表了一篇论文(Stephen Arthur Cook, “The Complexity of Theorem Proving Procedures”),这篇论文得了图灵奖。所以伯克利里另一个拿图灵奖的人说“伯克利做了一件最不光彩的事情就是把库克赶走了”。没想到刚赶走人家,结果就做出来了。人工智能就是这么来的,来自于这两个家族,一个是逻辑派,另一个是De Morgan这边的一派,加上这条主线,最后产生了整个的人工智能。以上是早期的一些故事。
图15.规则排列
2.人工智能近代史
现在我们来说说人工智能威胁论。关于人工智能威胁论,大家知道的第一个就是库兹韦尔的奇点理论。我做HPE智能系统杂志主编的时候,收到二十多篇论文都是反驳它的,我问同事我们该不该审这些文章,大家几乎异口同声地说这种论文不管是反驳还是支持,根本不值得审。因为这既不是科学,也不是哲学,我说这就是文学。林子大了什么鸟都有,有些鸟今天是益虫,过两天它吃粮食就变成了害虫,所以大家平常心去对待威胁论。
接下来这个例子就更有名了——霍金,很多地方说他是当代最伟大的物理学家,我虽然不是学物理学的,但我觉得他和“最伟大的”还差不少。这个人非常传奇,为此我看了关于他年轻时代的电影《The Theory of Everything》,电影里说的非常有道理,它说 “人类的追求是无限的”,“Where there are human, there are hope.”(有人类就有希望)。霍金给爱因斯坦的相对论重版时写过一个序言,在序言里说,你把原子弹归罪于爱因斯坦,就好像是把飞机失事归罪于万有引力一样,这完全是乱扯的。
所以我说把人类的威胁归罪于智能也是一样的事情,我并不觉得它是一个威胁。所以我的想法非常简单,我把HPE的一位作者写的文章挂在了我的博客上,上面罗列了所谓的未来学家对未来的预测,都是蒙人的,分成几种情况:第一种预测根本不成立,比如库兹韦尔预测2010年计算机没有了,现实大家都是知道的,我们每天都在用计算机;第二种是搭便车似的,根据已有的技术发展将未来推测的夸张一点,博人眼球;第三种就是“默顿定律”(许多情况下,我们要证实的命题,其实最后是我们影响甚至改变、构成、实现的命题,非自然科学或物理数学里的因果关系,而是心理学上的因果驱动关系)。
就是这些人有了影响,他们说做什么,大家去做了,成果出来了,就把构造的过程说成是证明的过程,就跟以前我听广播说北朝鲜是二十年实现共产主义,它把共产主义定义成那个样子,逼得大家都去那么做,然后就说共产主义实现了,那是预测呢还是命令,其实是浪费资源。所以我建议大家不用把这些事看得太严肃。
我们这个沙龙叫“墨子沙龙”,中国的哲学家里面我最喜欢墨子。第一,他是一个工匠;第二,他是一个科学家,小孔成像就是他第一个描述的。他还是个哲学家,有自己的组织,是中国第一个建立了组织的哲学家。
我们做事情要有工匠精神。人工智能刚起步,机器人连个门都不能轻易打开,还说威胁人呢,不要被这些事情给忽悠了,这样好多人就没心思干了。中国有过这样的情况,好多事情还没开始干,有些人就说我已经干成了,这让想干的人不好干也没心情去干了,很是不好。威胁论在国外没人去理它,在中国却占了那么长的篇幅,我认为很不妥。
有人说你也不能说它没有威胁吧,大家可以回过头来看智能的本质,这就是我的智能观和别人不一样的地方。智能的英文是Intelligence,大家可以去查一下字典,有一个定义是“人获取应用知识的技巧和能力”。但智能还有另外一个定义,就是“情报”,以前是军事情报,后来变成经济情报,现在变成社会情报,我觉得这两个(定义)必须放在一起考虑。这就跟阴阳一样,有阴也有阳,阳为智能,阴就是情报,没有情报的智能就是瞎子。所以你看Google、百度这种公司来做情报是比较合适的,它原来就是做搜索的。情报的定义就叫做KAO, K就是Knowledge;A是Action行动;O是Organization组织,要有知识、有组织的行动,我觉得以后的智能也一定是这样的,一个情报不应该只是一个简单的算法,那就真的把人的因素给去掉了,以后的情报一定也是KAO,有知识有组织有行动。所以Google这样的公司,包括以后所有的公司都会变成智能公司,就像是从农业到工业,开始的时候大部分都是农田,只有一小部分是小作坊;到了今天农业变成世界的不到5%,其他的都是工业和服务业。同理,将来所有的公司都是智能公司、机器人公司,但它一定是以KAO这种形式。所以回溯智能原本的定义非常重要。当然不同的科学家对它的理解不一样。
我觉得第一个西方哲学家苏格拉底,他对智能的看法是最极端的,无知才使大家进步(“我知道我是智能的,因为我什么都不知道”)。人类存在的理由就是无知,如果人类什么都知道了,我们也该灭亡了。当然还有另外一个极端就是爱因斯坦,他认为智能不是简单的知识,关键要有想象力。个人认为最靠谱的是波恩,今天的时代也正好印证了波恩的想法。波恩认为,知识的积累和应用就是一个过程,随着人口的增加、知识的增加,它会有一个爆炸式、跳跃式的增长。现在的社会并非智能奇点,而是智能爆炸。
我以前读书的时候要到图书馆查一本书,你们不知道有多难。需在一个个架子里面找到厚厚的盒子搬下来,然后在一篇篇杂志里找,看看是不是自己需要的,找到之后,还要搬到复印室里面,一页页自己复印,那时候得到一篇复印的论文是极其珍贵的,现在的条件非常好,检索过程给大家省了多少时间啊,我以前一天能找到一篇论文,都是蛮lucky的,现在我一天能找多少,所以现在就是信息爆炸的年代,这就是为什么我相信这个时代是一个智能的时代,因为知识的积累已经到了一定的程度。
我觉得,Minsky是人工智能里真正的思想家。他不相信智能有唯一的原理,他认为“是什么不可思议的诀窍让我们变得智能?诀窍就是没有诀窍。智能的力量来源于我们自身巨大的多样性,而非任一单个的、完美的原理。”。大家说的符号学派、联结学派、行为学派,都是盲人摸象,摸着腿也好、摸着肚子也好、摸着尾巴也好,只摸到了一部分。我为什么相信哥德尔的不完备原理、图灵的不可决策原理,这种东西永远存在,矛盾永远解决不了,这个矛盾就是有限跟无限的矛盾。人类有限的生命要了解无限的宇宙,它自然而然有这个矛盾,所以什么人工智能“取代人”,我是坚决不相信的。John Corcoran,是我导师的第一个博士生,学哲学的,以前做过纽约布法罗州立大学哲学系系主任,现在退休了。他写过一本专门的论文,描述形式逻辑是怎么起来的,亚里士多德开了个头,到布尔,到刚才我说的Laws of Thought,有兴趣的大家可以去看一下,一共二十多页,这是我认为比较好的关于人工智能渊源的一篇。从亚里士多德一直到布尔的思维定理,这个中间理得很清楚,所以我说追根溯源可以到亚里士多德这里的“三段论”。
在莱布尼茨之前,罗门和卢乐最早提出了制造逻辑通用机的建议,莱布尼茨自己弄过一个机械计算机,当然只是一种想法,做没做就不知道了。到了布尔,大家知道他创立了逻辑代数、也就是布尔代数,现在的计算机、逻辑电路、电路设计都靠布尔代数做基础。后来巴贝奇设计并制作了第一台差分机和分析机,后来就是维纳创立了控制论。把Cybernetics翻译成控制论是比较荒唐的,大家看一下我们今天学的控制,自动化控制里面的控制,没有一个方程是Cybernetics中数学方程里面的。
真正有的是钱学森工程控制论里面的,所以钱学森为什么要提工程控制论,他是有道理的。现在你要让控制论再翻译的话,翻译成人工智能更合适,人工智能、认知科学、计算神经学都是Cybernetics引发出来的。后来我看了一篇东西关于为什么要把Cybernetics翻译成控制论,最初是一帮学哲学的人想翻译成“大脑机器”“思维机器”,后来觉得不合适,觉得Cybernetics也有控制的意思就把它翻译成控制论,其实除了反馈的思想,跟控制真不相关,跟今天的人工智能、计算生物学、计算神经学还有大脑的研究、Bioinformatics生物信息学倒是非常相关。
图灵也是个传奇式人物,写了《论可计算数及其在判定问题上的应用》。他定义了一个Church-Turing Thesis, 只要是能数的都可以算出来,所以现在的计算机称为通用计算机。他在哲学杂志上发表的《计算机器与人工智能》贡献很大。最有名的就是“图灵测试”,其实图灵测试跟人工智能也没多大关系,它顶多是个问答智能。如果问答之间无法分辨是人,那么你就通过了。前段时间有个新闻,我看后来好多有名的科学家还引用这个新闻,说冒充乌克兰小孩的程序是世界上第一个通过了图灵测试的程序,这纯属忽悠人。没想到我们一些很有名的科学家也相信这个东西,这就叫以讹传讹。这并不是图灵测试的原意。大家有兴趣可以去看这本书——《最有人性的“人”》,有个人卧底去参加每年举办的图灵测试,想看一下怎么做的并写下了这本书。现在的测试不是想着怎么智能,是想着怎么跟裁判员斗,用一些虚假装懵或者犯一些常识性的错误让裁判觉得这是人而不是程序,所以后来就成了娱乐工具而不是测试智能的东西。
图16.人工智能
人工智能的起源来自于1956年的达特茅斯会议。2006年,人工智能50周年的时候,我自己主编的杂志评选出了人工智能十佳,第一次名人堂(Hall of Fame)就评了这10个人。其中只有2个人当时没得过图灵奖,后来其中一个也得了,现在只有Nilsson没得。但是这10人中我觉得Nilsson的贡献最大,他是把人工智能从文学变成科学功劳最大的一个人。这个领域的人大家都知道,几本关于人工智能的书都是他写的。这个机器学习的第一本书也是他写的,不过不叫机器学习,而是叫学习机器(Learning Machine)。神经元方法在他的书里面也有提及。
图17.人工智能十佳
第一个人是Feigenbaum,他在专家系统里做的事情最多。第二个人是McCarthy,“人工智能”就是他提的,人工智能里面最有名的LISP语言也是他发明的。第三个是2016年刚刚去世的Marvin Minsky,他认为自己是认知科学家,是最早提出神经元网络的人之一,也是一手把神经元网络推向冬天的人,用XOR判定一句话扼杀了神经元网络的发展。道格·恩格勒巴特,我其实很佩服他,当时很多人反对将他作为人工智能专家,我是几乎跟别人撕破脸也要把他放上去的,他是Internet的实际创始人。现在用的鼠标就是他发明的,超链接也是他发明的,他女儿说他的思维总是超过别人至少二十年,我很赞同。他当时为什么发明了Internet呢?二战的时候他是当兵的,驻扎在菲律宾,当时美国怕当兵的没事干,就给他们发文学杂志,有本杂志叫《Atlantic》。其中Bush(不是那个总统Bush)写了一篇散文《As We May Think》,提出一个想法——人类发明某种能跟图书馆联系在一起的东西就好了。现代的个人计算机就是它的雏形,其功能还远远没实现,所以这个想法就激发了Douglas,于是他决定博士论文就做这个了,之后去了伯克利。毕业后跑到了斯坦福继续研究。申请经费时,他把我们在一个房间开会的图像传到另一个房间,两个房间连起来,这就是Internet的开始。他写过一个报告,叫《Augmented Human Intellectual》,就是现在我们说的AR,意思是人类智能扩展。
Tim Berners-Lee大家都知道,发明了万维网。Lotfi Zadeh一开始上榜大家也是反对的,他的研究跟控制不太相关,他是模糊逻辑的创始人。Noam Chomsky也是比较有争议的。我对Raj Reddy持保留意见,但是他运气不错,他的学生和位置都很好,是机器人研究院的第一任主任。现在我们用的好多都是Judea的技术,他是加州大学的一名教授,现在的概率图等都是基于他的想法。最后就是Nilsson,第一个移动机器人是他们做的,很多搜索方法也是他发明的。他写过《人工智能的数学基础》等书,都是我们领域里面最经典的著作。他把人工智能从文学变成了科学,功劳最大。这张照片是上个月我和Nilsson在他退休后的养老院里拍的。
图18.养老院
人工智能分为三个学派:纯净派(符号主义)靠逻辑推导,邋遢派(行为主义)由维纳提出,联结主义就是神经元网络,其实在我看来它跟大脑的关系就是诗歌与生活的关系,差得远呢。今天又提出了各种各样的大脑计划。,我认为它对治疗人类的疾病有一些帮助。有人问过我AlphaGo和深蓝有什么区别?有人说它还不如深蓝。在我看来它们是天与地的区别。深蓝就是一个应用数学,算到哪儿大家都是知道的;AlphaGo 是算到哪儿你不知道,它的网络把你的特征提取出来,提取的是什么没人知道,设计算法的人都不知道,这个特征又形成什么样的特征空间也没人知道。我觉得智能就是没人知道,如果有人知道就不是智能了。
就跟深蓝的算法一样,本质就是应用数学、逻辑数学。我觉得AlphaGo起了一个好头。刚开始大家都对它表示怀疑,连特征是什么都解释不了,但慢慢发现图像识别很有用。以前机器翻译精度很差,用了深度学习之后,精度大大提高了。为什么我们现在同声翻译、网络翻译觉得能用,这都要归结于深度学习。提出一个问题大家都不知道怎么解答、沟通数学没有用,在我看来是智能的最重要的特征。
图19.深度学习
但是深度学习也有自己的局限性,“If you just have a single problem to solve, then fine, go ahead and use a neural network. But if you want to do science and understand how to choose architectures, or how to go to a new problem, you have to understand what different architectures can and can not do.”。所以不认为人工智能会对人类形成威胁,对人类造成伤害。当然了,科技是把双刃剑。本质上只有人类才能消灭人类,才能威胁人类。所以Minsky有些话在我看来说得非常到位。计算智能还有一大块领域是模糊系统、神经元和遗传,是当年的三大核心领域。现在又加入了其它算法,它有广泛的应用,因为它简单,我们可以用它来做很多事情,包括无人车的驾驶、无人矿山机器人等。当年在日本运用得最多,他们主要用在电器上。其实需要那么复杂吗?我不觉得。以前都用PID,但是好多西方公司早已把它专利化了,所以人们想出个新名词:计算智能。这个名词让它躲过很多专利的问题。还有语言识别,比如中科大的公司讯飞,做的非常好,他们也要变成人工智能公司。还有各种各样的仿生机器人、智能车以及我们实验室的机器鱼。其实智能车技术早就不是问题,最大的问题就是法律问题、社会问题。还有无人机,我们中国就有大疆公司在做。但我觉得人工智能最大一块领域就应该是知识机器人、软件机器人,其次是物理机器人、知识机器人和软件机器人合起来形成所谓的平行机器人,我觉得这才是人工智能的未来。然而这个目标离我们还很远,毕竟现在让机器人开门都很费劲,更别说让机器人成为人类的伴侣。如果有人说20年之内能实现这些,只有三种情况——要不是傻子,要不是骗子,要不就是大家演电影。
我觉得人工智能行业最悲哀的是,不是冬天,就是夏天,没有春天和秋天。秋天是收获的季节,人工智能只有小秋天,这是一件很悲哀的事情。人工智能大大小小至少有九次冬天。如:1987年LISP市场奔溃。现在智慧健康又重新做起来了。
其实人工智能第一个冬天是翻译。有一个很简单例子,“The spirit is willing but the flesh is weak”的英文意思是心有余而力不足。其中,flesh是人体、精神的意思。结果被翻译成:伏特加酒是好的,可惜肉是烂了,即酒香而肉臭。这么一个典型的例子,一下子就变成人工智能的第一个冬天。后来Logical符号救了它。 《Logical Foundations of Artificial Intelligence》是Nilsson的一本书。
人工智能的第二个冬天,Minskey和Papert两个人用了一层神经元,在一个很简单的XOR的逻辑问题上没通过,于是他们就把结论扩展,在给美国军方写的报告里面说了很多不负责任的话,导致整个研究领域的停滞。由于没有研究经费,十年间无人再敢碰这个课题。
我在Minskey去世的时候写过一篇纪念的文章,好事坏事我都列出来了,大家有兴趣可以去看。Perceptron只是一层的神经元网络,发明这个Perceptron网的Rosenblatt也是犹太人,跟他俩人是一个中学的校友。我觉得这里面有科学之外的原因,导致他们把话说的这么绝。很可惜,十年之内就没有人再碰这个,一直到PDP出现,BP算法出现,神经元网络才回来了,才有了我们今天的深度网络。
人工智能的第三个冬天源自英国的一个报告。后面出现Lisp Machines和日本的五代机。这个浪头我赶上了,当时我对这个算法还是很有兴趣,我花了很多功夫在Logic Programming上。那时候日本人说要他要拿出多少钱来做这个基于模式识别的计算机,最后也不了了之。这是人工智能较为漫长的冬天。我看了很多Logic Programming的书,觉得Kowalski的书是最好的。也曾写了一本书专门介绍它。
最后,Hinton参加了第一次“复活”。现在的深度学习领域主要的领军人物还是Hinton。另外一拨人写了一本书叫《On Intelligence》,咱们中国人翻译成《人工智能的未来》,我认为人家只是论人工智能。现在有关大脑的领域都基于霍金斯的这本书,后来他去办企业了。我写过一个评论,这些东西都在我科学网的博客上,大家有兴趣可以去看。
3.未来的人工智能
人工智能怎么来实现真正的智能?现在大部分的人工智能,我称之为封闭的智能,以后一定要开放出来。人为什么智能?我向你提出一个问题,你的思维立即扩散开来,把你的过去、历史、生活、学过的知识、经历过的事全连到一起来解答这个问题,你的大脑整个网络都激活了。现在所有的算法,只能激活机器里的数据库、知识库。怎么扩散出去呢?现在云计算、物联网和大数据提供了一个途径,从封闭的智能走向开放的智能。我觉得一定要把智能从双刃、阴阳两面合起来。智能“是智慧+情报”。生命的本源就是获取知识、面对未知。智能的本源就是利用已知的知识解决未知问题。要解决未知的问题,才是真正的智能。这里面有一些问题,什么叫已知?什么叫未知?大家都要理清楚。大家要拼命的想象,我觉得不能在两个世界想象,一定要在三个世界想象。
图20.波普尔的三个世界
开放人工智能是很有必要的。第一世界大家都知道,是农业世界,开发地表资源。第二世界就是开发地表资源。第三世界就是智能社会。这个社会里面,正如任正非讲的,劳动力、人力不占主要的地位,人和智力是占主要的。我觉得第一个世界解决了血缘不对称的问题。以前你出身贵族你应该发财,别人没话讲的。现在你要再这样,你就双规了,你就该进监狱了。大公司靠资本,信息不对称、资源不对称的时代马上就要被打破了。
下一个崭新的世界,就要打破智力的不对称性。怎么来打破?靠人工智能,靠智能技术。物理世界,我们是行动的主体。心理世界,我们是认识的主体。在这里面我们还是真正的主宰,必须三个世界一起来考虑,就是一个平行的世界。
这个世界我们需要平行模式。怎么样平行呢?我老是开玩笑,以后大家一生下来,要种两个芯片,一个扩展你的内存,一个扩展你的计算能力,而且这些芯片还联网。就像打疫苗种痘一样,不种痘就是物理上的残废,以后你不种芯片,就是智力上残废。而且芯片还联网呢,计算机病毒一来,大家也该要住院了。这种芯片让我种我肯定也不种,以后要是有了软件机器人,可以去店里面买各种各样的机器人,帮你记忆、帮你学习。你们在这听我报告,帮你订旅馆、订飞机、找书、找朋友都可以。各种各样的机器人,组成你的扩展现实、虚拟现实,形成你自己的小的智能社会。
以后的交流是两个社会之间的交流。我相信这一天肯定会来到。这时候你就不要种芯片了,将来这种联网跟电源一样,流动的不是电流,而是智能。把固定的知识变成流动的智能。我相信这个社会一定会在第三世界实现。一定是物理世界物联网,还有心理世界的大数据,加上人工世界的云计算,三个合为一体就是智能世界。
当年我做博士论文的时候,我的导师给我画了三个圈,人工智能、运筹学、控制,中间是智能控制Intelligent Control。我做智能机的博士论文。什么是智能机?顶层组织层、中间协调层、最后是执行层。原理是:越往上智能越高,越往下精度越高,加起来等于常数。当时我干了一年之后,决定不干了。我说我想回去学力学。
导师劝我说力学没前途,就算学出来,工资也低。他说他当年从哲学转到计算机,就是因为学哲学的人工资太低。后来我就坚持下来了,当年写的第一篇报告就是关于智能机的协调理论,是NASA的一个报告,做的是机器人的协调理论。这是我们1990年一起发表的论文,用的是Petri Net,里面引了三样东西:博弈论、机器学习和Petri Net。没想到现在机器学习热起来了、博弈论也热起来了,Uber、滴滴打车将来都是用博弈论来定价。
机器人的历史我就不讲了,推荐大家看部电影。这部电影把Virtual和Real合在一起叫Virtuality,当时对我的启发很大。更震撼的是Surrogates,咱们把它翻译成《未来战警》,我认为翻译的挺差,电影主要讲将来的世界是机器人的世界:机器代替我们工作,我们只要遥控指挥它们就可以了。我倒觉得没有那么玄乎,以后大家可以买一大批这种软件机器人,大部分事情它都可以做。但是一定要人在这个系统之内,不是人不去上班了,而是上班时好多乱七八糟的事情不用做了,软件机器人通过众包的形式让大家各尽其能,各尽其用。现在众包、Uber,还有回家吃饭、饿了吗,都是沿着这个方向去的。我也试过“回家吃饭”,确实做得挺好好的,这只开了一个头。以后订饭什么的,就有软件机器人帮你订了。以后人工智能不但变成科学,而且会变成一种产业。
受它启发,有一年我就写了一个对《Back to the future》 这部电影的社论,论文叫《从牛顿到默顿——从物理机器人到软件机器人》,在2011年的机器人大会上做了报告。
我相信从社会计算到软件机器人就是未来的趋势。社会计算就是情报的意思。 2000年左右我在提倡做社会计算,没人相信这个,不觉得社会计算有多重要。我就编了个故事,用“种芯片”的故事来吓唬大家。现在我就说以后不需要种芯片了,可能生成一个虚拟的你,Digital Twins数字双胞胎或者叫Digital Family。这个口号我已经提了十多年,理会我的人不多。现在我发现西门子在他的机器里提出了Digital Twins,前两天又看到微信上GE也在提Digital Twins。我们十多年前就提了这个词。再进一步提高就是平行世界、平行系统、平行智能、平行的你,这就进入第五个时代。德国人提了个工业4.0,我就觉得这个时代不是4.0而是5.0。这个工业从第一代的蒸汽机机械化,第二代的电动机电气化,第三代的计算机信息化,第四代的路由器化网络化,到第五代的平行化。将来要有大批的人类做软件定义的系统、软件定义的你、软件定义的房间、软件定义的家庭、软件定义的过程和软件定义的产品。由软件定义的工厂来写,把人工世界(不是哲学上的概念)物理上的概念建起来。就像工业社会有高速公路、机场、火车站码头一样,未来的智能世界一定要有各种各样软件定义的汽车、软件定义的Everything。我叫SDA(Software Defined Anything),就是未来智能世界的公路、码头、飞机场、火车站,没有这个,你说是智能社会,就是瞎蒙。机器人也是一样,要定义成平行机器。
图21.迎接智能机的时代
大家想想七十年前的计算机,Von Neuman的EDVAC,那么大。现在计算芯片如此之小,手掌上都可以放好几个。Watson现在至少有四台服务器,我相信将来我的手机上可以放好几个Watson。软件机器人做什么?做金融、股票交易。你看网上的信息流,一大半以上已经是机器人产生的。将来我就觉得要做平行机,要把物理空间、社会空间、网络空间全打通了。要是物理形态的机器和软件定义的机器打通,它会产生一大批新的行业,要从牛顿机到默顿机。牛顿机是大定律小数据,牛顿定律三个,放之四海而皆准。
默顿机是什么?大数据小定律,这次用过了,下次不见得要用,这一群人可以用,下一群人不见得可用。它会产生一系列的新的行业:决策师、评估师、学习师、游戏师、游戏工程师。30年前都没有软件工程师这回事。我绝不相信什么机器代替人,当年IBM说计算机全世界五台就够了。现在多少台?你一个人恨不得都要五台。计算机把人替掉了吗?计算机产生了多少IT工程师啊!
我觉得将来一定是波普尔的三个世界合起来,不是CPS(Cyber-Physical Systems),而是CPSS(Cyber-Physical-Social Systems)。大家都知道现在工业4.0喊CPS,我说一定是CPSS,我最早是做嵌入式的,CPS来源于嵌入式,最开始我也是推崇CPS。但我现在坚信是CPSS。后来我专门写了篇文章,我看没人理我,我是主编,不需要任何人审,自己就写了The emergence of intelligent enterprises: From CPS to CPSS。智能复杂性还有两个意思:除了复杂之外,还有情节的意思和情报的意思,情节加情报,就是无限的想象力,这才能产生智能。把这两个结合起来,就是我们的目的。
图22.智能机器的使命
将来我们面临的世界一定是不定的、多样的、复杂的,不要想变成一个确定的世界,不存在;不要幻想这单一的世界,不道德;不要想着非常简单的世界,那是不现实。你一定要有敏锐性,向着目标收敛,将来把UDC转成AFC。
把复杂的问题简单化,需要合适的手段来做,核心就是UDC到AFC。为什么要这么做?没有这种虚的概念,永远解决不了问题。如果没有虚数,简单方程都无解。无解的话,量子力学、相对论都出不来,所有程序都要停下来,方程解不下去。但是有了虚数的概念,数的数量一下子翻了一倍,我们求解空间翻了一倍。这个方程就有解了,这就是创新啊。虚数的英文叫Imaginary Number,有贬义的意思,中文叫虚数较为文雅了。
我们应该继续创新,现在物理是把一个粒子描述为又是波又是粒子,才有我们的量子力学,才有了量子纠缠的问题。它是呈波粒二象性的。我们要进入智能社会,一定要承认虚实二象性,要从“Particle-Wave Duality”到“Virtual-Real Duality”,你不承认这个,只承认牛顿力学是不行的。现在好多年青人花在虚拟空间的时间都多于50%。我觉得要解决复杂问题一定要考虑复杂空间。复杂空间一定是我们真实的物理空间加虚拟空间。复杂空间是平行的、虚实互动的。最后建立人工社会、人工系统、人工组织加计算机组成的社会实验室,就可以做计算实验。把好的东西捋一捋,让你聚焦。有了人工系统会增加你的敏捷性,有了计算实验让你聚焦,最后虚实互动,产生大反馈大闭环,让你向目标收敛,这就是AFC表现形式,就是各种各样的CPSS。
以后所有东西都是平行的,一对一、一对多、多对一、多对多,把这些都合起来,虚与实并起来。将来除了纯净派和邋遢派,一定要加一个平行派。把辩证法、三段式、亚里士多德的三段式扩展起来,最后实现,当地简单,远程复杂。消灭知识的不对称性,你想不到的东西由软件机器人替你想。无论是王阳明的知行合一,还是默顿定理,抑或是哥白尼的革命,都是对象依照知识,将来也会进入平行时代、5.0的时代。
图23.平行的本质
各种各样的5.0,CPSS系统,就是智能社会的基础结构,跟我们高速公路、火车、飞机场、铁路是一样的。所以说将来的IT是老的 + 旧的 + 新的平行的IT。从我们研究的人工智能、最后变成一个智能化的产业,将来的智能社会就是基于CPSS。这个大家不要小看软件定义的系统。以后一个部队的强大,不是说你有多少人、有多少枪炮,而要看你的软件定义的军队的规模和水平。一个企业也是,要看你软件定义的企业有多大。如果没有这个东西,就像你拿了大刀、红缨枪,跟人家导弹、无人机作战一样。
未来智能社会中最大的一块领域还是情报,我们在这个方面也做的最多。将来会自然而然的迈向智能世界。我觉得这个就是任正非讲的,集体决策给中央做的汇报。我们以前一直做平行,从农业开始一直到网络,还在青岛做了一个试点,就是青岛智能产业研究院。目前成立了这十几个研究所,人工智能到底做什么?大家最清楚的就是AlphaGo,在计算量非常大的情况下,把人打败了。
我提出一个从Church-Turing Thesis 转到 AlphaGo Thesis的概念。AlphaGo Thesis什么意思?只要解决复杂性问题,就能转化成学术问题(用AlphaGo这个结构方法资源就够了)。“转化”是什么意思呢?你只要给我划定范围、划定功能,我都可以把智能达到人的水平,而且能超过人的水平。虽然它没有给我提供任何的新的算法,从这个意义上讲,我觉得这是一件非常重要的事,这是走向智能时代的一个技术基础。将来每个企业都应该下企业的围棋,每个人都要下我们的决策围棋。这就是为什么会有决策工程师,为什么将来游戏应该变成科学游戏。
图24.有限理性与有限智能
现在智能产业要求人要关注深度知识,这就存在一个巨大的剪刀差,怎么来弥补呢?一定要靠知识自动化、人工智能等这种技术。这就是智能的时代,被现实与科技水平驱动的,中国有这个好处。前三十年的发展靠廉价劳力,我们现在工程师的工资,差不多是发达国家的十分之一或三十分之一,我们还有一个廉价脑力,我希望还可以再发展三十年。《人类简史》这本书我看了,写的确实不错,它的重点信息就是:虚构使人类文明发展到今天。
国家不是一个虚构的概念吗?只有国家、家庭这种虚的概念来了以后,大家才把力量聚在一起,最后把其它的动物都打败了。人类发展起来也不过就是上万年的历史,这就是“虚”出来的,还要继续“虚”下去。我不相信威胁论。Simon 靠有限理性获得诺贝尔奖。有限理性自然就是有限智能。大家不要想得太多,还是要多看书。
从知行合一到人机合一,我说的是游戏动漫的科学化,不是光用来玩,以后也会有人工企业、软件定理企业。上班就是打游戏,通过打游戏,打出管理策略、打出市场策略、打出业绩。你要不打,还是传统企业,那你要是不倒闭,真是天理难容!因为你浪费更多的资源,不节约,不可持续。从哲学上来说,就是人工影响现实、虚的影响实的。人在一个目标引导下来做一件事情,就是从牛顿时代到现在,再到默顿时代。默顿是什么?就是自我实现,证明的过程即构造的过程。所以大家要拼影响力、拼关注度。未来影响力什么意思?要玩游戏、玩计算实验,把前面该发生什么事情理一理,看清楚对错,哪个好固定下来,就往哪个地方奔,是未来影响历史。
水晶球以前是吉普赛人算命用的,未来要变成一个科学工具。以后不但对考古、历史进行统计,连玩游戏都要计算实验,VR、 AR和AI都是对未来进行改制,对未来进行统计的。
图25.生命与哲学
最后,给大家分享一首我借用想象力完成的对生命与哲学感悟的诗,我的报告到此结束,谢谢大家!