梅剑华:深度学习为什么不能发展出真正的人工智能?
澎湃新闻
原标题:梅剑华:深度学习为什么不能发展出真正的人工智能?
文 / 梅剑华(山西大学哲学社会学学院、中国人民大学哲学与认知科学跨学科平台)
爱因斯坦曾说,西方科学的发展建立在两个巨大成就之上:古希腊哲学家在欧几里得几何中发现了形式逻辑系统;文艺复兴期间通过系统实验尝试发现了因果关系。长期以来,哲学家并没有找到真正的因果关系。休谟把原因归结为有另一个对象跟随的对象,所有和前一个对象相似的对象都有和后一个对象相似的对象跟随。在休谟看来,事物之间并不存在这种“因果关系”,只是人类习惯将两个事物联系起来。我们还记得他那句耳熟能详的名言:习惯是人生的伟大指南。
休谟是因果关系的怀疑论者。在统计学领域,大家都墨守相关不蕴含因果的共识。在流行病学、社会学、政治学、生物学等领域,学者都在从事相关分析而非因果分析。但哲学家、科学家并未放弃寻找真正的因果关系这一目标。2012年的图灵奖获得者朱迪·珀尔(Judea Pearl)很早就认识到统计分析的缺陷,转向因果推断,先后出版了《因果性》(
Causality: Models, Reasoning, and Inference
)第一版(2000)和第二版(2009)。《因果性》一书兼具思想性和技术性,为了帮助读者理解其中的技术细节,他撰写出版了《统计中的因果:一个导论》(
Causal Inference in Statistics: A Primer
,2016),为了帮助读者理解其中的关键思想,随后他又撰写出版了《为什么:关于因果关系的新科学》(
The Book of Why: The New Science of Cause and Effect
为什么:关于因果关系的新科学 [美] 朱迪亚·珀尔、达纳·麦肯齐 / 著 江生、于华 / 译 中信出版集团,2019-07
因果推断在人工智能、自然科学和社会科学领域有着极为广泛的应用。珀尔认为,人的根本能力是因果推断能力,强人工智能就是让机器人具有因果推断能力。寻找事物之间的因果联系,是人类的一种自然冲动。人类涉世之初好问“为什么”:为什么天会下雨、为什么有白天黑夜……。成语“打破砂锅问(璺)到底”就形象地刻画了儿童发问的天性。追问为什么,就是追问事物之间的因果关系。
珀尔幼承庭训,熟读《圣经》。《为什么》一书多处引用《圣经》来诠释因果。《圣经·创世记》中有一段著名的对话。“上帝问亚当:你吃树上的果子吗?亚当回答:你赐给我的女人,递给了我树上的果子,我才吃的。夏娃回答:蛇引诱了我,所以我吃了。”上帝问了一个事实问题:亚当是否吃了树上的果子。亚当和夏娃的回答却给了一个因果解释。中国古籍《国语》载西周伯阳父曰:“夫天地之气,不失其序。若过其序,民乱之也。阳伏而不能出,阴迫而不能蒸,于是有地震。”伯阳父为地震也提供了一个因果解释。无论中西,人类在认识世界之初,都建立了大致相同的认知方式。
朱松纯做了一个对比:大数据、小任务的典范是鹦鹉学舌,通过给鹦鹉输入固定的语音信息,鹦鹉学会相应的语句,但鹦鹉和聊天机器人都不懂得真正的说话,不能在语句之间建立真正的联系。小数据、大任务的典范是乌鸦喝水,乌鸦比鹦鹉聪明,“它们能够制造工具,懂得各种物理的常识和人的活动的社会常识”
[1]
。
如果要求人工智能成为真正的人类智能,人类就必须对自身的因果认知推理模式有深入的了解。机器人只有建立了真正的因果推理模式才具有真正的智能。在珀尔看来,今天的机器学习导向是错误的,因为它是以数据为导向,而不是以人类的推理特征为导向的。机器学习的倡导者认为,数据里面有真经,只要具有巧妙的数据挖掘技术,学习机器通过优化参数来改进其表现就可以了。人的大脑是处理因果关系最为先进的工具,在与环境互动的过程中,建立了系统的因果推理模式,能够回答各式各样的因果问题。让机器人拥有理解和处理因果关系的能力,是通向强人工智能道路上的核心目标,《为什么》一书为这一目标做了相当清晰通俗的讲解。
重视因果推断是珀尔的研究和其他主流人工智能研究的分野。早期的人工智能算法基于符号逻辑的演绎推理,1980年以来的人工智能算法则是基于概率(贝叶斯网络)的归纳推理。因果推理是结合了演绎推理和归纳推理两个维度的推理模式。珀尔认为,目前的机器学习、深度学习不能发展出真正的人工智能,忽视因果推断是其根本缺陷——当前的人工智能登月计划是爬树登月,而真正的人工智能登月计划要乘坐宇宙飞船。
Causal Inference for Statistics, Social, and Biomedical Sciences: An Introduction Guido W. Imbens & Donald B. Rubin Cambridge University Press,2015-04
例如,吸烟是否导致肺癌,通货膨胀是否会导致失业,控枪是否可以降低犯罪率,选举是否会导致动荡,加强公共卫生是否能减少流行病的传播等,这些都需要在庞大的数据中探寻真正的因果联系。通常,研究者会进行对照实验:在关于某种新药的测试上,选择一些人接受治疗,让另外一些人吃安慰剂;经过一段时间之后,观察二者之间的差异,从而发现真正的原因。但有些情况无法进行真正的实验。我们不能随机选取一组人让他们连续抽烟10年,而让另外一组人远离烟草,这既不可操作又违反伦理。我们也不能对经济、社会、政治现象进行干预控制实验。但如果我们有好的因果模型,就可以进行一种想象的实验,通过操控变元在大数据中发现真正的因果关系。如果说在人工智能领域,具有因果能力就是在小数据的基础上完成大任务,那么在社会科学领域,运用因果推断就是在大数据里发现相对小的目标。
科学革命的结构(第四版) [美] 托马斯·库恩 / 著 [美] 伊安·哈金 / 导读 金吾伦、胡新和 / 译 北京大学出版社,2012-11
珀尔之子丹尼尔(Daniel Pearl)是《华尔街日报》的记者,2002年他在巴基斯坦被基地组织的武装分子绑架杀害。为此,珀尔拿出图灵奖的大部分奖金建立了“丹尼尔·珀尔基金会”,用于化解宗教冲突。有人问珀尔何以如此,他回答说:“仇恨杀死了我的儿子,我决定与仇恨斗争。”珀尔建立的因果推断模型也许能帮助他找到凶手和丹尼尔之死的因果联系,但要弄清这种杀害源自宗教仇恨,人工智能需要更多的人类智慧而非因果模型,也许这才是未来人工智能可能遭遇的真正瓶颈吧。
《为什么》的英文书名颇有深意:
The Book of Why: The New Science of Cause and Effect
,副标题直接限定了追问为什么的范围——用科学方法追问因果关系。我们知道罗尔斯的《正义论》英文标题是
A Theory of Justice
,中译应为“一个关于正义的理论”,罗尔斯认为自己的理论不是唯一的,只是为正义提供了一种理论。回头来看,珀尔此书副标题弃用不定冠词“a”选择了定冠词“the”,显然他认为自己不仅是为因果推断提供了一种理论,而且这是唯一正确的理论。追求科学的真理似乎只有“the book”没有“a book”,但科学也许就是用一本一本的“a book”去逼近“终极真理”的“the book”。在此意义上,《为什么》离“the book”庶几近矣。
注 释
[1] 《浅谈人工智能:现状、任务、构架与统一丨正本清源》,朱松纯,视觉求索微信公众号,2017-11-02。