简介
本书从数学、哲学、计算机科学、神经科学和人工智能等角度,全面阐述了贝叶斯理论背后的基础知识、思维方式和丰富哲理。贝叶斯定理一旦与算法相结合,就不再是一套枯燥的数学理论或认识论,而变成了应用广泛的知识宝库,催生了众多现代数学定理,以及令人称道的实践成果。作者一改传统的数学探讨模式,不仅展现了贝叶斯理论背后的科学思想,还阐述了它与人类思维之间的深刻关系,并对各相关领域和人工智能的发展进行了展望。本书适合喜爱数学、算法、机器学习、人工智能、逻辑学和哲学的大众读者,读者无须过多数学和算法知识就能读懂。
作者介绍
黄黎原(Lê Nguyên Hoang),瑞士洛桑联邦理工学院科学信息与通信学院研究员,美国麻省理工学院博士后,加拿大蒙特利尔理工学校应用数学博士。设立多个科普网站、网络视频频道及播客,著有多部数学、计算机理论著作。
部分摘录:
在数学中,只要某个猜想似乎没有问题,我们就会赶紧尝试证明它,好将它擢升到定理的行列。贝叶斯主义跟这个差不多!
我们将会看到,杰恩斯–考克斯定理证明了,要将亚里士多德式的逻辑扩展到能以前后一致的方式处理可能性这个概念,唯一的推广方式正是贝叶斯主义;所罗门诺夫的完备性定理则证明了,如果数据集中存在某些规律的话,那么纯粹贝叶斯主义者最终会辨认出所有这些规律;额外信息期望收益定理则证明了,纯粹贝叶斯主义者收集更多数据总不会有坏处。最后,统计决策论表明,贝叶斯推断基本上就是唯一可接受的统计学习方法,意思就是,对于某种统计学习方法来说,当且仅当它相当于贝叶斯公式的某种应用时,才不会被另一种方法全面领先 1。
1这些理论将分别在第 3 章、第 7 章、第 9 章和第 12 章中谈到。
除了这些定理以外,还有很多其他定理,可惜我们在这本书里不会谈到。比如说特勒 [5]–斯克姆斯 [6] 定理,它证明了只有贝叶斯主义者才能在所谓的“荷兰赌”[7] 中立于不败之地。更妙的是,乔伊斯的定理 [8] 证明了,将我们的信念与概率定理保持一致就一定会得益,这也是贝叶斯主义要求我们做的。双信封悖论 [9] 也完美诠释了这些不同的结果。
我在这里只能粗略地叙述这些定理,因为它们对应的定义与假设用一句话说不清楚。问题就在这里。所有希望否认贝叶斯主义的纯粹主义者都懂得去挑剔这些定理的假设。所以,我不会说这些定理能证明贝叶斯主义的必要性。
更普遍地说,实际上我们似乎不可能“理性地”说服自己,贝叶斯主义是正确的知识哲学、关于理论模型的正确理论或理性的正确定义。毕竟,要确信某个概念是正确的,需要事先有一套能衡量概念正确性的知识哲学;要用理论化的方式思考各种理论模型,需要有一套理论来判断和区分关于理论模型的不同理论;要以理性的方式谈论理性,就要先用理性的方式定义理性……这就像一条咬着自己尾巴的蛇。
这个难点当然并非贝叶斯公式所独有,所有知识哲学似乎都必然受制于这种自我指涉。数学家也曾花上数个世纪的努力来发展没有自我指涉的理论,然而并不成功。(哥德尔,谢谢你!)
所以,波普尔的哲学,也就是某些人心中科学方法的正确描述,它的追随者希望将知识建基在认识的可证伪性之上。然而,即使是这个可证伪性原则,似乎也不是可证伪的。所以,波普尔的哲学似乎跟自身完全矛盾,或者至少可以说,波普尔的哲学根据波普尔的标准似乎是无法接受的。这就是为什么许多人会在科学和哲学之间画出一条清晰的界线,在科学和神学之间也是如此。然而如果细细考虑的话,这种划界只是波普尔哲学中的一种纯粹(也许又麻烦)的假象而已。
在这方面,纯粹贝叶斯主义者的辩白就有力得多。实际上,即使不能在自身思考的框架以外证明思想的正确性,纯粹贝叶斯主义者(我们会看到,对她来说,一切都是信念)似乎仍然能够不自相矛盾地谈论贝叶斯主义。更棒的是,在进行纯粹贝叶斯主义者的思想实验之后,我可以由此在我对贝叶斯主义的置信度上应用贝叶斯公式。我的粗略计算只增加了我对贝叶斯哲学的置信度。
但还有两个更令人信服的额外理由,使我在各种知识哲学中选择了贝叶斯主义。第一个理由就是贝叶斯主义的普遍性。贝叶斯主义对应用范围没有任何限制,这与波普尔哲学不同。波普尔哲学将自身限制于知识范畴,比如主张科学实验的可重复性 2 和理论的可证伪性。任何现象,无论来自社会学、历史还是神学,都可以通过贝叶斯主义的视角来分析。贝叶斯主义是通用的知识哲学。
2我们可以将这种对于可重复性的要求看成频率主义规定的必需事项。
第二个理由就是贝叶斯主义的严谨、简洁与清晰。它定义了如此清晰的推理规则 3,应用这些规则似乎足以相对精确地(即使只是近似地)理解这个世界。这正是计算机科学家的理想,只要按下启动按钮,机器就能执行一系列指令来自动达到目标。这说的当然就是人工智能!30 年以来,贝叶斯公式一直处于这个领域中众多研究的核心,这大概并非偶然。
3我们很快就会看到这是什么意思。
近来,在乔希·特南鲍姆、卡尔·弗里斯顿和斯坦尼斯拉斯·德阿纳等研究者的推动下,在理解人类自身的智能如何运作时,贝叶斯主义甚至似乎成了一个无法避免的理论框架。特别是 2012 年,德阿纳在法兰西学院开设了一门认知科学的课程,名为“做统计的大脑:认知科学中的贝叶斯革命”(Le cerveau statisticien: la révolution bayésienne en sciences cognitives)。“许多生物学家怀疑神经科学中可能存在某种一般性理论这个想法,”德阿纳在报告中如此说道,“(然而)我们似乎碰到了这样的理论框架,其应用极其广阔。”他还说:“即使是大脑皮层的结构中非常普遍的结构,都可以追溯到这个假说,(也就是)大脑如此构成,目的就是进行贝叶斯式的统计推断。”
(实用)贝叶斯主义似乎就是自然母亲为了使(差不多)有智能的生命得以出现而找到的答案 [10]……