10堂极简概率课.pdf
http://www.100md.com
2020年1月3日
![]() |
| 第1页 |
![]() |
| 第7页 |
![]() |
| 第14页 |
![]() |
| 第26页 |
![]() |
| 第49页 |
![]() |
| 第122页 |
参见附件(8165KB,372页)。
10堂极简概率课是由佩尔西·戴康尼斯、布赖恩·斯科姆斯联合所著,书中讲解了关于概率的10个伟大思想背后的故事,带你探寻概率论的起源与发展。

10堂极简概率课预览图




《10堂极简概率课》目录
第1课 概率是可以测度的
第2课 相关性判断就是概率
第3课 概率心理学不同于概率逻辑学
第4课 频率与概率之间有什么关系?
第5课 如何用数学方法解决概率问题?
第6课 贝叶斯定理如何改变了世界?
第7课 菲尼蒂定理与可交换概率
第8课 如何用图灵机生成随机序列?
第9课 世界的本质是什么?
第10课 如何用概率论解答休谟问题?
《10堂极简概率课》作者简介
佩尔西·戴康尼斯(Persi Diaconis),美国斯坦福大学统计学与数学教授。
布赖恩·斯科姆斯(Brian Skyrms),美国加州大学欧文分校的逻辑学和哲学特聘教授,美国斯坦福大学哲学教授。
《10堂极简概率课》内容提要
在16世纪和17世纪,赌博玩家和数学家把随机性从一个难解之谜变成了概率论,在诸多领域中引发了一系列变化和突破,从赌博、数学、统计学、经济学、金融到物理学和计算机科学。这本书讲述了关于概率的10个伟大思想背后的故事:是谁构建了这些伟大的思想?这些思想的哲学意义和应用价值体现在哪些方面?
两位作者从16世纪的医生、数学家、专业的赌博玩家吉罗拉莫·卡尔达诺讲起,他提出了“概率确实可以测度”的伟大思想。之后的思想家又陆续就 “频率与概率之间有什么关系”“贝叶斯定理如何改变了世界”“如何用数学方法解决概率问题”“如何用图灵机生成随机序列”“如何用概率论回答休谟问题”等问题进行了历时长久的争论、探索和研究。
这10堂课可谓星光熠熠,智识云集,妙趣横生。牛顿、休谟、拉普拉斯、贝叶斯、伯努利、帕斯卡、费马、希尔伯特、玻尔兹曼、庞加莱、冯·诺依曼、丹尼尔·卡尼曼等众位大师会在书中为你授课,讲述概率与数学、经典力学、统计学、哲学、量子力学、计算机科学、宇宙学等学科的“缘分”,解密概率与台球、硬币、骰子、扑克牌、薛定谔的猫、图灵机、鹅卵石、狗身上的跳蚤、你的银行卡密码之间的“黑盒子”。
概率课开始了,赶快坐好听讲吧!
10堂极简概率课截图


目录
献词
前言
第1课 概率是可以测度的
概率测度的开始
帕斯卡和费马
惠更斯
伯努利
小结
附录1 帕斯卡和费马
附录2 抛硬币的物理学原理
附录3 巧合与生日问题
第2课 相关性判断就是概率
部分Ⅰ:赌博与判断概率
部分Ⅱ:效用与判断概率小结
附录1 条件赌注的相关性
附录2 概率运动学
第3课 概率心理学不同于概率逻辑学
启发法和偏见
框架
小结
附录1 埃尔斯伯格:有序性还是独立性?
附录2 动态一致性与阿莱
第4课 频率与概率之间有什么关系?
雅各布·伯努利与弱大数定律
伯努利骗局与频率主义
伯努利骗局与假设检验
频率学派的中坚力量
对理想化方法的再思考
小结第5课 如何用数学方法解决概率问题?
在数学与现实之间Ⅰ
有限集的概率
集合的长度与概率
希尔伯特的第6个问题
柯尔莫哥洛夫的贡献
把概率论视为数学的一个分支
把条件概率视为随机变量
从有限维到无限维
在数学和现实之间Ⅱ
随机选择的整数?数学的旁白
柯尔莫哥洛夫对概率空间的有穷性的看法
小结
附录1 复杂集合的测度
附录2 不可测集
第6课 贝叶斯定理如何改变了世界?贝叶斯vs休谟
贝叶斯的概率研究
反演问题与台球桌
拉普拉斯的玩笑
广义的拉普拉斯定律
相容性
为什么公开发表的研究结果大多是错的?
贝叶斯、伯努利和频率
改变世界
小结
附录 贝叶斯关于概率和统计学的思考
第7课 菲尼蒂定理与可交换概率
菲尼蒂的论著
有限可交换序列
菲尼蒂定理与一般可观测量
菲尼蒂定理与正态分布马尔可夫链
部分可交换性
小结
附录1 遍历理论——菲尼蒂定理的推广
附录2 菲尼蒂可交换定理
第8课 如何用图灵机生成随机序列?
随机数生成器
随机算法理论
可计算性
马丁–洛夫随机序列
随机性的变化
小结
第9课 世界的本质是什么?
玻尔兹曼
概率、频率和遍历性
冯·诺依曼和伯克霍夫的遍历性研究庞加莱
遍历性的层次结构
玻尔兹曼归来
量子力学
非定域性
量子概率归来
量子混沌
小结
附录 量子形而上学:窥视潘多拉的盒子
第10课 如何用概率论解答休谟问题?
休谟
康德
波普尔
归纳怀疑论的不同等级
贝叶斯–拉普拉斯
无知如何量化?概率是否存在?
如果置信度不可交换,会怎么样?
那些用来描述世界的谓词呢?
如何看待不确定性证据呢?
小结
附录 概率辅导课
符号:把事情记录下来
案例:非传递性悖论
基本事实:游戏规则
随机变量和期望
条件期望和鞅
案例:波利亚的罐子
从离散到连续再到更大空间
计算机登场!
致谢献词
谨以此书纪念“钻石吉姆”理查德·杰弗里(Richard
Jeffrey)
他是我们的好朋友和一位真正的哲学家。前言
这本书是由我们在斯坦福大学合作教授了约10年的一门课程
衍生而来的。这是一门大型的混合性课程,听课的人是本科生或
研究生,他们分别来自哲学、统计学和一些交叉学科。随着课程
的不断发展,我们越来越相信它的内容应该可以吸引更多的听
众。学习这门课的一个先决条件,就是接触过一门概率论或统计
学的课程,这本书的读者同样需要满足这个条件。但是,考虑到
某些读者可能是在很久以前学过这类课程,我们在书中以附录的
形式,对概率论进行了一次简要的复习。
这本书涉及的内容包括历史、概率和哲学。我们不仅介绍了
概率论发展过程中的一些伟大思想及其历史,还致力于探索这些
思想的哲学意义。一位阅读过本书初稿的读者抱怨说,读到最
后,他仍然不了解我们关于概率的哲学观点,原因或许是我们过
于中立。这个问题现在已经解决了,你会发现我们是彻头彻尾的
贝叶斯学派,是贝叶斯(Thomas Bayes)、拉普拉斯(Pierre-
Simon Laplace)、拉姆齐(Frank Ramsey)和菲尼蒂(Bruno de
Finetti)的信徒。有人认为贝叶斯学派是与频率学派相对立的,而我们并不否认频率的重要性,或者讨论客观概率的价值。不仅
如此,我们还会在合理的置信度框架内统一考虑这些问题。
在这本书的开头,我们与先驱者一起思考,涉及的工具很简
单。但到了后半部分,我们将回到当下,不可避免地会接触到一
些技术性细节。为了保证行文简洁流畅,我们将把某些细节内容
放到附录中,大家可以根据需要查阅。我们还做了大量注释,以方便读者深入挖掘自己感兴趣的内容。在这本书的最后,我们列
出了一份参考书目。此外,脚注也给出了较为详细的解释。
佩尔西·戴康尼斯
布赖恩·斯科姆斯第1课 概率是可以测度的吉罗拉莫·卡尔达诺(Gerolamo Cardano)
要搞清楚一门学科的本质,认真研究该学科的开创者的想法
是一条可行的路径。事实上,某些基础性哲学问题从一开始就是
显而易见的。关于概率,我们的 第1堂课要介绍的第一个伟大思
想是:概率是可以测度的。这个观点的形成时间是16—17世纪,过程为何如此漫长,这个问题至今仍然是一个谜。希腊神话中有
命运女神堤喀(Tyche);德谟克利特(Democritus)及其追随者
假设,构建宇宙的所有原子都会受到某种物质偶然性的影响;卢
克莱修(Lucretius)在《物性论》(De Rerum Natura)中指出,这种偶然性就是原子的偏离;古埃及人和古巴比伦人学会 了用指
关节骨或骰子玩概率游戏,到了罗马时期,这种游戏流行开来,士兵们通过抽签决定基督斗篷的归属。后来,古希腊学园派怀疑
论者将概率视为人生的指南。( echoed by Cicero in De Natura.)不过,这
些时期似乎都没有出现有关概率的定量理论。( A superb history of early
probability is in James Franklin’s The Science of Conjecture: Ev-idence and Probability
before Pascal (Baltimore: Johns Hopkins University Press, 2002). Franklin examines every
scrap of evidence we have, from the Talmud, early Roman law, and insurance over many
ethnicities. He makes it clear that people had all sorts of thoughts about chance, but not a
single quantitative aspect surfaces.)
想一想,我们是怎么测量东西的?( The same issues come up in
measuring any basic quantity, for example, the weight of the standard kilogram or the
frequency of light. Careful discussion is the domain of measurement theory. For an
extensive discussion, see D. H. Krantz, R. D. Luce, P. Suppes, and A. Tversky,Foundations of Measurement, Vol. I (1971), Vol II (1989), Vol III (1990), (New York:
Academic Press). For an illuminating discussion of how the Bureau of Standards actu-ally
measures the standard kilogram, see D. Freedman, R. Pisani, and R. Purves, Statistics, 4th
ed. (New York: W. W. Norton, 2007).)以长度为例,我们会先找到一个长度标准,然后计数某个东西包含多少个这样的标准长度。比如,在
我们用脚步测量距离时,这个长度标准就是我们的脚。但是,不
同的脚有可能得出不同的测量结果,因此,1522年,有人提议改
进法定路德(杆)的确定方法。如图1–1所示,当人们从教堂鱼
贯而出时,将排成一列的16个人的脚的总长度设定为法定路德。(
For discussion, see S. Stigler, Seven Pillars of Statistical Wisdom (Cambridge, MA: Har-
vard University Press, 2016).)从图1–1可以看出,这些人的脚长度不一,但通过一群人来设定这个长度单位具有明显的平均效应,因此很
多人接受了这个方法。不过,当时似乎还没有人明确提出平均数
这个概念。
图1-1 法定路德的确定我们有必要指出,这个方法存在哲学上的异议。我们的目的
是定义长度,但在用脚长测量距离时,我们已经假定我们采用的
长度标准等长。( This kind of virtuous circularity appears throughout science. For an
illustration in a much richer setting, see George e. Smith, “Closing the Loop: Testing
Newtonian Gravity, Then and Now,” in Newton and Empiricism, ed. Zvi Beiner and eric
Schliesser (Oxford: Ox-ford University Press, 2014): 262–351.)因此,这是一个循
环论证的过程。
任何有头脑的人都不会因为这个异议而放弃用脚长测量距离
的方法。我们的测量活动就始于此,最终建立并完善了长度的概
念。脚的长度因人而异,路德会长短不一,标准米尺的长度在足
够高的精度条件下也会各不相同。借助物理学知识,我们可以不
断改进长度测量方法。因此,这确实是一个循环论证的过程,但
它并不是一个致命的缺陷,反而为我们指明了一条趋于完善的道
路。( 促使等概率这个概念逐步完善的道路是什么?继续阅读这本书,你就会找到
答案。)
概率的测度同样如此。在测度之前,我们先要找到(或者制
造)同等可能性的情况,然后计数这些情况发生的次数。于是,事件A的概率,记作P(A),为
注意,从上式可知:
1. 概率永远不会是负值;2. 如果所有可能发生的情况中均包含事件A,则P(A)=1;
3. 如果事件A和事件B不会同时发生,则P(A或
B)=P(A)+P(B)。
此外,某个事件不会发生的概率等于1与该事件发生概率的
差:
P(非A)=1–P(A)。
这个概念虽然十分简单,但如果运用得巧妙得当,就会产生
令人惊讶的效果。我们以生日问题为例。如果不考虑闰年,并且
假设出生日期的概率均相等,每个人的生日相互独立(即没有双
胞胎),那么房间内的所有人中至少有两个人的生日在同一天的
概率是多少?如果你以前没有见过这个问题,它的答案肯定会让
你大吃一惊。
一群人中有人生日在同一天的概率等于1减去所有人生日均
不相同的概率。第二个人与第一个人的生日不同的概率为
(364365)。如果前两个人的生日不同,那么第三个人的生日与
他们俩都不相同的概率为(363365),以此类推。因此,N个人
中有人生日相同的概率为
如果你对同额赌注感兴趣,就可以利用上述公式,找到使输赢概率趋近12的N的值。当房间里一共有23个人时,生日相同的
概率会略高于12。如果房间里有50个人,这个概率就会接近
97%。
人们经常利用生日问题来考虑一些令人吃惊的巧合情况,因
此生日问题出现了很多变种。比如,两个美国人的生日相同,而
且他们的父亲、祖父和曾祖父生日相同的可能性大到令人吃惊的
程度。为帮助大家应对这些问题,本堂课内容的附录部分给出了
一些有用的近似值。最后,本书在结尾部分又利用这些近似值,证明了菲尼蒂定理。现在,大家只要知道“等可能情况”这个基本
结构应用广泛和深入就可以了。概率测度的开始
创建等概率情况,最有效的方法莫过于抛掷质地均匀的骰
子,或者从洗好的一副牌中抽取扑克牌。概率的测度就是从这里
开始的。我们不知道首创者是谁,但数学家、医生、占星家吉罗
拉莫·卡尔达诺早在16世纪研究赌博游戏时就明明白白地提到过这
个概念。( Written about 1564 but published only posthumously. See O. Ore, Cardano,the Gambling Scholar (Princeton: Princeton University Press, 1953), for translation and
commentary.)卡尔达诺有时以赌博为生,因此他对等概率假设非常敏
感。此外,他对动过手脚的骰子以及其他作弊手法都了如指
掌:“……骰子有时并不诚实,可能是因为它被打磨过,也可能
是因为它被削扁了(这很容易被人看穿),还可能是因为相对应
的两面受到挤压而变得扁平了……牌类游戏的作弊手段更是层出
不穷。”( Our chapter 7. There are a lot of connections between the early gambling
literature and the foundations of probability. See D. Bellhouse, “The Role of Roguery in
the History of Probability,” Statistical Science 8 (1993): 410–20.)
17世纪早期,伽利略(Galileo)给他的赞助人托斯卡纳大公
爵写了一封简短的信,回答了后者提出的一个关于骰子的问题。
公爵认为,通过计算可能情况得出的答案似乎是错误的。投掷三
枚骰子时,得到10点和11点的数字组合方式各有6种,9点和12点
同样如此。“……但是,众所周知,骰子玩家通过长期观察发
现,掷出10点和11点的可能性比9点和12点的可能性更大。”( 这个
问题的表述有一个奇怪的地方,那就是对长期观察这个表达的解释。观察必须持续
进行很长时间。根据伽利略的计算,得到9点的概率是25216,约等于0.116;得到10
点的概率是27216,约等于0.125。两者相差0.009,约等于1100。大家可以计算一下
需要观察的次数,当作一次练习。)这是怎么一回事呢?伽利略答道,他的赞助人在计算得到9点和10点的可能情况
时,把三个3点计作一种可能,把两个3点和一个4点也计作一种
可能,这种方法是错误的。伽利略指出,后者涵盖了三种可能的
组合,它们彼此之间的不同点就在于是哪枚骰子掷出了4点。
<4, 3, 3>,<3, 4, 3>,<3, 3, 4>。
前者的确只有一种可能,即<3, 3, 3>。伽利略完全掌握了排
列组合的相关知识,似乎并没有觉得这是什么新鲜事物。
在构建等概率情况时,伽利略和卡尔达诺似乎都隐晦地使用
了独立性这个概念。他们认为,对于每一枚骰子,抛掷后得到6
个面中的每一个的概率都相等,在抛掷三枚骰子时,得到216个
可能结果中的每一个的概率也相等。在解决生日问题时,我们假
设所有人的生日都具有独立性。
帕斯卡(Pascal)和费马(Fermat)充分理解了这个基本体
系。众所周知,他们通过书信往来,解决了几个更加微妙且在概
念上又各具特色的问题。帕斯卡和费马
帕斯卡和费马于1654年开始的一系列书信往来,似乎标志着
概率论这个数学分支第一次开启了实质性研究。本书详细介绍这
件事,有三个原因:第一,这是一次史无前例的研究;第二,它
告诉我们,借助等可能情况,某些看似复杂的问题有可能被简化
为直截了当的计算;第三,它引入了期望值这个重要概念,期望
值是概率论这门学科的主要支柱之一。
帕斯卡和费马解决的这些问题,在概念特色上不同于卡尔达
诺和伽利略解决的那些问题。帕斯卡和费马对公平性进行了定
义,还对期望值进行了重点研究。
其中有两个问题是帕斯卡的赌友梅内骑士(Chevalier de
Méré)提出来的。帕斯卡把这两个问题连同他自己的想法,都通
过书信告诉了费马。他们俩是通过梅森学院建立联系的,自从梅
森(Marin Mersenne)神父于1635年创建了这家学院之后,包括
伽利略、笛卡儿(Descartes)和莱布尼茨(Leibniz)在内的杰出
数学家、科学家和哲学家都在这里分享过研究成果。
骰子问题:一名玩家需要在8次抛掷骰子的赌局中掷出一个6
点。此时,投注金额已经确定,这名玩家已经抛掷了3次,但没
有一次是6点。如果从赌注中拿出一定比例的钱给这名玩家,让
他放弃第4次的抛掷机会(仅放弃这一次),那么给他多少钱才
算公平?( 在继续阅读之前,大家可以先考虑一个问题。假设在赌局开始之前,双方约定在8次抛掷中率先掷出6点的玩家可以拿走桌上的10美元,那么给你5美元,让你放弃第4次投掷机会,你愿意接受吗?这是否公平?)点数问题:两名水平相当( 我们可以假设他们抛掷的是一枚质地均匀的
硬币。)的玩家正在进行一场多局赌博。每赢一局就可以得到一
点。他们一致同意,第一个达到特定点数的玩家获胜,并赢得全
部赌注。在进行了若干轮之后,赌局被打断了。此时,如何分配
赌注才算公平合理呢?
这两个问题都是围绕公平性阐述的。但是,概率论中的公平
性到底指什么呢?我们将会看到,帕斯卡和费马隐晦地利用期望
值的概念回答这个问题。
对赌注为V(x)、结果为x的赌局而言,期望值就是概率的加权
平均:
期望值(V)=V(x1) p(x1)+V(x2) p(x2)+…
如果玩家对交易的期望值保持不变,就可以视其为公平交
易,比如,抛掷质地均匀的硬币。如果是正面朝上,你赢1,反
之,你输1。那么,期望值为(+1)(12)+(–1)(12)=0。
我们把这个概念应用到骰子问题上。桌上的赌注没有变化,仍然是s。如果该玩家不放弃第4次抛掷的机会,那么他一共还有
5次机会。他的期望值为① 在余下的4次机会中赢1次的概率=1– P(4轮全输)=1–
(56)4。
费马在信中建议玩家拿走16的赌注,然后放弃第4次抛掷的
机会。( See appendix 1.)在这种情况下,他的期望值是
可以看出,两者相同,因此用16的赌注作为玩家放弃第4次
抛掷机会的收益是公平的。( Fermat sees this clearly, but Pascal seems to have
either made a mistake or misidenti-fied the problem. See appendix 1.)
点数问题也是一个期望值问题,曾让许多以前的思想家束手
无策。1494年,修道士卢卡·帕乔利(Luca Pacioli)考虑过一个点
数问题:在一场只要得到6点即可获胜的赌局中,一名玩家已经
得到了5点,另一名玩家得到了3点。也许是受到亚里士多德
(Aristotle)的分配正义思想的影响,帕乔利认为按照两个玩家
分别赢得的点数之比(5∶3)进行分配是公平的做法。大约50年
后,塔尔塔利亚(Tartaglia)提出了反对意见,理由是:根据这
条规则,如果游戏在一轮之后停止,那么其中一名玩家就会得到
全部赌注。赢得赌局所需的点数越多,这样的结果就越令人难以
接受。塔尔塔利亚试图修改帕乔利的规则,以便将这种情况考虑
进去,但最后他怀疑这个问题可能根本没有确定的答案。这个问
题也让包括卡尔达诺和梅内骑士在内的所有人绞尽脑汁,困惑不已。
这时候,费马提出了一个至关重要的见解。假设两名玩家距
离赢得赌局分别还差r点和s点,那么赌局肯定会在r+s–1轮内结
束。赌局可能会提前结束,但是由于每轮的胜负率是确定的,所
以我们不妨考虑一下所有r+s–1轮投掷的结果。这样一来,整个问
题就简化为一个关于等概率情况的问题,通过计数就可以算出概
率。
在帕乔利问题中,玩家1有5点,玩家2有3点,只要他们中的
任何一个得到6点,赌局就会结束。因此,赌局最多还可以进行3
轮,共有8种等概率情况。玩家2只有赢得接下来的3轮,才会获
胜,他的期望值是总赌注的18,而玩家1的期望值是78。因此,公平的方案是按照这两个期望值之比来分配赌注。
通过统计等概率情况计算期望值,可以解决这类问题。但
是,等概率情况有时会因为数目过大而难以统计。不妨考虑一下
塔尔塔利亚举的例子。赢得6点即可获胜,一名玩家没有得分,另一名已有1点在手。因此,赌局最多还可以进行10轮。把所有1
024种可能的结果全部写出来,是一件单调乏味的事。不过,帕
斯卡有一种更好的统计方法。
要统计玩家1获胜的情况,我们可以分别统计他在10轮投掷
中赢得6次的情况(10选6),在10轮投掷中赢得7次的情况(10
选7)……在10轮投掷中赢得10次的情况(10选10),然后将统
计结果相加。如图1–2所示,利用帕斯卡三角形[也叫塔尔塔利
亚三角形、奥马尔·海亚姆(Omar Khayyam)三角形( Known in Indiasince the second century BCe. For more of the history, see A. edwards, Pascal’s
Arithmetical Triangle: The Story of a Mathematical Idea (Baltimore: Johns Hopkins Uni-
versity Press, 2002).)],我们可以很方便地在第10行找到这些数字。
这一行告诉我们,从一组10个对象中选取若干个会有多少种不同
的方案。从左至右依次可以看到,选取0个对象有1种选择方案,选取1个对象有10种选择方案,选取2个对象有45种方案,选取3
个对象有120种方案,一直到最右端,选取10个对象有1种选择方
案。
我们需要求出10轮6赢+10轮7赢+…+10轮10赢的总和。利用
帕斯卡三角形的第10行,可以算出
210+120+45+10+1=386
该玩家的最终获胜概率为 (约等于38%)。
因此,公平分配方案是玩家1(之前没有得分)获得赌注的
3861 024,玩家2则获得剩余赌注。
在帕斯卡和费马之后,统计等概率情况和利用组合原理及期
望值来计算概率,就成了众所周知的概率测度的基本方法。图1-2 帕斯卡三角形惠更斯
帕斯卡与费马在书信中讨论的这些内容传到了克里斯蒂安·惠
更斯(Christiaan Huygens)( For more on Huygens, see S. Stigler, “Chance Is
350 Years Old,” Chance 20 (2007): 33–36.)的耳朵中。当时,这位伟大的荷
兰科学家正在巴黎访问。他不仅接受并拓展了书信中传递的那些
思想,之后还解决了那几个问题,并于1656年出版了关于这些问
题的第一部著作。1692年,约翰·阿布斯诺特(John Arbuthnot)
把它翻译成英文版,书名就叫《机遇的规律》(Of the Laws of
Chance)( Isaac Newton had a copy and made notes, which can be found in D. T.
Whiteside, ed., The Mathematical Papers of Isaac Newton, Volume 1 (Cambridge:
Cambridge University Press, 1967). Thanks to Stephen Stigler for the reference.)。
在这本书的开头,惠更斯提出了一条基本原理:
公设
下列命题构建于这样的公理之下:赢得任何东西的概率或期
望值,都与在公平赌局中获胜的概率或期望值一样,可以通过求
和的方式计算出来。比如,某个人的左手和右手分别握有3先令
和7先令。他让我在不知情的情况下选择一只手,然后他会把那
只手握着的钱送给我。我认为,这相当于他送给我5先令,这是
因为在公平的条件下,我获得5先令与赢得3先令或7先令的概率
或期望值是一样的。
惠更斯认为,他其实可以通过抛质地均匀的硬币的方法来决
定选择哪只手。( 多年以后,霍华德·雷法(Howard Raiffa)在解决所谓的“埃尔斯伯格悖论”(Ellsberg Paradox)时也提出了类似的观点。我们在第3课讨论有关概
率的心理学时将介绍这个悖论。)12×3+12×7=5,因此他说,赌注的价
值和得到5先令的价值是一样的。于是,他明确地(通过一个特
例)提出了帕斯卡与费马书信中隐含的一条原理:期望值是测算
价值的正确方法。
接着,他从公平性的角度论证了这种测算方法的合理性。假
设我用一枚质地均匀的硬币与某人打赌,赌注是10先令。由于对
称性,所以这个赌局是公平的。现在,假设我们一致同意修改赌
局,无论谁赢,都要分给输家3先令。这种做法不会破坏对称
性,所以修改后的赌局协议仍然是公平的。但现在输家拿到了赌
注中的3先令,赢家还剩7先令。诸如此类的协议都会保持公平
性,包括赢家分5先令给输家,最后双方各有5先令的协议。接
着,惠更斯表明这种论证方法还可以推广至任意有限数量的结果
和概率为任意合理值的结果。所以,利用对称性来证明等概率情
况的做法将在本书中反复出现。
牛顿追随者的想法
阿布斯诺特是牛顿的追随者,( Incidentally, Newton, one of the great
mathematicians of all time, had poor proba-bilistic skills. See S. Stigler, “Issac Newton as a
Probabilist,” Statistical Science 21 (2004): 400–403.)他在惠更斯著作的英译本
的序言中发表了一句值得我们注意的评论:
在力量和方向都确定的情况下,骰子落下后朝上的一面也是
确定的,只不过我不知道什么样的力量和方向,才能使我想要的
那一面朝上。因此,我称之为概率,意思是技能的缺乏。通过这段文字,阿布斯诺特引入了在确定的环境中如何正确
认识概率的问题。他给出的答案是:概率是人类无知的产物。
以抛一次硬币为例。用拇指弹击硬币,硬币在空中翻转,随
后被抓在手心里。很明显,如果拇指用同样的力量弹击硬币相同
的部位,硬币落下后朝上的面也会保持不变。所以,抛硬币是一
种有规律可循的物理现象,而不是随机的!为了证明这一点,我
们请物理系为我们制造了一台抛硬币机。如图1–3所示,在弹簧
被松开之后,停留在弹簧上的硬币一边翻转,一边弹起,然后落
在一只杯子里。因为弹簧的力量是受控的,所以硬币落下后总是
同一面朝上。这个结果令人发自内心地感到不安(本书的两名作
者也不例外),魔术师和不诚实的赌徒(包括本书的一位作者)
都具有这样的技能。
那么,为什么认为抛硬币具有随机性的观点如此普及,并取
得了巨大成功呢?庞加莱(Poincaré)给出了基本回答。如果将
硬币用力弹起,使之有足够的垂直速度和角速度,硬币就会对初
始条件产生敏感的依赖性。初始条件的一点儿不确定性将会被放
大,使结果具有很大的不确定性,以至于在一定程度上,我们可
以假设结果具有等概率,但这必须满足一些重要的限制性条件。
关于这一点,请参阅本章的附录2。我们将在第9课详细讨论这个
问题。图1-3 可以确定结果的抛硬币机伯努利
1713年,在雅各布·伯努利(Jacob Bernoulli)去世8年后,他
的《猜度术》(Ars Conjectandi)( Translated with extensive commentary by
edith Dudley Sylla as The Art of Conjectur-ing, Together with a Letter to a Friend on Sets
in Court Tennis (Baltimore: Johns Hopkins Univer-sity Press, 2006).)终于出版。在
这本书中,伯努利阐明了前辈们的做法。全书的第一部分引述并
评论了惠更斯的成果。一个事件的概率被明确地定义为发生该事
件的(等概率)情况数量与(等概率)情况总数之比。比如,从
一副扑克牌(不含大小王)中抽出一张梅花牌的概率是1352。此
外,伯努利还将条件概率(conditional probability),即第二个事
件B在第一个事件A已经发生的条件下的发生概率,定义为两个事
件均发生的情况数量与发生第一个事件的情况数量之比:
如果抽到的是一张梅花牌,那么这张牌是Q的概率为113。
在这些定义的基础上,伯努利指出互斥事件的概率可以相
加,以及概率满足乘法法则,即P(A∩B)=P(A)P(BA)。这些简单
的法则构成了所有概率计算的核心。
不过,伯努利的主要贡献是把概率和频率紧密地联系在一
起,并称为他的黄金定理。在此以前,人们只是猜测这两者之间
存在联系。伯努利举了一个例子。假设一只罐子中装有3 000块白色鹅卵
石和2 000块黑色鹅卵石,从罐子中抓取鹅卵石的行为相互独立,而且每次取出一块鹅卵石后会向罐子中补充一块同色的鹅卵石。
那么,在抓取鹅卵石的行为进行了一定的次数之后,我们是
否“确有把握”(moral certainty)使取出的白色鹅卵石与黑色鹅卵
石的数量之比接近3∶2?如果确有把握,这个抓取次数到底是多
少?伯努利选定了一个高概率作为“确有把握”的衡量标准,并确
定了所需的抓取次数。然后,他阐明了弱大数定律:
对于概率(在本例中等于35)周围尽可能小的任意区间,以
及无限接近确定值1 –e的近似值,都存在数N,使N次尝试中取出
白色鹅卵石的相对频率落在该区间的概率至少是1–e。
我们在后文中讨论频率时会详细阐述这个定律。小结
就像长度一样,概率也是可以测量的。我们将事情划分成等
可能情况,计数这些情况发生的次数,再除以可能情况的总数,即可计算出概率。这个定义满足以下条件:
1. 概率是一个0到1之间的数。
2. 如果A不可能发生,则P(A)=0。如果A在所有情况下都
会发生,则P(A)=1。
3. 如果A和B不可能在同一种情况下发生,则P(A∪B)=P(A)+P(B)。
4. 在A发生条件下B的发生概率等于B与A同时发生的情
况数量除以A发生的情况数量,即P(A∩B)=P(A)P(B|A)。如果
A和B相互独立,即P(B|A)等于P(B),则P(A∩B)=P(A)P(B)。
在发现并统计可能情况数量的过程中,人们遇到了一些数学
问题,比如复杂赌局的获胜概率、生日问题等。
期望值可以根据各种结果出现的概率来衡量它们的成本与收
益情况,这不仅有助于计算,还是公平性和价值的衡量方法。
大数定律(我们将在第4堂课和第6堂课继续讨论)表明,在
多次独立尝试中,我们可以通过频率求出次数的近似值(高概
率)。本堂课的内容一共有三个附录,分别介绍了帕斯卡和费马的
通信往来,抛硬币的物理学发展历程,以及深入分析概率数学与
现实世界中发生的偶然事件之间的联系。(本书最后单列出一个
附录,以满足读者复习相关知识的需要。)附录1 帕斯卡和费马
骰子问题
帕斯卡写给费马的第一封信已经遗失,但可以肯定的是,骰
子问题就是在这封信中提出来的。
费马在回信中指出,帕斯卡犯了一个错误:
假设我需要用一枚骰子在8轮投掷中得到某个点数才算赢。
下注后,如果我们一致同意我放弃第一轮投掷机会,那么根据我
的理论,作为对我放弃第一轮投掷机会的补偿,我拿走全部赌注
的16才算公平合理。
之后,如果我们一致同意我放弃第二轮投掷机会,那么我拿
走剩余赌注的16,也就是全部赌注的536,才算公平合理。
之后,如果我们一致同意我放弃第三轮投掷机会,那么作为
对我的补偿,我拿走剩余赌注的16,也就是全部赌注的25216,才算公平合理。
之后,如果我们一致同意我放弃第4轮投掷机会,那么我拿
走剩余赌注的16,也就是全部赌注的1251 296,才算公平合理。
你认为,如果玩家完成了前面三轮的投掷,这就是第4轮投掷机
会的价值。我认同你的观点。
下面是你在信中举出的最后一个例子,我完整地引述如下条件:我需要在8轮投掷中得到6点。我已经投掷了三次,但都没有
成功。这时候,我的对手建议我放弃第4轮投掷机会,并且为公
平起见,我可以拿走全部赌注的1251 296。你认为这样做是合理
的。
但是,根据我的理论,这是不公平的。因为在这种情况下,手持骰子的玩家在前三轮投掷中一无所获,总赌注分文未少。如
果他同意放弃第4轮投掷机会,作为补偿,他应该拿走全部赌注
的16。如果他第4次投掷仍没有成功,那么在双方一致同意他放
弃第5轮投掷机会的情况下,他依然应该分得全部赌注的16。既
然赌注总额一直没有变化,那么无论从理论上看,还是根据常
识,每次投掷机会都应该具有相同的价值。
很明显,这里的核心问题是期望值。如果放弃某一轮的投掷
机会并拿走一部分赌注,不会改变赌局的期望值,这种做法就是
公平的。
费马清楚地看到,任意一轮赌局的分析结果都是一样的。假
设某轮投掷结束后,还剩下n+1轮投掷机会,此时的赌注价值为
1。那么,选择参与赌局并在此轮获胜的期望值是16,而此轮失
败但最终仍有可能获胜的期望值是 。拿走
16的赌注后,用剩余赌注继续赌局的期望值是:到手的现金(数
额为16),再加上最终获胜的概率 与剩余赌注(数额为56)的乘积。费马的分析立刻得到了帕斯卡的认同。
点数问题
帕斯卡讨论的另一个问题也很有趣。他以一个赌局为例,两
个玩家各押注32枚金币,率先赢得三点的玩家获胜。
我们假设第一个玩家得到两点,另一个玩家得到一点。在接
下来的一轮赌局中,如果第一个玩家获胜,他就会赢得全部赌
注,即64枚金币。如果第二个玩家获胜,他们的点数之比就是
2∶2,此时终止赌局的话,他们各自拿回自己的赌注(32枚金
币)就可以了。
费马先生,请考虑下面这种情况。如果第一个玩家获胜,64
枚金币就会归他一人所有。如果他输了,则可以得到32枚金币。
此时他们终止赌局的话,第一个玩家就会说:“我肯定可以得到
32枚金币,因为即使我输了,我也会得到这么多金币。至于另外
32枚金币,也许会归我所有,也许会归你所有,风险均等。因
此,我们可以平分这32枚金币。但是,另外32枚金币肯定归我所
有。”这样一来,他将得到48枚金币,而另一名玩家则得到16枚
金币。
这不仅是在计算期望值,还以任何人都无法辩驳的方式证明
了这种分配方案的公平性。你确定拥有的部分,就归你所有;对
不确定的部分,在概率相等时则双方平分。这是对修道士帕乔利
的疑问的明确解答。
接着,帕斯卡表明这个推理过程还可以迭代:现在,我们假设第一个玩家得到两点,另一个玩家一无所
获。接下来,他们将争夺第三轮的胜利。如果第一个玩家获胜,那么他将赢得所有赌注,即64枚金币。如果第二个玩家获胜,赌
局就会回到前文讨论过的情况,即第一个玩家有两点,第二个玩
家有一点。
我们已经证明,在这种情况下,48枚金币将归那个赢得两点
的玩家所有。此时,他们终止赌局的话,这个玩家就会说:“如
果我赢了,我将获得64枚金币。如果我输了,我也会理所当然地
得到48枚金币。因此,先将确定归我所有的48枚金币给我,因为
即使我输了,这些金币也是我的;然后我们再平分剩余的16枚金
币,因为我们得到这些金币的概率均等。”也就是说,他将得到
56(48+8)枚金币。
现在,我们假设第一个玩家得到一点,第二个玩家一无所
获。瞧,费马先生,如果他们开始第二轮,就会出现两种可能的
结果。如果第一个玩家获胜,他就会拥有两点,而对手仍然一无
所获。根据前文讨论的结果,他将得到56枚金币。如果第一个玩
家输了,他们的点数之比就是1∶1,他将得到32枚金币。因此,这名玩家肯定会说:“如果此时终止赌局,就先从56枚金币中把
我肯定会得到的那32枚金币给我,然后我们再平分剩下的金币。
从56枚金币中拿走32枚,还剩24枚。我们平分之后,各得12枚。
12枚加上之前的32枚,我应该得到44枚金币。”
这是公平分配的一个递归过程。接着,帕斯卡又分析了点数
要求较高的赌局,并给出了这个问题的一般解。附录2 抛硬币的物理学原理
从罐子中取鹅卵石、抛硬币、掷骰子和洗牌都是基本的概率
模型,那么,这些模型与现实世界中的相应活动有什么关系呢?
这些基本模型还经常被应用于复杂得多的环境,计算事件发生的
概率。比如,伯努利就曾利用这类模型,对两名网球选手连续得
分的情况进行了研究;托马斯·吉洛维奇(Thomas Gilovitch)、阿莫斯·特沃斯基(Amos Tversky)和罗伯特·瓦隆(Robert
Vallone)( T. Gilovitch, R. Vallone, and A. Tversky, “The Hot Hand in Basketball: On
the Misper-ception of Random,” Cognitive Psychology 17 (1985): 295–314.)则利用它
们来研究篮球运动员的“热手效应”。但问题是,这些研究难道不
应该兼顾物理学和心理学两个方面吗?
上面提到的这些例子都有据可考。我们先来看单次抛硬币的
情况,以便让大家有一个初步认识。然后,我们因势利导去分析
其他例子。
让我们看一下抛硬币的物理学原理。( Joseph Keller, “The Probability
of Heads,” American Mathematical Monthly 93 (1986): 191–97.)当硬币从手上弹起
时,它有一个向上的初速度v(英尺秒)和一个翻转速度ω(转
秒)。牛顿告诉我们,如果v和ω已知,那么硬币下落需要的时间
以及落下后是正面还是反面朝上都是确定的。模型中硬币的相空
间如图1–4所示。
单次抛硬币相当于这个平面上的一个点。考虑图1–4中的这
个点。它的初速度很快(因此,硬币的上升速度很快),但翻转速度很慢。因此,被抛起的硬币就像手抛比萨一样,几乎不会翻
转。同理,v小、ω大的点的翻转速度很快,但由于被抛起的高度
不够,也可能连一次翻转都无法完成。因此,如果初始状态的硬
币位于靠近两条坐标轴的区域,它就不可能翻转。
图1-4 单次抛硬币的v-ω平面
邻近这个区域的依次是硬币翻转一次的区域、硬币翻转两次
的区域,依此类推。完整的图形如图1–5所示。图1-5 双曲线使得部分相空间变得泾渭分明。阴影区域对应的是使硬币正面朝
上的初始状态,空白区域对应的是使硬币反面朝上的初始状态。翻转速度的单位是
转秒
认真观察图1–5(并运用一些简单的数学知识),就会发现
图中远离0的区域彼此逐渐靠近。因此,初始状态的小变化会带
来正面朝上或反面朝上的不同结果。
要做进一步分析,就必须知道下面这个问题的答案:当真实
世界的人抛真正的硬币时,与之对应的点在图中的哪个位置?我
们做了一些实验,结果发现一次正常的抛硬币大约需要12秒,硬
币的翻转速度大约为40转秒。根据图1–5中的单位,初始速度的值大约是15,非常接近零;而翻滚速度ω为40个单位,远远超出
了该图的范围。根据该图的数学含义,我们知道这些区域彼此接
近的程度。再结合我们做的实验,可以看出:抛硬币的公平程度
可以精确到小数点后两位,但不能精确到小数点后三位。
上面分析的是一种简单模型的情况,它假设硬币将沿着一条
穿过其自身的轴翻转。事实上,真实硬币的情况要复杂得多,是
一种独特的进动。论文《抛硬币的动态偏差》(Dynamical Bias
in the Coin Toss)( P. Diaconis, S. Holmes, and R. Montgomery, “Dynamical Bias in
the Coin Toss,” Siam Review 49 (2007): 211–35.)在设定大量的附加条件并参
考大量文献资料的基础上,对硬币的运动方式进行了全面细致的
分析。分析结果表明,大力抛掷普通硬币会有微小的偏差,开始
时朝上的那一面在落下后仍然朝上的概率大约是0.51。
这些分析给了我们什么启示呢?标准模型可以非常近似地模
拟真实情况。要想探测出0.50和0.51之间的差异(也就是说,要
精确到小数点后两位),我们需要用标准模型进行大约25万次抛
掷。我们希望标准模型的其他一些实例同样有效。伽利略的骰子
与抛硬币的情况类似,而轮盘赌和洗牌则是另一种情况!( D. Bayer
and P. Diaconis, “Tracking the Dovetail Shuffle to Its Lair,” Annals of Applied Probability
2 (1992): 294–313.)
对简单的抛硬币进行诚实分析竟然会让我们陷入如此复杂的
局面,那么,按照莱布尼茨和伯努利的设想,对需要技巧的游戏
进行概率分析,或者将概率应用于医学和法律领域,情况会不会
更加复杂呢?伯努利非常赞同下面这个观点:
请问,人世间疾病的种类如此繁多,可以在任何年龄侵袭人体的无数部位,或者预示死亡即将降临,那么,这些疾病的数量
到底是由什么人决定的?谁可以决定哪种疾病(比如,是瘟疫还
是水肿,或者是水肿还是发热)更容易杀死我们呢?谁又能在此
基础上预测未来的生死呢?同样地,谁可以计数空气每天发生的
数不胜数的变化,并在此基础上预测出它一个月(甚至一年)后
的成分呢?
又或者,谁可以充分洞见人类思想的本质或者人体的奇妙结
构,从而敢于在赌博结果完全或部分取决于玩家的机敏度的游戏
中,确定到底哪一位玩家将会胜出呢?在这些以及类似的情况
下,最后的结果可能是由一些完全隐藏的原因决定的,这些原因
还可以通过无数种方式组合到一起,足以抹杀我们的所有努力。
因此,试图以这种方式预测未来的情况,显而易见是疯狂之举。(
Quoted from the translation of Sylla, 327.)
伯努利认为他的大数定律可以回答这些问题,在接下来的几
堂课中,我们将对他的答案是否恰当做出评估,并讨论另外几个
可能的答案。附录3 巧合与生日问题
我们每个人都会遇到巧合,在这种情况下,我们应该感到惊
讶还是担心呢?简单的生日问题(及其变体)已经变成了一个有
效的工具,可用作人们的惊讶程度的测量标准。如果23人中出现
有人生日相同的情况,大多数人都会感到惊讶,但本堂课开头介
绍的简单计算告诉我们,根本不需要为此感到惊讶。现在,我们
把这个计算方法抽象化,并做进一步延伸。
我们来看一下“手表”问题。最近,有秒针的老式手表变成了
一种时尚。我们认为,秒针的位置是“随机的”,即所有秒针完全
不同步,指向1到60秒的可能性完全相等。假设有N个人,每个人
都戴着一只有秒针的手表。那么,有两个或两个以上人的手表秒
针正好指向同一位置的概率是多少?
这是包含60个类别的生日问题,而最初的生日问题有365个
类别。抽象化之后,考虑类别数量C(在手表问题中,C=60,而
在生日问题中,C=365)。一共有N个人,他们彼此独立,并均
匀分布在 {1, 2, 3, …, C} 中。这些数字各不相同的概率是多少?
当然,这取决于C和N的值;如果N=C+1,概率就是0。
我们把这个概率叫作P(C, N)。根据前面的分析,P(C, N)=这个公式简单明了,在C和N的值确定之后,我们就可以用袖
珍计算器算出精确的答案。
但这对我们理解这个问题并没有多大的帮助。为方便以后应
用,我们可以通过一个简单的近似公式来计算。研究表明,当N=1.2 时,概率接近12。对手表问题而言,1.2
=9.3,所以,一场比赛至少有10个人赔率相同。但在直觉上,这
似乎是一个惊人的巧合。(对最初的生日问题而言,1.2
=22.9。)
我们用命题的形式来表述这个近似公式。
命题:如果有N个人和C种可能性,且N和C很大,则不匹配
的概率为
P(C, N) ~ e–N(N – 1)2C。
证明:在证明过程中,我们需要使用对数的一个简单属性,即当x很小的时候,log(1–x) ~ –x。那么当N和C较大时,N23>C非常小,计算所得的近似值是精确
的。
在本书作者之一佩尔西·戴康尼斯(Persi Diaconis)和弗雷德
里克·莫斯特勒(Frederick Mosteller)( P. Diaconis and F. Mosteller,“Methods for Studying Coincidences,” Journal of the American Statistical Association 84
(1989): 853–61.)的巧合现象研究中,生日问题应用得更多。他们还运
用这些想法,研究多重巧合的情况。比如,要使三个人的生日相
同的概率达到12,N应该多大?(答案是:约81个人)。
有人试图利用巧合现象大做文章,但我们反其道而行,提供
了一种简单的概率模型,供大家比较鉴别。该模型可用于研究教
室中的生日匹配现象,而且研究结果真实可信。但是,有的读者
可能会用它来研究高级餐厅里的人群。由于人们经常在生日当天
被邀请去餐厅就餐,所以在某个晚上出现多个生日匹配现象的可
能性非常高。这样一来,我们这个概率模型的假设条件就不成
立,所以它无法得出正确的结论。这个警示适用于本章中提到的
所有简单概率模型,更多内容详细见戴康尼斯和苏珊·霍姆斯
(Susan Holmes)2002年发表的论文。( P. Diaconis and S. Holmes, “ABayesian Peek into Feller, Volume I,” Sankhya 64 (2002): 820–41.)第2课 相关性判断就是概率弗兰克·拉姆齐
我们的第2堂课要讨论的第二个关于概率的伟大思想是:判
断是可以测度的,而具有相关性的判断就是概率。(下文将告诉
大家相关性的确切含义。)在第1堂课讨论的经典赌博游戏中,我们是根据对称性做出判断的。我们认为,对称的情况发生的可
能性相等。在这一课中,我们将看到关于各种可能情况的判断中
隐含的置信度也是可以测度的。在用本堂课介绍的方法测量这些
置信度时,我们还将发现,具有相关性的判断同样具有卡尔达诺
和伽利略在计数等可能结果时发现的那种数学结构。
我们如何估量下一年金融危机发生的可能性,采用某种治疗
方案后病人可以存活下来的可能性,以及被告有罪的可能性呢?
如何估量某位候选人在选举中获胜的可能性,发生大萧条的可能
性,以及某种草率的政治行为引发战争的可能性呢?在直觉上,我们不可能像在公平的骰子游戏中那样,通过计数等可能情况的
数量来计算概率。但是,根据莱布尼茨和伯努利的设想,法律、政治和医学等领域其实恰恰是概率计算最重要的用武之地。这些
概率就相当于建立在可获得的最佳证据基础上的置信度,[1]但这
并不意味着它们无法测算。
接下来,我们将通过赌博来讨论概率的估算。在现实世界
中,我们在很多情况下除了赌一把以外别无选择。预测市场
(prediction market)或许是一个最简单的例子。比如,有一些网
站,你可以在上面押注赌某个特定事件将会发生或不会发生,包
括谁将成为某场足球赛、赛马或选举的赢家。预测市场不是一个
新发明,早在16世纪就存在赌谁会当选教皇的市场了。[2]在典型的预测市场上,合约被定价为0~100点。任何时候你都可以看到
买入和卖出的报价,比如买入56.8点、卖出57.2点。如果你想买
入一份合约,你可以立即以57.2点的价格买入,或者报出57.0点
的买入价,然后等待愿意接受这个价格的卖家。如果你以57.0点
(即57美元)的价格买入一份希拉里·克林顿竞选美国总统获胜的
合约,这意味着一旦她竞选成功,根据这份合约你将得到100美
元的收益。当然,合约的价格会上下波动。
把当前的市场价格视为市场概率,这是自然而然的事。如果
C的发生概率是0.57,这个赌局的期望值就是57美元。也就是
说,如果C发生,则收益为100美元;反之,收益为0美元。如果
市场价格与概率的计算结果不相符,那么我们应该怀疑有人在从
事市场套利活动。我们认为,你的报价(如果价格低于x,你就
会少量购入,如果价格高于y,你就会卖出)应该可以准确地反
映出你的概率。
大量关于预测市场的信息资料如雨后春笋般展现在人们眼
前。购买股票、债券和保险是密切相关的活动,下面列出的这些
原则可能对我们从事这些活动有所帮助。[3]
我们将本堂课的正式内容分为两个部分,分别介绍一种简单
的方法和一种复杂的方法。就像早期的赌徒那样,对当下讨论的
这些问题而言,我们先要假设金钱是价值的量度。有了这个先决
条件,我们就可以通过直截了当的方式估算判断概率
(judgmental probability),并推断这些具有相关性的判断的数学
结构。第二部分则舍弃了这个假设前提,进行了更具一般性的分
析。这样一来,“概率和效用都是可以测量的”伟大思想就完整了。这套理论的主导思想是由年轻的天才弗兰克·拉姆齐于20世纪
20年代提出的。20世纪50年代,美国统计学家伦纳德·吉米·萨维
奇(Leonard Jimmie Savage)使其得到了全面发展。[4]部分Ⅰ:赌博与判断概率
在测度判断概率时,我们借鉴惠更斯的做法,逆向应用帕斯
卡与费马提出的方法。也就是说,我们用期望值来计算概率,而
不是通过概率来计算期望值。我们认真考虑某个人愿意在某个事
件上押下的赌注,以此估算该事件的期望值。你的判断概率的加
权平均值,就是事件的期望值。
具体来说:
如果赌局结果为A时的收益为1,反之为0,A的概率就是该赌
局的期望值。
如果你为该赌局支付的价格等于P(A),这可以被视为一次等
价交易。如果价格低于P(A),你就会愿意买入;如果价格高于
P(A),你肯定不愿意买入。因此,根据你的价格平衡点,就可以
测算出你对A的判断概率。
这种方法很牵强,因为它理想化地假设人们可以毫不费力且
准确地区分这些具体情况。但是,我们在做很多决策时,需要完
成的全部工作可能只是近似值计算过程的头几个步骤。我们到底
能走多远?这个问题没有明确的答案。接下来,我们继续研究这
套理想化的理论。
相关性判断
一般而言,判断概率是否具有通过计数得到的数学结构呢?菲尼蒂指出,如果一个人的押注行为是相关的,那么他的判断概
率的确具有概率的数学结构。这个基本论点很容易证明。( 就目前
而言,我们在论证过程中假设可以用金钱度量价值,但本章的第二部分将会舍弃这
个假设。)
我们通过理想化的模型来论证这个观点,这个模型的目的只
是让人受到启发,因此不需要与真实生活完全一致。假设一个人
像赌注经纪人(或者衍生品交易员)那样买卖赌注。如果他的期
望值是零,这就是一个公平的赌注;如果他的期望值是正值,这
就是一个有利的赌注;如果他的期望值是负值,这就是一个不利
的赌注。只要有人找上门来,他便来者不拒,一边买入公平或有
利的赌注,一边卖出公平或不利的赌注。在这种情况下,如果若
干桩交易以某种方式组合到一起,她就有可能掉入荷兰赌
(Dutch book)的陷阱,也就是说,无论在哪种情况下,她都会
遭受净损失。我们认为,如果荷兰赌对她毫无影响,她的判断就
具有相关性。
比如,假设你问我对弗格霍恩参议员成功连任的判断概率。
经过思考之后,我回答说0.6。然后,你问我鲍比·布罗哈德当选
的概率,我回答说0.1。接着,你又问我弗格霍恩或者布罗哈德当
选的概率,我回答说0.9。如果我坚持自己的看法,这些判断概率
就不具有相关性。你可以采用荷兰赌的策略,从我这里购买弗格
霍恩的获胜概率为0.6、收益为1的赌注,和布罗哈德的获胜概率
为0.1、收益为1的赌注,再卖给我弗格霍恩或者布罗哈德的获胜
概率为0.9、收益为1的赌注。这样一来,无论最终谁获胜,你都
可以得到0.2的收益。如果你心地善良,指出我的判断不具有相关性,而不是借此
机会牟利,那么我很可能会重新考虑我对这些概率做出的判断。
我们都会做出根本不相关的草率判断。有时这无关紧要,但如果
赌注非常高,这些判断变得非常重要,又会怎么样呢?举个极端
的例子。假设你是一个对冲基金经理,市场上还有其他对冲基金
经理。如果你意识到自己的判断不具有相关性,难道不应该自我
反思一下吗?
从根本上说,要具备相关性,就必须做到前后一致,在逻辑
上同样需要前后一致。一位智者说过:“我们都会相信一些前后
矛盾的事情。理性讨论的目的,就是当有人说‘你认为A和B都是
对的,但是通过一系列推理,而且你认为每一步推理都没有问
题,最终却可能发现B不是A的必然结果’时,你会意识到出了问
题,想改正它。”
不确定性判断同样如此。当然,这里没有赌注经纪人,也没
有人赌博。但和一致性一样,相关性似乎也是一个值得我们关注
的标准。
菲尼蒂告诉我们,相关性表明我们的判断具有概率的数学结
构。
相关性判断就是概率
如果我们说一个人的判断具有概率的数学结构,就相当于说
它们表现出比例的特点。它们是部分置信的比值,最小值为0。
重言式(tautology)是指某个命题在整个概率空间中都为真,其比值为1。由相互独立的部分(彼此矛盾的命题)构成的组合,整体的比值是各部分比值之和。如果一个袋子里有20%的红豆和
35%的白豆,那么有55%的豆子是红色或者白色的。我们马上会
看到,有了这个概念之后,我们就可以将概率的数学结构应用于
有限的概率空间了。( For those who are concerned about infinite spaces, there is a
completely analogous ar-gument for countable additivity using a countably infinite number
of bets. See e. Adams, “On Rational Betting Systems,” Archiv für mathematische Logik
und Grundlagenforschung 6 (1962): 7–29. Is it legitimate to use a countable number of
bets? This is controversial. De Finetti thought not. For further discussion, see B. Skyrms,“Strict Coherence, Sigma Coherence and the Metaphysics of Quantity,” Philosophical
Studies 77 (1995): 39–55. Reprinted in Skyrms, From Zeno to Arbitrage (Oxford: Oxford
University Press, 2012).)
相关性意味着概率
1. 最小值为零。假设你给出一个命题p,其概率小于0。那
么,你会认为“如果p发生则损失1,反之没有损失”这个赌注的期
望值是正值。
在这种情况下,你无论如何都会遭受净损失。如果p没有发
生,你从赌局中得不到任何收获,本钱也拿不回来了。如果p发
生了,你就会遭受双重损失,既输掉了本钱,又输掉了赌局。
2. 重言式的概率是1。假设你认为重言式(即在任何情况
下,它都是真命题)的概率不是1,而是大于或小于1。如果它的
概率大于1,那么对“如果p发生则收益为1,反之收益为零”的赌
注,你付出的代价将超过1。而结算赌注时,你只能赢1,因此你
将蒙受净损失。如果你判断重言式的概率小于1,你就会以低于1
的价格出售“如果p发生则收益为1,反之收益为0”的赌注。结算赌注时,买家的收益为1,而净损失则由你承担。
3. 相互独立部分的概率可以相加。现在考虑概率的可加性。
假设p与q相互独立(它们的合取会导致自相矛盾)。但请注
意,“如果p或q发生则收益为1,反之收益为0”的协议可以通过直
接和间接两种方式实现,直接方式是押注p或q,而间接方式是同
时押注p和q。
间接押注的总成本是P(p)+P(q)。根据相关性,直接押注的成
本应该等于间接押注的成本:P(p或q)=P(p)+P(q)。如果等号两边
不相等,那么显然有可能被人利用,以贱买贵卖的方式实施荷兰
赌。在满足模型假设条件的情况下,相关性从本质上看就是指可
通过不止一种方式实现的赌博协议能够得出一致的估算结果。
概率意味着相关性
如果判断就是概率,赌博的期望值就可以相加。
E(b1+b2+…)=E(b1)+E(b2)+…
由于荷兰赌肯定会导致损失,因此它的期望值E(b1+b2+…)
必须是负值,而E(b1)、E(b2)…都是非负值。由此可见,荷兰赌
是不可能实现的。如果判断就是数学概率,那么这些判断都具有
相关性。
当且仅当判断概率具有经典概率的数学结构时,这些判断概
率才具有相关性。概率的更新
我们已经回答了最初提出的那个问题,但是,一旦开启了这
种思考方式,它就会引领我们不断深入到这个有趣的领域之中。
前面,我们介绍了静态相关性(在某个固定时刻具有相关性的判
断概率)的一些特性。接下来,我们介绍动态相关性,即置信度
随时间发生具有相关性的变化。首先,我们必须了解菲尼蒂指出
的条件赌注具有哪些特性。
条件赌注
对于相关性,菲尼蒂还有一个非常重要的观点,即条件概率
与条件赌注之间存在某种联系。( Conditional probabilities explain much of
the pragmatics of indicative conditional con-structions — If Mary is lying, then Samantha
is guilty — in natural language. See e. Adams, The Logic of Conditionals: An Application
of Probability to Deductive Logic, Synthese Library 86 (Dordrecht, Holland: Reidel, 1975).
You may consider whether the ensuing discussion pro-vides a rationale.)所谓条件赌
注,是指一旦条件没有满足,就会被取消的赌注。因此,针对q
的条件为p的赌注具有以下形式:
如果p且q,则收益为a(如果p且q,则赌局赢);
如果p而非q,则收益为–b(如果p而非q,则赌局输);
如果出现其他结果,则收益为0(如果非p,则赌局取消)。
如果某个条件赌注被视为公平的,则估算条件概率,即P(q |
p),为b(a+b)。举例说明。弗雷德判断萨拉被提名并成功当选的概率是13,因此他认为“如果萨拉被提名并成功当选则赢23,反之则输
13”的赌注是公平的。与此同时,弗雷德判断萨拉获得提名的概
率是12,因此他认为“如果萨拉被提名则输13,反之则赢13”的
赌注也是公平的。注意,这两个赌注一起构成了萨拉当选的条件
赌注,条件是她被提名,估算条件概率为23。(如果萨拉未获提
名,弗雷德会赢13,但也要输13,因此他的净收益为0。这与因
为萨拉未获提名而取消赌局的结果是一样的。)
现在,我们假设弗雷德的条件赌注的损益情况与这个条件概
率不一致。比如,假设他认为以萨拉获得提名为条件的等额赌注
是公平的,并采取了这种押注策略,他的做法就不具有相关性。
如下所述,他有可能遭遇荷兰赌。
为了使荷兰赌的整个过程一目了然,我们将它分成两个阶
段。
阶段1。首先,我们制订押注方案B1:如果萨拉获得提名并
成功当选,我们付给弗雷德23;反之他付给我们13。再次,我
们为弗雷德制订押注方案B2:如果萨拉获得提名,他付给我们
13;反之我们付给他13。最后,我们以萨拉获得提名为条件,针对她能否成功当选制订押注方案B3:如果萨拉获得提名并成功
当选,弗雷德付给我们12;如果萨拉获得提名却败选,我们付给
弗雷德12;如果萨拉未获提名,则取消赌局。下表展现了各种可
能情况下弗雷德的损益情况。阶段1只是一个有条件的荷兰赌,即只在萨拉获得提名的情况下,弗雷德肯定会蒙受损失。阶段2。为了把它变成一个完整的荷兰赌,我们可以采用对
冲的方式,即再制订一个等额押注方案B4:如果萨拉获得提名,我们付给弗雷德112;反之他付给我们112。弗雷德认为这是公
平的。这样一来,无论选举结果如何,弗雷德的净损失都是
112。因此,弗雷德遭遇了荷兰赌。如果希望了解一般情况下的
分析结果,可参阅本堂课内容的附录1。
相关性更新我们已经讨论了条件赌注和无条件赌注在给定时刻的相关
性。当我们得到新的证据时,概率会发生什么变化呢?置信度是
否会发生某种具有相关性的变化呢?假设这个新证据是某个具有
确定性的命题e。那么,在改变判断概率时,遵循的标准规则
是:以e为条件调整原来的概率,并代之以新的概率。这就是所
谓的“以证据为条件”(conditioning on the evidence)。从相关性
角度看,这种做法有道理吗?我们想要强调的是,我们不再考虑
置信度是否具有相关性,而代之以寻找置信度变化规则的相关
性。
菲尼蒂对这个问题的讨论比较隐晦,第一个明确提出这个观
点的是哲学家戴维·刘易斯(David Lewis)。( Communicated by Paul
Teller, “Conditionalization and Observation,” Synthese 26 (1973): 218–58.)以证据为
条件,贝叶斯更新(Bayesian updating)就是在新情况下更新概
率的唯一具有相关性的规则,而其他任何规则都会为荷兰赌(有
时间跨度的荷兰赌,即历时性荷兰赌)大开方便之门。下文将介
绍一个模型,它是这个观点的一个精确版本。
模型
知识学家(包括科学家和统计学家)与赌注经纪人一样,在
根据证据更新概率时秉持着自己的一套原则,但我们猜测不出它
到底是什么。今天,他公布自己的判断概率,并据此买卖赌注。
明天,她会先进行观察(得出有限个可能的结果,而且每个可能
结果的先验概率都为正);然后,根据他的更新规则(表达可能
的观察结果与修改后的概率之间关系的函数)更新概率,并公开
更新规则。后天,她公布修改后的公平价格,据此买卖赌注。赌徒的策略应该包含两个部分:一是当天有限数量的交易,知识学家根据他的判断概率,认为这些交易都是公平的;二是根
据可能的观察结果为后天的有限数量的交易确定交易价格的函
数,知识学家根据他的更新规则,认为这些价格都是公平的。
相关的置信度变化意味着以证据为条件
用P(A | e)表示 P(A∩e) P(e),用Pe(A)表示e被观察到是赌注经
纪人根据非标准更新规则(与以证据为条件的规则不同)给出的
A的概率。假设P(A|e)> Pe(A)( The case where P(A.| e).< Pe(A) is similar.),用
δ表示P(A|e)–Pe(A)。那么,赌徒可以利用下面这个策略实现荷兰
赌。
今天:以赌注经纪人认为公平的价格向他报价:
1. 如果A且e,则收益为1;否则,收益为0。
2. 如果非e,则收益为P(A|e);否则,收益为0。
3. 如果e,则收益为δ;否则,收益为0。
明天:如果观察到e,则以当前的公平价格,即Pe(A)=P(A|e)–δ,向赌注经纪人报价,购买“如果A,则收益为
1;否则,收益为0”的赌注。
在这种情况下,所有可能的结果都会导致赌注经纪人损失
δP(e)。( Let’s work it out: Suppose e doesn’t happen. Then only the bets from the
first day count. The bookie paid out fair prices for the 3 bets, respectively:1. P (A
and e),2. (1. P(e)) P(A.| e).= P(A.| e).. P(A and e),3. δP(e).He loses bets 1 and 3 butwins bet 2 and collects P(A.| e).Adding it up, the bookie loses δP(e).Suppose e does
happen. Then the second transaction is made. We buy back the bet on A from the
bookie. He getsP(A.| e)..δ.It now makes no difference whether A happens or not. But
the bookie has won bet 3 and so getsδ.Adding it up, the bookie loses δP(e), as
before.)
当然,我们也可以从确定的盈利中拿出一小部分,把它们分
摊到各笔交易中,以增加报价的吸引力。这样一来,赌注经纪人
就会发现,所有交易在他接受的那一刻就会成为对他有利的荷兰
赌。
以证据为条件意味着置信度的相关性变化
如果知识学家的概率更新符合以证据为条件的规则,那么赌
徒策略的所有可能收益都只能通过当天的条件赌注来实现。因
此,如果他当天的判断概率具有相关性,而且她根据证据更新概
率,那么任何人都无法利用荷兰赌从他那儿获利。
置信度的相关性变化就是一致性
但是,我们能不能断定,历时性荷兰赌之所以具有这种威
胁,是因为在评估同一目标的两种实现方式时,我们给出的评估
结果不具有一致性呢?大家应该对刘易斯的荷兰赌比较熟悉。其
中,前两个押注方案是利用两个非条件赌注实现条件赌注。第三
个是额度不大的附加赌注,与菲尼蒂用来论证条件概率的荷兰赌
相似。
假设我们已经理解了菲尼蒂的论点,并且知道条件赌注的评
估结果必须具有一致性。那么,历时性荷兰赌就会变为:我们可以通过两种不同的方法制定符合我们的认知模型的条件赌注。一
种方法是在今天以菲尼蒂告诉我们的方式制定条件赌注;另一种
方法是等到明天,如果条件(取得证据e)得到满足,就按照明
天的价格押注。如果两者一致,就说明我们已经按照以证据为条
件的规则改变了我们的判断概率。置信度的相关性变化与以证据
为条件的规则是一致的。
相关性更新的延展
上文中的以证据为条件更新概率的荷兰赌,是在一个特定的
较为程式化的认知模型中发生的。我们可以放宽模型的限制条
件,或者通过多种方式修改模型。事实上,文献资料表明,统计
学家和哲学家都曾利用结构化的认知模型来研究相关性。戴维·弗
里德曼(David Freedman)与罗杰·普维斯(Roger Purves)撰写
的《适合赌注经纪人的贝叶斯方法》(Bayes Method for
Bookies)( David Freedman and Roger Purves, Annals of Mathematical Statistics 40
(1969): 1177–86.)就为我们提供了一个很好的切入点。在这篇文章
中,作者没有假设统计人员一定会形成先验概率。此外,作者还
指出,如果统计人员的决策行为具有相关性,就会表现出他有先
验概率和以证据为条件更新概率的特点。
有的研究还会延伸至证据不确定的情况。在理查德·杰弗里的
概率运动学(probability kinematics)模型中,( Richard Jeffrey (1965),The Logic of Decision, 3rd rev. ed. (New York: McGraw-Hill; Chi-cago: University of
Chicago Press, 1983).)并没有确定性的证据命题。相反,在证据经验的
作用下,证据命题的概率将发生变化,而以证据分类为条件的其
他命题的概率则保持不变。因此,对与概率的微小变化有关的更新来说,其一般概念具有丰富的内涵。( See P. Diaconis and S. Zabell,“Updating Subjective Probability,” Journal of the Ameri-can Statistical Association 77
(1982): 822–30.)此外,杰弗里对相关性与荷兰赌的理解也很到位。(
B. Skyrms, “Dynamic Coherence and Probability Kinematics,” Philosophy of Science 54
(1987): 1–20. Reprinted in B. Skyrms, From Zeno to Arbitrage (New York and London:
Oxford University Press, 2012).)如果你对这些感兴趣,可参阅本章的附录
2。
从数学角度看,荷兰赌的相关定理都是套利理论的一部分。
市场扮演着赌注经纪人的角色,以现行价格买入或卖出赌注。如
果市场不具有相关性,同样的赌注价格就有可能不同,这为套利
者利用市场的不相关性赚取利润创造了机会。如果是预测市场,而且这种不相关性的市场有很多个,套利其实就是荷兰赌。利用
套利理论,可以建立既适用于某个时点又适用于某个时间段的一
般相关性理论。( See B. Skyrms, The Dynamics of Rational Deliberation
(Cambridge, MA: Harvard Uni-versity Press, 1990) and “Diachronic Coherence and
Radical Probabilism,” Philosophy of Sci-ence 73 (2006): 959–68. Reprinted in B. Skyrms.
From Zeno to Arbitrage (New York and Lon-don: Oxford University Press, 2012).)
由于某些人对利用赌博来证明合理置信度的做法感到不安,菲尼蒂给出了一种基于校准(calibration)的替代性证明方法。(
B. de Finetti (1974), Theory of Probability, tr. A. Machi and A. Smith (New York: Wiley,1999).)( There is another motivation as well, based on incentives to reveal one’s true
probabilities.)我们希望自己相信的东西都是事实,因此我们给真相赋
值1,给谬误赋值0。在发现真相之前,你有一定的置信度。假设
在发现真相后,你将受到平方误差的惩罚。比如,你认为P(A)为
0.9,结果发现A为真,则你受到的惩罚是0.01;但如果A为假,则
你受到的惩罚是0.81。菲尼蒂指出,如果你的判断不具有相关性,那么无论真相如
何,你都可以通过相关性的置信度(概率)来降低惩罚的力度。
我们来看一个简单的例子。假设A和B相互独立,那么真相只有三
种可能性:两者都是假的;A真,B假;A假,B真。概率是真相
期望值的加权平均。( Also known as mixtures, or convex combinations.)令
x=P(A), y=P(B),z=P(A∪B),就会形成如图2–1所示的二维图
形z=x+y。
相关性观点认为,这些概率与相关性置信度是一致的。假设
某些置信度不具有相关性,与这些不相关的置信度对应的点就不
在该平面上。根据欧几里得几何学,无论真相如何,在该平面上
都一定存在一个十分接近真相的点。这些评分规则有多重应用,天气预报人员用它们来校准自己的预测,专家们则通过它们保证
自己表述的观点与自己的真实观点一致。( See A. H. Murphy and R. M.
Winkler, “Probability Forecasting in Meteorology,” Journal of the American Statistical
Association (1984): 489–500, and L. J. Savage, “elicitation of Personal Probabilities and
expectations,” Journal of the American Statistical Association 66 (1971): 783–801,respectively.)
虽然菲尼蒂证明判断概率的两种方法似乎十分不同,但它们
都显示出相同的数学属性,( This is called convexity.)即各种可能性的加
权平均值是概率。如果置信度不是真相期望值的加权平均值(概
率为1或0),就有可能导致糟糕的结果——要么为荷兰赌留下可
乘之机,要么偏离真相,而且偏离的程度肯定大于所有相关性置
信度。部分Ⅱ:效用与判断概率
金钱不能代表一切,在大多数的人类事务中,用来衡量损益
的都不是金钱,而是我们珍视的东西。有时候,两种商品具有互
补关系,彼此都可以增加或降低对方的价值,因此在用实物衡量
损益时,两个赌注的损益值可能不具有可加性。由于风险厌恶
(risk aversion)( 风险厌恶,是指投资者对投资风险反感的态度,可用来测量
人们通过付钱来降低风险的意愿。——译者注),即使金钱也不一定能满足
荷兰赌的假设条件。如果两个赌注对冲,可能会形成互补关系,因为风险降低了。在现代,效用与金钱之间并不是线性关系。解
决这些问题的方法是用效用取代金钱,重建理论。图2-1 三种结果的可能概率
但是,效用如何测度呢?概率和效用的测度都可以采用非循
环方式吗?答案是肯定的,由才华横溢的拉姆齐在一篇著名的论
文《真理与概率》(Truth and Probability)中给出。不过,我们
的故事开始的时间要早得多,经过几番跌宕起伏,才会轮到拉姆齐登场。
效用
明智的人早就知道金钱不是衡量价值的真正标准,但直到尼
古拉·伯努利(Nicholas Bernoulli)提出“圣彼得堡悖论”之后,人
们才开始关注赌博理论。1713年9月9日,尼古拉·伯努利在写给皮
埃尔·蒙特莫特(Pierre Montmort)( “Correspondence of Nicholas Bernoulli
concerning the St. Petersburg Game,” tr. from Richard J. Pullskamp, Die Werke von Jacob
Bernoulli Band 3 K9, Xavier University (2013). Posted at
http:cerebro.xu.edumathSourcesNBernoullicorrespondence_petersburg_ game.pdf.)的
信中提出了几个问题,其中包括下面两个问题:
第四个问题。A向B承诺:如果B用一枚普通的骰子,第
一轮就掷出6点,A就给B一枚硬币;如果B第二轮掷出6点,A就给B两枚硬币;如果B第三轮掷出6点,A就给B三枚硬
币;如果B第四轮掷出6点,A就给B 4枚硬币,以此类推。请
问B的期望值是多少?
第五个问题。问题同上,但是A承诺付给B的硬币数目
不是按照1、2、3、4、5…这样的规律增长,而是按照像1、2、4、8、16…或者1、3、9、27…或者1、4、9、16、25…
或者1、8、27、64…这样的规律递增。尽管这些问题大多不
难解答,但你会有一些非常奇怪的发现。
蒙特莫特回答道,这些问题并不难,只要求出无穷级数的和
即可,而“你的伯父雅各布·伯努利早就给出了这类级数的求和方
法”。尼古拉·伯努利在回信中建议蒙特莫特亲自试一试。虽然第四
个问题中的无穷级数之和是6,但第五个问题中的几个无穷级数
之和都是无穷大。这就是伯努利所说的“非常奇怪的发现”。这样
的结果意味着什么呢?这个赌博游戏的期望值怎么会大于所有的
有限和呢?两个人都困惑不解,于是伯努利向其他人抛出了这个
问题。1728年5月17日,瑞士数学家加百利·克莱姆(Gabriel
Cramer)从伦敦给尼古拉写了一封信:
我不知道我是否在欺骗自己,但我相信我能解答你向蒙
特莫特提出的那个古怪问题……为了使问题变得更加简单,可以假设B抛硬币。如果B第一次就得到正面朝上的结果,则
A承诺付给B一枚硬币;如果B第二次才得到正面朝上的结
果,则A付给B两枚硬币;如果B第三次才得到正面朝上的结
果,则A付给B 4枚硬币;如果B第4次才得到正面朝上的结
果,则A付给B 8枚硬币,以此类推。计算结果表明,A必须
支付给B的硬币数量是一个无穷大量。这看上去十分荒谬,因为所有理智的人可以接受的最大数字都不超过20。这恰恰
是悖论所在。人们不禁要问,数学计算结果与普通人的估算
结果之间为什么会有如此大的不同?我认为,其中一个原因
在于,数学家是根据金钱的数量来估计价值的,而理智的人
依据的则是金钱的效用。
接着,克莱姆提出了两个重要的观点。第一,如果没有无限
多的赌资,这场游戏就不可能无休止地进行下去,而且即使赌资
巨大,这个赌局的预期效用也不会太大。第二个观点与我们现在
讨论的内容密切相关,即真实价值与财富数量不成正比。我们不难发现,如果针对有钱人的主观价值(Moral
Value)做出假设,就会得到一个较小的(期望值)。原因
在于我做出的假设并不绝对公平,因为1亿美元带来的愉悦
感肯定比1 000万美元多,尽管前者达不到后者的10倍。
于是,我们就有了明显不同于货币价值的效用概念,即主观
价值。10年后,尼古拉的堂弟丹尼尔·伯努利(Daniel Bernoulli)
在《圣彼得堡皇家科学院评论》(Commentaries of the Imperial of
Science of Saint Peterburg)上提出了这个问题(即圣彼得堡悖
论),并给出了基本相同的答案。此前,丹尼尔从尼古拉那里获
悉了克莱姆的研究成果,因此他在论文中明确表示荣誉应当全部
归属于克莱姆:
那时这位杰出的学者告诉我,著名数学家克莱姆曾针对
相同的问题提出过一个理论,而且时间比我的这篇论文早好
几年。事实上,我发现他的理论与我的非常相似。我们对这
类问题独立给出的答案竟然如此一致,这堪称一个奇迹。
克莱姆和丹尼尔·伯努利也各自提出了具体的效用函数。克莱
姆认为效用是金钱的平方根;伯努利则认为金钱增量产生的效用
与已经拥有的金钱数量成反比,财富的派生效用等于财富数量的
对数。( On either of these suggestions, one can recreate the problem, but postulating
prizes that grow fast enough as pointed out by Karl Menger in 1934: K. Menger, “The Role
of Uncertainty in economics,” in Martin Shubik, ed., Essays in Mathematical Economics in
Honor of Oskar Mor-genstern (Princeton: Princeton University Press, 1934; 1966).)接
着,伯努利又对风险厌恶进行了描述,并讨论了购买保险的合理
性。( D. Bernoulli (1783), tr. L. Sommer as “exposition of a New Theory on theMeasure-ment of Risk,” Econometrica 22 (1954): 22–36.) ( The St. Petersburg game
continues to be provocative, and there are many perspectives on it. For more, we suggest
you look at R. J. Aumann, “The St. Petersburg Paradox: A Discus-sion of Some Recent
Comments,” Journal of Economic Theory 14 (1977): 443–45, and P. Samu-elson, “The St.
Petersburg Paradox: Defanged, Dissected and Historically Described,” Journal of
Economic Literature 15 (1977): 24–55.)
效用的测度
除非效用可以用数量来衡量,否则讨论财富的效用函数将毫
无意义。那么,效用如何测度呢?19世纪英国的功利主义者认为
这个问题应该由心理学(或者心理学与哲学一起)解决。他们同
意克莱姆和丹尼尔的观点,认为金钱每增加一个单位,其效用将
随着财富的增多而逐渐减少,并以此作为社会改革的基础。
但在20世纪早期,一个实证主义经济学派对这个问题进行了
深入研究。他们认为,如果效用无法测度,我们就只能利用比较
和主观的语言来描述包含经验内容的效用。比如,对卡尔而言,如果A的效用大于B的效用,这就意味着卡尔更倾向于A。或者
说,如果卡尔可以选择,那么他将选A而不是B。效用标度只具有
序数意义,也就是说,任何两个排序相同的效用标度都具有相同
的经验内容。
1944年,约翰·冯·诺依曼(John von Neumann)和奥斯卡·摩
根斯特恩(Oskar Morgenstern)出版了《博弈论与经济行为》
(Theory of Games and Economic Behavior),彻底改变了这个局
面。( J. von Neumann and O. Morgenstern, Theory of Games and Economic Behavior
(Princ-eton: Princeton University Press, 1944).)这部著作通过引入关于概率的经典研究成果,在序数效用论的基础上构建了基数效用论。
假设根据你的偏好,将某些最好的结果称作“好”,将最不好
的结果称作“坏”。再假设你对赌博游戏(或彩票)的偏好满足下
列条件:“好”的概率为p,其他情况都属于“坏”。我们可以随意选
择“好”和“坏”的效用值,但要保证前者大于后者。效用标度(与
摄氏度、华氏度等温度标度类似)中的0和1正好可以满足这个条
件。为简单起见,我们将“好”的效用值设为1,而“坏”的效用值设
为0。
现在,假设对其他任何结果O的效用而言,我们都可以找到
一个结果是“好”的概率为p,而在其他情况下结果都是“坏”的赌
局,并使p与O这个肯定结果没有差别。( 这个假设条件到底是什么意思
呢?不要着急,在后文中我们将会告诉你答案。)然后,令O的效用值等于
p,也就是说,O的效用值等于这个赌局的期望效用。由于已经知
道结果是“好”的概率,我们可以用期望效用来测算效用。请注
意,我们无须抱怨效用的序数性,因为这里只使用了序数判断,尽管判断的范围已经延伸至客观的赌博游戏。其实,为序数效用
奠定量化基础进而产生基数效用的,恰恰是赌博中的概率。
此外,我们有必要指出“赌博”这个词可能带有其他含义,在
这里它表示结果的概率分布。因此,本书中可能出现的若干赌
局,同样指的是结果的概率分布。我们假定在针对有限个结果押
注时,一个个体对所有这些赌局的偏好具有一致性。在这个条件
下,我们可以得出一条定理:必然存在一个效用,使赌局的期望
效用与该个体的偏好一致。让我们具体说说偏好必须满足哪些条件。首先,偏好必须能
对所有赌局排序。这并不意味着你对两个赌局的偏好一定存在差
异,也有可能是一样的。但是,在做比较时不能毫无头绪,而应
该说出A与B哪个更好、哪个更差,或者两者一样,这才是一组理
想化的偏好。其次,偏好必须具有连续性和独立性。
连续性:如果p优于p',p'优于p,则存在概率a,使得
ap+(1–a)p与p'没有差别。
独立性:p优于p'的条件是当且仅当
对于所有的a与p,ap+(1–a)p 优于ap'+(1–a)p。
对独立性定义中的两个赌局来说,收益p的概率都是(1–a)。
它们唯一的区别就在于概率为a时你的收益的不同,所以你的偏
好应该是受到控制的,控制因素是概率为a时你对赌局收益的偏
好。这就是独立性的内容。
我们并不打算证明偏好的这两个性质,但我们可以对它们的
作用原理稍加了解。我们先为赌局制定一个包含“好”与“坏”的效
用标度,效用值就是“好”的概率。现在我们需要说明的是,对那
些介于“好”与“坏”之间的赌局而言,效用可以表示你对赌局的偏
好排序情况。我们知道你对“好”的偏好程度大于“坏”,但我们还
需要证明你对“好”、“好”与“坏”之间的某个非无效赌局、“坏”的
偏好程度依次减少。
假设我们有一个非无效赌局“p‘好’+ (1–p)‘坏’”。由于“好”等于确定无疑的“好”,“坏”等于确定无疑的“坏”,而且“好”优于“坏”,因此我们可以应用独立性,p“好”+ (1–p)“好”,p“好”+ (1–p)“坏”,p“坏”+ (1–p)“坏”,并且断定这些偏好的排序没有问题。在应用独立性时稍微增
加复杂度,就可以证明两个非无效赌局的排序情况,即在效用标
度上位置较高的赌局优于位置较低的赌局。
在测度“好”与“坏”之间除特殊赌局之外的其他任何赌局q的效
用时,我们可以找出一个特殊赌局p,使得p与q对我们而言没有
任何差别。于是,我们为赌局q赋予与p相同的效用。为什么我们
总能找到这样的参照赌局呢?因为连续性。通过重复应用独立
性、有序性和连续性,我们就可以得到完整的适用于有限结果的
冯·诺依曼–摩根斯特恩定理。
在上一章我们说过,用金钱论证荷兰赌会引起人们的哲学忧
虑。如果我们用冯·诺依曼–摩根斯特恩效用来表示收益,就不存
在这个问题了。不过,我们先用效用来测度判断概率,现在又用
判断概率来测度效用,这难道不是在兜圈子吗?当然不是。我们可以用经典的概率(骰子、公平彩票、幸运
转盘等),来测度所有事物对某个人的效用。然后,我们用这些
效用来测度她对概率游戏结果以外的其他事情的判断概率,比如
明天是否会下雨、选举结果,以及大家是否会失业等。这是弗朗
西斯·安斯科姆(Francis Anscombe)和罗伯特·奥曼(Robert
Aumann)用一种简洁的方法,于1964年取得的一项成果。( F. J.
Anscombe and R. J. Aumann, “A Definition of Subjective Probability,” Annals of
Mathematical Statistics 34 (1964): 199–205.)
但是,这相当于认定行为人面临的是经典的等可能情况,并
规定行为人认为这些情况发生的可能性完全相等。要全面描述行
为人的判断,就必须描述所有概率以及源自个人偏好的所有效
用。也许你认为这不可能做到,但是,拉姆齐在他的论文《真理
与概率》中做到了。( F. P. Ramsey, “Truth and Probability” in The Foundations of
Mathematics and Other Logi-cal Essays (London: Routledge and Kegan Paul, 1931): 156–
98.)他是如何做到的?
拉姆齐
关于这个问题,我们已经略有了解,但我们还不清楚拉姆齐
提出的“伦理中立”的观点。所谓伦理中立,是指命题p本身的真
或假对行为人的偏好没有任何影响。也就是说,对任何结果的集
合B来说,无论是p为真时的B还是p为假时的B,在行为人看来都
没有任何差别。比如,电脑开机所花时间是奇数还是偶数(以毫
秒为单位),抛硬币的结果是正面朝上还是反面朝上,这些问题
大家会关心吗?通常,我们只关心某些事情,因此伦理中立的命
题有很多。从直觉上讲,以伦理中立的命题为前提设立赌局,好处在于它们的期望效用只取决于结果的概率与效用,而其自身的
效用并不是复杂因素。
我们可以按照下列方式确定一个伦理中立命题h概率为12。
假设有两种结果A和B,并且你对前者的偏好程度强于后者。如果
对你而言,[如果h则A,反之则B]与[如果h则B,反之则A]
没有任何不同,这个伦理中立命题h的概率就是12。现在,我们
为公平的抛硬币游戏找到了一个主观的替代物。这一点非常重
要,反复加以利用的话,就可以构建出效用标度。拉姆齐采用的
就是这个办法,它与冯·诺依曼–摩根斯特恩定理的区别不大,但
提出的时间要早得多。有了结果的效用之后,我们就可以像菲尼
蒂那样,用它们来测度那些非伦理中立命题的概率。下面,我们
举例说明如何应用这个方法。
赛马
假设有4个命题(HH、HT、TH、TT),它们相互独立且完
全穷尽。法默尔·史密斯(Farmer Smith)并不关心到底哪个命题
是真命题。具体来说,不管他关心的东西最终会产生什么样的结
果,他关心的都只是那些结果,而非这些结果到底是HH、HT、TH还是TT产生的。因此,用拉姆齐的术语来表达的话,这4个命
题都是伦理中立命题。
另外,假设就他关心的东西而言,他对A、B、C、D的偏好
程度依次下降,同时下面的赌局
如果HH则A,如果HT则B,如果TH则C,如果TT则D,以及调整A、B、C和D的位置后形成的其他任何赌局,比
如,如果HH则D,如果HT则B,如果TH则C,如果TT则A,对他而言都没有任何差别。因此,对他来说,HH、HT、TH、TT具有相同的概率,都等于14。(这也许是因为它们在他
眼中与质地均匀的硬币的两次独立抛掷一样,而且他做判断的方
法与卡尔达诺、伽利略、帕斯卡及费马相同。)
在一场赛马比赛中,斯特波尔与莫莉这两匹马将一较高下。
斯特波尔是法默尔·史密斯的马,因此对他来说,斯特波尔获胜与
莫莉获胜的命题都不可能是伦理中立命题。这场比赛他可以下
注,如果他赢了,就有可能得到一头猪。
他最偏好的结果是得到那头猪且斯特波尔获胜,因此他给这
个结果赋予的效用值是1。他最不喜欢的结果是得不到那头猪且斯特波尔落败,因此他给这个结果赋予的效用值是0。下面是他
在选择效用标度时面临的任意选择:
1︱得到猪且斯特波尔获胜,………
0︱得不到猪且斯特波尔落败。
假设某个赌注约定,如果HH或HT或TH,则法默尔·史密斯
赢得那头猪且斯特波尔获胜;如果TT,则法默尔·史密斯得不到
猪且斯特波尔落败。对法默尔·史密斯而言,“得到猪且莫莉获
胜”与这个赌注没有任何区别。所以该赌注的期望效用是34,我
们可以把它填入效用标度:
1︱得到猪且斯特波尔获胜,︱得到猪且莫莉获胜,………
0︱得不到猪且斯特波尔落败。
再假设某个赌注约定,如果HH,则法默尔·史密斯赢得那头
猪且斯特波尔获胜;如果HT或TH或TT,则法默尔·史密斯得不到
猪且斯特波尔落败。对法默尔·史密斯而言,“得不到猪且莫莉落
败”与这个赌注没有任何区别。于是,效用标度就变成:
1︱得到猪且斯特波尔获胜,︱得到猪且莫莉获胜,…
︱得不到猪且莫莉落败,0︱得不到猪且斯特波尔落败。
对史密斯而言,“如果莫莉获胜则得到猪,反之则得不到
猪”的赌注,与“如果HH或HT,则得到猪且斯特波尔获胜;如果
TH或TT,则得不到猪且斯特波尔落败”这个赌注没有任何区别。
第一个赌注不是以伦理中立命题为前提条件的,但我们可以认为它的效用值是1。也就是说,第二个赌注(“如果HH或HT,则得
到猪且斯特波尔获胜;如果TH或TT,则得不到猪且斯特波尔落
败”)的期望效用是 ×1+ ×0= 。因此,第一个赌注(“如果莫
莉获胜则得到猪,反之则得不到猪”)必然满足
P(莫莉获胜)×效用值(得到猪且莫莉获胜)+[1–P(莫
莉获胜)]×效用值(得不到猪且莫莉落败)= 。
我们已经知道这两个效用值分别是34和14,所以我们现在
可以确定法默尔·史密斯为一个非伦理中立命题赋予的判断概率。
他认为莫莉是一个同额赌注,即
P(莫莉获胜)= 。
拉姆齐从相关性偏好的排序性入手,向我们展示了在确定概
率和效用时使偏好与期望效用保持一致的方法。(拉姆齐在他的
论文中只是概括地介绍了这个方法,但重要观点都包含其中。)
这是关于概率和效用的表示定理。根据人们偏好高期望效用的规
则,我们可以用判断概率和个人效用来表示相关性偏好。如果偏好的结构非常丰富,那么在通常情况下概率是唯一确定的,效用
值则取决于0和1之间如何选择。
更值得注意的是,拉姆齐完成这项工作的时间早于安斯科姆
和奥曼,也早于冯·诺依曼和摩根斯特恩,甚至略早于菲尼蒂。后
来,人们又提出了更加细致周密的概率表示定理,其中最著名的
是萨维奇在1954年出版的《统计学基础》(The Foundations of
Statistics)中提出的方法。( L. J. Savage, The Foundations of Statistics (New
York: Wiley, 1954).)
当然,这些效用–概率表示定理中的假设都是高度理想化
的。关于这个问题,所有在这个领域做出过重大贡献的人都非常
清楚。比如,拉姆齐指出:
我没有详细推演其中的数学逻辑,因为我认为这就好比
只需保留两位小数,而你却计算到小数点后7位一样。我的
推演只能给出数学逻辑可能的作用原理。
但是,对于许多实际事务来说,在计算概率和效用时精确到
小数点后两位就已经非常好了,即使只求出一位小数,也比没有
要好。
我们已经看到了认为概率论就是一种逻辑(相关性置信度的
逻辑)的观点是如何形成的。归根结底,它就是一种语用逻辑,是一种决策逻辑,是在结果不确定的情况下相关性偏好对行为的
作用逻辑。因此,我们可以根据有条理的行为人在做选择时的偏
好来测度他的判断概率。这又引出了下一个问题:行为人通常有
多强的相关性?我们将在下一堂课讨论这个问题。小结
判断是可以测度的,相关性的判断就是概率。
假设我们有一种测量价值的方法,并且我们根据期望值买入
和卖出各种赌注。如果我们赋予期望值的权重与数学概率不符,就有可能掉入荷兰赌的陷阱。如果期望值与概率相匹配,我们就
不会给他人以可乘之机。在新证据的基础上,人们可以根据类似
的观点,对概率进行更新。
如果还没有找到测量价值的方法,那么我们可以制定一套方
法,同时从相关性偏好入手,建立一个判断模型,这样一来,判断就是数学概率,期望值就是效用值,偏好的初始排序与期望效用一致。附录1 条件赌注的相关性
对任意命题p与q,考虑针对p且q和针对非p的赌注,以及两
个赌注的组合结果。如下表所示。
如果针对非p的赌注满足d=e,则结果相当于一个条件投注。(
只要条件的估算概率为正值,结果就一定相当于一个条件赌注。)
假设每个投注及该条件赌注都被视为公平的,则估算概率为也就是说,P(p∩q)=P(p)P(q | p) ,或者P(q | p)=P(p∩q)P(p)。
这是概率的乘法法则(通常作为条件概率的定义出现)。
如果条件赌注和非条件赌注彼此相关,那么在市场中加入条
件赌注后不会引发任何新变化。利用条件赌注得到的任何损益都
可以通过等价的非条件赌注组合来实现,因此不会形成荷兰赌。
但是,如果某个人的判断概率导致其用于实现某个条件赌注的两
种方式给出不相关的评估结果,那么我们显然可以通过低买高卖
的方式形成荷兰赌。所以,相关性问题也是一个关于可通过多种
方式实现的赌约的评估结果是否一致的问题。附录2 概率运动学
假设你在夜间起床,借着从窗户射进来的微弱月光,观察桌
子上的一颗豆形软糖。这种软糖有红色、粉色、褐色和黑色等多
种颜色。此时的光线不足以让你看清这颗软糖的颜色,但足以让
你在各种可能的答案之间游移不定。这是观察结果无法确定的一
个例子,没有任何命题可以概括你的观察内容。你也许会说对这
种体验的描述就是符合条件的命题,但这样的命题不存在于任何
合理的概率空间中,对我们没有任何益处。因此,这是一个关于
不确定性证据的例子。
这个例子似乎并不值得我们认真思考,但我们经常会面对不
确定性证据。有时,我们需要借助在烛光或月光下的观察来做出
一些重要决策。比如,那个微笑意味着什么?或者,严肃一些,想象一下放射科医生观看肺部扫描影像或病理学家解读活检结果
的情景。( See Richard Jeffrey and Michael Hendrickson, “Probabilizing Pathology,”
Proceedings of the Aristotelian Society (1989):.211–26..DOI:
http:dx.doi.org10.1093aristotelian89.1.211.)稍加思考,你就会发现,我们
身边到处都是不确定性证据。
我们经常假装自己拥有确定性证据,并做出解读,把不确定
性命题视为确定性命题。这种做法有时是无可厚非的,但我们必
须承认,不确定性证据的问题值得我们认真思考。
回到豆形软糖的例子。豆形软糖有多种口味,红色的可能是
樱桃味或肉桂味,褐色的可能是巧克力味或咖啡味。你的家中有各种各样的豆形软糖,其中大多数褐色软糖都是巧克力味,但也
有一小部分是咖啡味。假设你知道褐色软糖是巧克力味的概率,也知道其他颜色的软糖是其他口味的概率。此时,如果你只是观
察这颗软糖,而不去品尝它的味道,那么在颜色的概率分布有所
变化的情况,以颜色为条件的味道概率似乎应该保持不变。如果
是这样,你的置信度就会在颜色的基础上按照理查德·杰弗里的概
率运动学发生变化。[在杰弗里和迈克尔·亨德里克森(Michael
Hendrickson)所举的病理学例子中,他们把颜色换成了诊断,把
味道换成了预后果。]
到底在哪种意义上,相关性的研究与概率运动学有关联呢?
我们不妨进一步完善我们的软糖模型。假设你在取得观察结果之
前和之后对颜色–味道的匹配情况分别确定了一个概率(P1和
P2)。而且,有人(也从床上爬了起来)走进你的房间,然后打
开灯。于是,你确定了第三个概率(P3)。我们认为你现在可以
确定这颗软糖的颜色。
我们需要找到一种说法,以表明你在月光下的观察体验只与
颜色有关,或者说,你没有品尝这颗软糖。为达到这个目的,我
们可以假设你在开灯后通过观察颜色取得的确定性证据可以推翻
你之前取得的不确定性证据。也就是说,你的最终概率与你直接
打开灯,通过观察软糖颜色确定的概率(省略了对颜色进行观察
并取得不确定性结果的中间环节)是一样的。这种说法意味着,颜色是对确定性证据和不确定性证据的充分分割。
为了实现相关性,可以假设你在更新确定性证据时遵循一种
相关性规则。本堂课已经证明,这种相关性规则只能是以证据为条件的规则。那么,根据相关性,以观察到的颜色为条件,可以
由P2得到P3。再根据相关性和充分性,以观察到的颜色为条件,可以由P1得到P3。因此,根据概率运动学,可以由P1得
到P2(因为以颜色为条件可以保证以该颜色为条件的味道概率保
持不变)。( B. Skyrms, “Dynamic Coherence and Probability Kinematics,”
Philosophy of Science 54 (1987): 1–20. Reprinted in B. Skyrms, From Zeno to Arbitrage
(New York and London: Oxford University Press, 2012).)第3课 概率心理学不同于概率逻辑学
阿莫斯·特沃斯基我们的第3堂课要讨论的关于概率的第三个伟大思想是:概
率心理学与概率逻辑学是两门迥然不同的学科。理想化、标准化
的假设在实践中经常遭到破坏,判断概率和决策理论在规范性和
描述性方面割裂,产生了巨大的分歧。
当然,人们很早以前就知道这两门学科不完全相同,但又普
遍认为两者在应用方面十分接近。弗兰克·拉姆齐说他的理论既是
精确的逻辑学,又近似于心理学。直到不久前,经济学的主流立
场亦如此。期望效用理论可能不是精确的心理学,但它足以担当
实证科学的核心决策理论的重任。
确立心理学和逻辑学的范式非常强,因此,作为最早提出心
理学与期望效用理论之间存在重大偏差的人,莫里斯·阿莱
(Maurice Allais)和丹尼尔·埃尔斯伯格(Daniel Ellsberg)的第
一反应是试图对逻辑学进行修改,使之与心理学相匹配。( We
cannot help but remark that people have systematic problems with deduction as well. Some
deviations from correct logic are common enough to have become named falla-cies. There
are problems with conditionals and quantifiers. Students often become confused when
dealing with Aristotelian syllogisms. For many examples, and one psychological theory
designed to explain them, see P. Johnson-Laird and R. Byrne, Deduction (Mahwah, NJ: erl-
baum, 1991).)这毫无疑问,并引发了一些有趣的理论研究。不过,丹
尼尔·卡尼曼(Daniel Kahneman)和阿莫斯·特沃斯基通过一系列
的研究,有力地证明这两个学科之间有着不可逾越的鸿沟。随着
证据的积累,人们终于找到了将实证心理学应用于实证经济学的
方法,这一点在当下行为经济学的蓬勃发展中得到了充分体现。(
D. Laibson and R. Zeckhauser, “Amos Tversky and the Ascent of Behavioral econom-ics,”
Journal of Risk and Uncertainty 16 (1998): 7–47.)行为经济学可以对公共政策产生影响。如果个体并没有表现
出理性经济人应有的行为特点,而政策却假设个体都是理性经济
人,就可能会造成不幸的后果。在卫生保健这个重要领域中,政
策就有可能会偏离理性决策模型。个体往往会忽视未来的低概
率、高风险事件,而过分重视当前的费用。在一项政策分析中,杰弗里·利伯曼(Jeffrey Liebman)与理查德·泽克豪泽(Richard
Zeckhauser)指出,由于个体行为的这种特点,医疗保险表现出
认购不足的趋势,而传统的经济学理论却预测补贴型保险应该会
表现出超额认购的趋势。( See, for instance, J. Liebman and R. Zeckhauser,“Simple Humans, Complex Insurance, Simple Subsidies,” NBeR working paper 14330
(Cambridge, MA: National Bureau of eco-nomic Research, 2008).)他们得出的结论
是:“如果从行为角度分析医疗系统广泛存在的大范围补贴政
策,分析结果就会有本质上的不同。”
如果卫生保健领域、受社会服务影响较广泛的领域(比如公
共教育),以及刑事司法系统的消费者心理偏离理性选择,社会
政策就很有可能会更加关注心理学。在这里,我们对决策心理学
与决策逻辑学进行简单的对比。图3-1 丹尼尔·卡尼曼
在前文中我们了解到,拉姆齐于1926年简要阐述了偏好的效
用–概率表示定理。如果一个人在面对非常多的可选方案时的偏
好符合某些貌似合理的原则,那么在表示这些偏好时,我们可以认为它们源于个人概率和个人效用,其中期望效用高的选择优于
期望效用低的选择。
这种表示定理后来得到了证明,其中安斯科姆与奥曼在证明
时假设客观概率是可以获得的,而萨维奇与拉姆齐则没有这样
做。“某些貌似合理的原则”到底是什么呢?前文中,我们在讨论
冯·诺依曼–摩根斯特恩效用时曾介绍过两个重要概念,即有序性
和独立性。有序性是指你真的知道该如何选择。对p和q这两个选
择而言,你可能倾向于前者,可能倾向于后者,可能不偏不倚。
而且,你的偏好是可传递的。独立性是指你对两张彩票的偏好应
该只取决于那些可带来不同奖金的结果。在萨维奇和安斯科姆、奥曼的假设中,都包含了以某种形式出现的有序性和独立性。
萨维奇把独立性(确定事件推理)视为理性决策的基本原
则,但立刻遭到了法国经济学家莫里斯·阿莱的质疑。( See M. Allais,“Le comportement de l’homme rationnel devant le risque: critique des postulats et axiomes
de l’école Américaine,” Econometrica 21 no. 4 (1953): 503–46.) 1952年巴黎召开了
一次关于风险的会议,组织者阿莱在午饭期间向萨维奇提出了下
面两个问题。
问题1 请在下面两个选项中做出选择:
A. 稳赚10亿美元。
B. 有89%的概率得到10亿美元,有1%的概率颗粒无收,有
10%的概率得到50亿美元。
问题2 请在下面两个选项中做出选择:A. 有89%的概率颗粒无收,有11%的概率得到10亿美元。
B. 有90%的概率颗粒无收,有10%的概率得到50亿美元。
(注:原始问题涉及的金额都以百万美元为单位,但考虑到
货币贬值问题,我们在这里换成了10亿美元。)
大家不妨花一分钟思考一下,看看应该如何选择。
萨维奇在回答第一个问题时选择了A,而回答第二个问题时
则选择了B。阿莱随后向其他与会专家提问了同样的问题,结果
许多人(但不是所有人( Paul Samuelson and Kenneth Arrow, for instance, made
choices consistent with ex-pected utility theory.))都做出了与萨维奇相同的选
择。到目前为止,这个实验已经重复了很多次,结果一直非常稳
定。
如果你的选择与萨维奇(以及本书的两位作者)相同,那么
请你再花一分钟时间,想一想你为什么会这样选择。
接下来,我们看看这些选择如何违背了独立性原则。我们把
这些选项看作公平彩票提供给我们的选择。一共有100张编号为
1~100的彩票,每张被抽中的概率相同。问题1可以重新表述为在
下列选项中做出选择:注意,虚线以上部分的赌注对选项A和B而言是相同的。因
此,根据独立性原则,两个选项的不同之处都是由虚线以下部分
赌注导致的。
我们删除虚线以上部分的赌注,并代之以金额为0的结果:
这正好可以得到问题2的两个选项。选项A和选项B的虚线以
上部分仍然相同,因此,我们在选择时仅需要考虑虚线以下部
分。就虚线以下部分而言,第一个问题和第二个问题完全相同。
如果你在回答第一个问题时选择A,而不选择B,那么根据独立
性原则,你在回答第二个问题时也应该选择A,而不选择B。
萨维奇在《统计学基础》一书中讨论了这个问题。他说,在
得知自己仓促做出的选择违背了确定事件推理原则之后,他回家
进行了反思,并修正了他的判断。
假设你回答第一个问题时的思路与萨维奇及本书作者相同,即你认为10亿美元已经远超你的需要,超过这个金额的资金可带
来的效用基本为零,因此你选择了A而非B。那么,在回答第二
个问题时,出于同样的原因,你可能会继续选择A而非B。
假设你在回答第一个问题时的思路与很多人一样,即如果你
选择B,并且不幸地抽到了不可能中奖的90号彩票,那么你的心情肯定会非常糟糕(你会觉得自己十分愚蠢,而且无比懊悔),因此你选择了A而非B。如果你真的这样想,那么90号彩票的实
际收益就不是零,而是负数。如果你在意这些感受,就必须把它
们视为结果。如果考虑了这些结果,你的选择就没有违背独立性
原则。。
在回答阿莱的问题时,许多人(虽然不是所有人)似乎都违
背了看似合理的理性偏好原则。不久,丹尼尔·埃尔斯伯格又提出
了一组稍有不同的问题。( D. ellsberg, “Risk, Ambiguity and the Savage
Axioms,” Quarterly Journal of Economics 75 (1961): 643–69.)
为了展示涉及风险(客观概率已知)的选择与涉及不确定性
(客观概率未知)的选择有哪些不同,曾泄露美国五角大楼秘密
文件( If you don’t know what the Pentagon papers are, you should find out.)的埃尔斯
伯格提出了一组问题。在区分这两类选择并强调这样做的重要意
义时,他沿用了经济学家约翰·梅纳德·凯恩斯(John Maynard
Keynes)( J. M. Keynes, A Treatise on Probability (London: Macmillan, 1921).)和富
兰克·奈特(Frank Knight)( F. H. Knight, Risk Uncertainty and Profit (Boston:
Houghton Mifflin, 1921).)的方法,后者的方法源自约翰·斯图尔特·穆勒
(John Stuart Mill)( J. S. Mill, A System of Logic: Ratiocinative and Inductive
(London: Harrison, 1843).)。埃尔斯伯格的第一个问题清晰地展示出两
类选择的不同之处:
有两只罐子。第一只罐子中装有100个球,包括红球和黑
球,但我们不知道两者的比例。不过,我们知道第二只罐子中有
50个红球和50个黑球。假设你面对两个赌注:一是从第一只罐子中取出的是一个红
球,则赢得100美元;二是从第一只罐子中取出的是一个黑球,则赢得100美元,你愿意选择哪一个?(受试者对这两个选项的
态度通常是没有差别。)
这是人们在面临不确定性(亦称模糊性)时的选择。
假设你面对的是这样两个赌注:一是从第二只罐子中取出的
是一个红球,则赢得100美元;二是从第二只罐子中取出的是一
个黑球,则赢得100美元,你愿意选择哪一个?(受试者的典型
反应同样是没有差别。)这是人们在面临风险时的选择。
根据主观概率理论,有人在做这些选择时赋予红球和黑球
(包括从第一只罐子和第二只罐子中取出的红球和黑球)的主观
概率都是12。但现在又出现了第三道选择题:一是从第一只罐子
中取出的是一个红球,则赢得100美元;二是从第二只罐子中取
出的是一个红球,则赢得100美元,你会如何选择?
一些受试者认为两个选项没有差别,但许多人强烈倾向于选
择第二只罐子,也就是红球和黑球比例已知的那只罐子。如果决
定输赢结果的是黑球,他们同样强烈倾向于选择第二只罐子。这
是人们在不确定性和风险之间做出的选择。
如果你也做出了这样的选择,就不要急着阅读下文,先花一
分钟时间思考一下你的理由是什么。
你的偏好有多强?你愿意押注红球和黑球比例已知的罐子还
是比例未知的罐子呢?受试者对第二只罐子的强烈偏好似乎与预期效用决定偏好的
原则不一致。这表明,他们认为在两种情况下,抽到红球和黑球
的概率都是相等的。而且,概率之和为1。但这样的话,从第一
只罐子抽取小球的期望收益应该和从第二只罐子抽取小球的期望
收益相同。
因此,对埃尔斯伯格问题的常见回答必然至少违背萨维奇的
一条原则,但到底是哪些原则呢?我们可以把范围缩小为有序性
和独立性。如果你想了解埃尔斯伯格的例子到底违背了有序性还
是独立性原则,可以参阅本堂课的附录部分。
如果你在思考这些问题时做出了不同于埃尔斯伯格示例的选
择,你能找出其中的原因吗?有些人总是担心在不确定的情况
下,自己可能会上当受骗。虽然他们不知道自己会如何被骗,但
他们认为自己会被骗。如果你有这种感受,这个问题测试的其实
就不是萨维奇原则。
有些人在不确定的情况下做决策会感到不舒服,但在面对风
险的情况下做决策却没有这种感受。我们有什么理由认为他们不
该如此呢?(还有一些人在不确定的情况下做决策会感到无比激
动,而在面对风险的情况下做决策则没有这么强烈的感受。我们
又有什么理由认为他们不该如此呢?)但是,如果在回答埃尔斯
伯格的问题时有这种心理感受,它们就应该被视为结果的一部
分。如果把它们考虑在内,萨维奇原则就不会有反例了。启发法和偏见
1974年,阿莫斯·特沃斯基和丹尼尔·卡尼曼发表了论文《不
确定情况下的判断:启发法和偏见》(Judgement Under
Uncertainty: Heuristics and Biases),( A. Tversky and D. Kahneman,“Judgment under Uncertainty: Heuristics and Biases,” Science 185 (1974): 1124–31.)对
主观效用理论可能重复产生的偏差进行了详尽的描述。之后,他
们及其他人通过后续研究又发现了更多的偏差。他们认为,这个
领域与心理学的其他领域一样,快速判断都会受到启发法的影
响。这些启发法通常是正确、有效的,但在某些环境中它们会产
生“认知错觉”,致使人们误入歧途。随着时间和精力的投入,以
及对偏见的认知越来越深入,错误是可以修正的:
更透彻地理解这些启发法及其造成的偏见,可能有助于我们
在不确定的情况下做出比较准确的判断和决定。
这篇论文描述了可能导致偏见的三种启发法,即代表性启发
法、可得性启发法以及调整和锚定启发法。根据刻板印象做出的
判断就属于第一种启发法,它具有速度快的特点,准确程度通常
与一个人的刻板印象差不多,但容易导致人们对不一致的证据视
而不见。比如,如果对某个人的描述符合工程师的一般形象,那
么无论我们被告知这个人是从多名工程师和少数几名医生当中随
机挑选的,还是从多名医生和少数几名工程师中随机挑选的,对
我们判断这个人到底是工程师还是医生都没有任何影响。刻板印
象会挤出基本信息,只有进行更仔细的思考,才会用上这些基本
信息。第二种启发法根据一个人可以很容易想到的例子数量来判断
概率,因此会受到记忆力的影响。比如,清晰的记忆有可能使我
们对概率的判断产生偏差。如果新闻报道灌木丛火灾时配有触目
惊心的视频,就有可能让我高估灌木丛火灾的发生概率,即使火
灾发生在澳大利亚。如果你最近遭遇过某个事件(或者有与该事
件相关的遭遇),就有可能高估这类事件的发生概率。恐怖分子
擅长系统地利用这种启发法。
第三种启发法是锚定。我们从一个初始数字(锚)开始,经
过调整后得到最终的估算结果。能对初始数字提供建议的人,也
会影响最终的估算结果。所有的二手车销售员和房地产经纪人都
会利用锚定和调整效应。在东方的集市上,讨价还价已经变成了
一门艺术,锚定效用有时会被发挥到极致。本书的一位作者在世
界各地背包旅行期间,就曾在集市上砍过价。在他把价格砍到要
价的一半并准备付钱时,一个当地的朋友说,“等等,这个价格
太高了”。又经过一番讨价还价,最终成交价格是初始要价的
120。
心理学家知道,由于锚定效应产生的偏差可能会对各种数量
产生影响。特沃斯基与卡尼曼指出,如果对两个事件的初始概率
的调整不充分,就可能会高估合取概率而低估析取概率。
这篇论文也列举了其他例子,此外,卡尼曼还在他的著作
《思考,快与慢》(Thinking, Fast and Slow)中给出了更多的例
子。( D. Kahneman, Thinking Fast and Slow (New York: Farrar, Strauss and Giroux,2011). The two-process view that animates this enjoyable book should be seen as a
deliberate oversimpli-fication, and we recommend that the interested reader also consultthe original papers.)随着证据越来越多,认为主观概率从总体上看近似
于心理学的观点越来越不可信。框架
1984年,卡尼曼与特沃斯基在《美国心理学家》(American
Psychologist)杂志上发表了论文《选择、价值和框架》
(Choices, Values and Frames)( D. Kahneman and A. Tversky, “Choices,Values and Frames,” American Psychologist 39 (1984): 341–50.)。在这里,我们集
中讨论框架。阿莱等人的研究项目直接应用了框架理论,这削弱
了萨维奇原则,并建立了一个描述充分的决策理论。
他们通过下列选择题,证实了框架效应(framing effeets):
框架I
美国正在为一种即将暴发的致命疾病做防范准备。如果不采
取任何行动,预计将会有600人死亡。请在公共卫生项目中做出
选择。
1. 请从下面两个选项中做出选择:
A. 有200人获救。
B. 有13的概率挽救600人的生命;有23的概率无人获救。
2. 请从下面两个选项中做出选择:
A. 有400人死亡。
B. 有13的概率无人死亡;有23的概率死亡600人。卡尼曼与特沃斯基在一项调查中提出了这两个问题。他们发
现,在回答第一个问题时,有接近34的人选择A而非B;在回答
第二个问题时,有接近34的人选择B而非A。但事实上,这两个
问题的A、B选项并无区别,只不过措辞不同。
研究表明,依据措辞而不是依据内容做出选择的框架效应,普遍存在。特沃斯基及其同事发现,医生和病人在做一些攸关生
死的医疗决策时,可能都会尽量小心谨慎,但他们仍然会受到框
架效应的影响。( B. J. McNeil, S. J. Pauker, H. C. Sox Jr., and A. Tversky, “On the
elicitation of Prefer-ences for Alternative Therapies,” New England Journal of Medicine
306 (1982): 1259–62.)这个现象表明,贝叶斯定理的实际应用可以提高
医疗决策的整体水平。这是几名经验丰富的医生开展的一个项
目。( H. C. Sox, M. C. Higgens, and D. K. Owen, Medical Decision Making (New York:
Wiley, 2013).)在第6堂课上,我们将具体介绍贝叶斯定理。
卡尼曼与特沃斯基请受试者选出肺癌的首选治疗方案,但在
表述上他们分别选择了生存率和死亡率这两个不同的角度。
框架Ⅱ
生存率框架
手术治疗:在100个接受手术的人中,术后有90人存活,一
年后有68人存活,5年后有34人存活。
放射治疗:在100个接受放射治疗的人中,治疗后所有人均
可存活,一年后有77人存活,5年后有22人存活。死亡率框架
手术治疗:在100个接受手术的人中,术中及术后有10人死
亡,一年内有32人死亡,5年内有66人死亡。
放射治疗:在100个接受放射治疗的人中,治疗期间无人死
亡,一年内有23人死亡,5年内有78人死亡。
在生存率框架中,有18%的人倾向于选择放射治疗方案;而
在死亡率框架中,有44%的人倾向于选择放射治疗方案。( Amos
Tversky and Daniel Kahneman, “Rational Choice and the Framing of Decisions,” Journal
of Business 59 (1986): S251–78.)
再一次,由于描述方式不同,内容相同的观点得到的评价却
不同。这个现象没有违背独立性原则,也没有违背偏好的可传递
性原则,但它违背了相同的决策问题应该激起相同的偏好的原则
(通常是内隐的),即不变性原则,它是理性决策的规范原则。
我们看到,人类心理学与理性选择渐行渐远。面对阿莱问题
中表现出来的风险厌恶,一些理论家试图放弃独立性原则,以使
他们的理论与可观测的行为一致。面对埃尔斯伯格的问题,一些
理论家主张放弃独立性原则,还有人主张弱化偏好的有序性要
求。有些人认为他们的理论就像心理学一样,是纯粹描述性的;
但也有人认为他们的理论是规范性的。但为了与心理学取得一
致,似乎还有很多工作要做。( 数量庞大且还在不断增加的心理学与行为经
济学实验结果表明,有相当比例的人都有系统地违背几乎所有理论的行为。这些实
验还表明,违背理论的行为可分为几种,所违背的原则也因人而异。有的人甚至追
求期望效用最大化。)特沃斯基与卡尼曼得出的结论是,关于选择的描述性心理学
理论和关于选择的规范性逻辑学理论不是一回事。规范性理论
(逻辑学)是期望效用理论,而充分的描述性理论与规范性理论
之间必然存在系统的可观测的偏差。这并不意味着人们无法学会
及在有需要的时候使用逻辑,我们有足够的时间认真思考。这就
是卡尼曼所谓的“慢思”。
我们认为《波尔–罗亚尔逻辑》(The Port–Royal Logic)最
后一章的观点是正确的。下面这段文字引自这本书的第16章“关
于未来事件我们应该做出的判断”:
为了避恶趋善,我们必须对自己应该做什么加以判断。我们
不仅需要考虑善与恶本身,也要考虑它们发生或不发生的概率,还要直观地考虑它们在整体中所占的比例。
这些考虑可能看似微不足道,如果仅此而已,那么确实如
此。但是,我们可以让它们发挥重要作用,其中最主要的作用就
是让我们更合理地面对希望与恐惧。( The Port Royal Logic, tr. Thomas
Spencer Baynes (edinburgh: James Gordon, 1861): 367–68.)
期望效用理论是一种可以提高思维能力的工具。小结
与其他领域的推理一样,人类在进行概率推理的过程中也经
常犯错误。
有些错误具有系统可重复性,虽然不是人人都会犯这样的错
误,但犯这些错误的人有很多。这些错误包括阿莱的风险厌恶问
题,以及埃尔斯伯格的对已知概率的偏好大于未知概率的问题,卡尼曼和特沃斯基发现的一系列效应将这些问题联系在一起。系
统错误可以通过会产生重要结果的决策(比如医疗决策)的相关
理论训练予以纠正;出于商业或政策原因,系统错误还有可能被
加以应用,比如行为经济学。
某些错误(我们认为它们是错误)违背了理性决策的某个假
设,比如独立性或有序性。但卡尼曼和特沃斯基强调,还有一些
错误事实上违背一致性。对于相同的选择,框架(收益或者损
失)不同,个体的评价结果也不同。
概率心理学和概率逻辑学因此分道扬镳。附录1 埃尔斯伯格:有序性还是独立性?
在埃尔斯伯格的例子中,如果受试者同时遵循有序性和独立
性原则,就不会偏离期望效用。那么,受试者违背的到底是有序
性还是独立性呢?为了回答这个问题,埃尔斯伯格建议我们把第
一只罐子中的小球全部标记为“Ⅰ”,把第二只罐子中的小球全部
标记为“Ⅱ”,之后把所有小球装到一只罐子中。现在,这只罐子
中一共有200个小球,一部分是红Ⅰ,一部分是黑Ⅰ,还有50个
红Ⅱ和50个黑Ⅱ。然后,我们研究一下围绕这只组合罐子设定的
各种赌注的偏好情况。下面介绍的方法是由肯尼斯·阿罗
(Kenneth Arrow)向埃尔斯伯格建议的。
假设有4个赌注,收益情况参见下表。由于赌注Ⅰ和赌注Ⅳ
中收益为a和b的小球各有100个,因此这两个赌注都只涉及风
险,假设对你而言它们没有任何区别。此外,对赌注Ⅱ和赌注Ⅲ
而言,由于我们没有理由认为抽中红Ⅰ与抽中黑Ⅰ的可能性有大
小之分,而且这两个赌注具有相同的不确定性,因此可以假设它
们对你来说没有任何不同。模糊厌恶(ambiguity aversion)表现为对赌注Ⅰ或Ⅳ的偏好
程度高于Ⅱ或Ⅲ,但我们假设你认为Ⅰ和Ⅳ以及Ⅱ和Ⅲ之间没有
任何不同。因此,如果你的偏好具有有序性,而且你有模糊厌恶
心理,你就会偏好Ⅰ和IV而非Ⅱ和Ⅲ。在这种情况下,你违背了
独立性原则。
你对Ⅰ的偏好程度高于Ⅱ。根据独立性原则,你的偏好并非
取决于那些收益相同的情况,而取决于下表中用粗体标示的其他
情况。
同样,你对Ⅳ的偏好程度高于Ⅲ,是因为你的偏好取决于下
表中用粗体标示的情况。
所有的一切都取决于黑Ⅰ和红Ⅱ带来的收益。鉴于此,你对Ⅳ的偏好超过Ⅲ,同时对Ⅰ的偏好超过Ⅱ,从下表可以看出,你
的偏好不具有相关性。附录2 动态一致性与阿莱
假设与阿莱一样,你的偏好也违背了独立性原则,那么你有
可能面临霍华德·雷法于1968年提出的动态一致性问题。( H. Raiffa,Decision Analysis (Reading, MA: Addison Wesley, 1968).)
你应该还记得,在回答问题1时,你对选项A的偏好程度高于
B:
而在回答问题2时,你对选项B的偏好程度高于A:
这就会带来一个问题:如果有人告诉你中奖彩票不在1~89号
之列,那么你倾向于选择哪个选项呢?也就是说,在下面两个选
项中,你倾向于选择哪一个呢?假设你倾向于选A',那么在回答问题2的一个变体时,你就
会遇到麻烦。(如果你倾向于选B',那么在回答问题1的一个变
体时,你同样会遇到麻烦。)
在回答问题2时,你对B的偏好超过对A的偏好,但如有有人
告诉你中奖彩票不在1~89号之列,你的偏好就会颠倒过来,对
A'的偏好将超过对B'的偏好。
假设你拥有问题2的选项A,但你倾向于选B,那么你可能需
要付出一定的代价(e),用A从一位友好的经纪人那里交换B。
随后,中奖彩票是否在1~89号之列的消息被发布出来。如果在,你就会损失e。在这种情况下,那位友好的经纪人提出,他愿意
与你再次交换彩票,但他需要收取一笔较小的费用e'。由于你对
A'的偏好超过对B'的偏好,因此你接受了这笔交易。
就这样,你一共损失了e+e'。你的经纪人利用你的动态不一
致性,从你手中购买资产,再将其出售给你,从中赚取利润。
[如果你认为A'与B'没有任何差异,那么你愿意再次交易,但不
愿意为之付出任何代价。在这种情况下,经纪人为了完成第二次
交易,甚至愿意支付给你e2,即使这样他仍然有收益。]只要违
背了确定事件原则,就有可能遭遇这个案例讨论的情况。第4课 频率与概率之间有什么关系?
雅各布·伯努利早期从事概率研究的人都意识到,在直觉上依赖等可能情况
具有一定的局限性。17世纪的伟大哲学家莱布尼茨对将新的概率
计算方法应用于医疗、法律、商业等实际事务的做法寄予厚望,雅各布·伯努利也抱有同样的想法,因此两个人进行了深入的书信
交流。( See e. D. Sylla, “The emergence of Probability from the Perspective of the
Leibniz– Jacob Bernoulli Correspondence,” Perspectives on Science 6.1 and 2 (1998): 41–
76.)他们决定从频率入手,为概率判断寻找证据。很多务实的人通
常都会采用这种做法。即使在今天,如果你问一位科学工作
者“概率为13”意味着什么,他通常会答道:它意味着如果长时间
地进行相似的实验,在大约13的时间里该事件会发生。本堂课将
讨论这个答案的优缺点。
莱布尼茨和伯努利本人并没有利用频率来确定概率。对他们
来说,概率就是合理置信度的一种表现形式。那么,频率和概率
在形式上到底有什么联系呢?雅各布·伯努利运用大数定律,即我
们本堂课要介绍的关于概率的第4个伟大思想的一个变体,成功
地给出了部分答案。
大数定律确立了概率和频率之间的一个非常重要的联系。伯
努利在《猜度术》里证明的是大数定律的初始形式,即弱大数定
律。( Written about 1689, published posthumously in 1713. english translation by e. D.
Sylla as J. Bernoulli, The Art of Conjecturing, Together with Letter to a Friend on Sets in
Court Tennis (Baltimore: Johns Hopkins University Press, 2006).)后来,波莱尔
(émile Borel)与坎泰利(Francesco Cantelli)通过加强弱大数定
律,提出了强大数定律。不过,强大数定律需要更强大的数学框
架。大数定律这个伟大思想有一个声名狼藉的孪生兄弟。很多科
学家认为,概率就是频率,或者说两者非常接近,进一步研究这
个问题是不值得的。这个观点因为有一个伟大的孪生兄弟而赢得
了很多人的信任。接下来,我们先介绍17世纪的那个伟大思想,然后提醒大家注意它的那个声名狼藉的孪生兄弟,最后探讨20世
纪的频率研究。雅各布·伯努利与弱大数定律
雅各布·伯努利证明了第一个大数定律。通过足够多次的抛硬
币实验,结果为正面朝上的相对频率就有可能无限接近正面朝上
的概率。
伯努利想要确定从罐子中取(取后放回)多少次小球,才可
以保证相对频率落在概率周围特定区间的可能性达到某个程度。
下面,我向大家介绍我举这个例子的目的。假设一只罐子中
装有3 000块白色鹅卵石和2 000块黑色鹅卵石,但你并不知道它
们的数量。你决定通过实验来确定鹅卵石的数量(之比),于是
你不停地从罐子中取出鹅卵石(每次取一块,然后把它放回罐子
中继续做实验,确保罐子中鹅卵石的数量不变),并分别记录取
出白色鹅卵石和黑色鹅卵石的次数。实验的目的是弄清楚在经过
很多次尝试后,取出白色鹅卵石与取出黑色鹅卵石的次数之比正
好是3∶2(即两种鹅卵石的数量之比)的可能性,是否有可能达
到其他情况的十倍、百倍、千倍乃至更多倍(至少达到确有把握
的程度)。
很快,他又采取了一种更加谨慎的说法,宣称这是一个频率
是否会落在某个概率区间内的问题。他说,如果频率等于概率,那么多次重复实验只会让事情适得其反。在这一点上,频率和机
会明显被视为两个截然不同的事物。
考虑到概率、期望区间以及频率落在该期望区间内的很大可能性,伯努利(根据独立性默认假设)推导出了所需实验次数上
的上限,他称之为黄金定理。随后,伯努利又推导出大数定律。
我们知道,伯努利喜欢在实证研究中使用界限这个概念,但
他在这方面做得并不太好,很容易让人联想到大量的实验。《猜
度术》以一个例子结尾。已知概率是35,相对频率的期望区间的
上限和下限分别是2950和3150,频率落在该区间内的期望概率
是1 0001 001。伯努利的界限表明,如果实验次数至少为25 550
次,就可以达到这个期望概率。我们拥有这个量级的数据集,但
在伯努利生活的时代却是遥不可及的。( Stigler suggests that this may be
why Bernoulli did not publish Ars Conjectandi in his lifetime. See S. Stigler, The History
of Statistics: The Measurement of Uncertainty before 1900 (Cambridge, MA: Harvard
University Press, 1990).)伯努利骗局与频率主义
雅各布·伯努利推导黄金定理的目的是根据经验数据确定概
率,因为他深知,通过计数对称性情况的数量来确定概率的做
法,在许多领域是行不通的。……试图通过这种方式来确定概率,显然是非常愚蠢的做
法。然而,我们可以用另一种方法来达成目标。它虽然无法给我
们先验概率,但我们至少可以确定后验概率,也就是说,可以通
过反复观察相似例子的结果来获取概率。这是因为我们应该假
设,之前在类似环境中发生或者未发生的每一种现象,都有可能
在同等数量的情况之中出现或者不出现。
所谓根据频率确定后验概率,指的是在实验次数及成功实验
的相对频率等数据已知的条件下,求概率落在某个区间内的可能
性。显然,伯努利解决的并不是这个问题。他解决的是根据概率
推导频率的问题,而不是根据频率推导概率的反演问题(inverse
problem),后者是由托马斯·贝叶斯解决的。
但是,雅各布·伯努利却认为自己解决了反演问题。为什么
呢?他借助“确有把握”这个概念,含糊地证明自己解决了这个问
题。“确有把握”是指概率非常接近1,以至于人们几乎可以将其
视为确定性事件。伯努利的第9条“一般规则或公理”指出:
然而,由于完全确定很难实现,因此必要的和惯常的做法
是,将确有把握视为绝对确定。(伯努利提出把9991 000的概率视为确有把握的合理性标
准。)
伯努利认为他已经证明,只要实验的次数足够多,相对频率
就确有把握(近似)等于概率。但是,如果频率等于概率,概率
也就等于频率。因此,伯努利进一步认为根据频率推导概率的问
题也得到了解决。这就是伯努利骗局,它其实根本经不住仔细推
敲。条件概率分散在不同方向上,概率的期望区间大小不一,概
率落在期望区间之内的概率也不同。
确切地说,伯努利的条件概率是在概率确定条件下关于频率
的概率,而不是在频率确定条件下关于概率的概率。
它们指的是概率已知时频率落在特定频率区间内的概率,而
不是频率已知时概率落在特定区间内的概率。伯努利给出的是在
某一次实验中概率已知情况下频率落在某个区间内的概率,而不
是频率已知时概率落在某个区间内的合理置信度。
认为大数定律可以解决反演问题的观点是一个谬论,但它有
很强的迷惑性,( 在适当的条件下,它的结论有可能近似正确,但即使这样它也
仍然是一个谬论。想要正确评估这个结论,我们需要先了解贝叶斯的观点(参见第6
课),然后是菲尼蒂的观点(参见第7课)。)尤其是它的非正式表述。而
且,这个谬论非常顽固,如果不进行缜密思考,就很容易轻信
它。我们发现法国数学家、哲学家安东尼·库尔诺(Antoine
Cournot)就掉进了这样的陷阱,( A. A. Cournot, Exposition de la théory des
chances et des probabilités (Paris: Hachett, 1843). See the discussion of the history of this
idea in G. Shafer and V. Vovk, “The Sources of Kol-mogorov’s Grundbegriffe,” Statistical
Science 21 (2006): 70–98.)他认为小概率事件应该被视为不可能发生的事件。他还认为这一原则( ......
献词
前言
第1课 概率是可以测度的
概率测度的开始
帕斯卡和费马
惠更斯
伯努利
小结
附录1 帕斯卡和费马
附录2 抛硬币的物理学原理
附录3 巧合与生日问题
第2课 相关性判断就是概率
部分Ⅰ:赌博与判断概率
部分Ⅱ:效用与判断概率小结
附录1 条件赌注的相关性
附录2 概率运动学
第3课 概率心理学不同于概率逻辑学
启发法和偏见
框架
小结
附录1 埃尔斯伯格:有序性还是独立性?
附录2 动态一致性与阿莱
第4课 频率与概率之间有什么关系?
雅各布·伯努利与弱大数定律
伯努利骗局与频率主义
伯努利骗局与假设检验
频率学派的中坚力量
对理想化方法的再思考
小结第5课 如何用数学方法解决概率问题?
在数学与现实之间Ⅰ
有限集的概率
集合的长度与概率
希尔伯特的第6个问题
柯尔莫哥洛夫的贡献
把概率论视为数学的一个分支
把条件概率视为随机变量
从有限维到无限维
在数学和现实之间Ⅱ
随机选择的整数?数学的旁白
柯尔莫哥洛夫对概率空间的有穷性的看法
小结
附录1 复杂集合的测度
附录2 不可测集
第6课 贝叶斯定理如何改变了世界?贝叶斯vs休谟
贝叶斯的概率研究
反演问题与台球桌
拉普拉斯的玩笑
广义的拉普拉斯定律
相容性
为什么公开发表的研究结果大多是错的?
贝叶斯、伯努利和频率
改变世界
小结
附录 贝叶斯关于概率和统计学的思考
第7课 菲尼蒂定理与可交换概率
菲尼蒂的论著
有限可交换序列
菲尼蒂定理与一般可观测量
菲尼蒂定理与正态分布马尔可夫链
部分可交换性
小结
附录1 遍历理论——菲尼蒂定理的推广
附录2 菲尼蒂可交换定理
第8课 如何用图灵机生成随机序列?
随机数生成器
随机算法理论
可计算性
马丁–洛夫随机序列
随机性的变化
小结
第9课 世界的本质是什么?
玻尔兹曼
概率、频率和遍历性
冯·诺依曼和伯克霍夫的遍历性研究庞加莱
遍历性的层次结构
玻尔兹曼归来
量子力学
非定域性
量子概率归来
量子混沌
小结
附录 量子形而上学:窥视潘多拉的盒子
第10课 如何用概率论解答休谟问题?
休谟
康德
波普尔
归纳怀疑论的不同等级
贝叶斯–拉普拉斯
无知如何量化?概率是否存在?
如果置信度不可交换,会怎么样?
那些用来描述世界的谓词呢?
如何看待不确定性证据呢?
小结
附录 概率辅导课
符号:把事情记录下来
案例:非传递性悖论
基本事实:游戏规则
随机变量和期望
条件期望和鞅
案例:波利亚的罐子
从离散到连续再到更大空间
计算机登场!
致谢献词
谨以此书纪念“钻石吉姆”理查德·杰弗里(Richard
Jeffrey)
他是我们的好朋友和一位真正的哲学家。前言
这本书是由我们在斯坦福大学合作教授了约10年的一门课程
衍生而来的。这是一门大型的混合性课程,听课的人是本科生或
研究生,他们分别来自哲学、统计学和一些交叉学科。随着课程
的不断发展,我们越来越相信它的内容应该可以吸引更多的听
众。学习这门课的一个先决条件,就是接触过一门概率论或统计
学的课程,这本书的读者同样需要满足这个条件。但是,考虑到
某些读者可能是在很久以前学过这类课程,我们在书中以附录的
形式,对概率论进行了一次简要的复习。
这本书涉及的内容包括历史、概率和哲学。我们不仅介绍了
概率论发展过程中的一些伟大思想及其历史,还致力于探索这些
思想的哲学意义。一位阅读过本书初稿的读者抱怨说,读到最
后,他仍然不了解我们关于概率的哲学观点,原因或许是我们过
于中立。这个问题现在已经解决了,你会发现我们是彻头彻尾的
贝叶斯学派,是贝叶斯(Thomas Bayes)、拉普拉斯(Pierre-
Simon Laplace)、拉姆齐(Frank Ramsey)和菲尼蒂(Bruno de
Finetti)的信徒。有人认为贝叶斯学派是与频率学派相对立的,而我们并不否认频率的重要性,或者讨论客观概率的价值。不仅
如此,我们还会在合理的置信度框架内统一考虑这些问题。
在这本书的开头,我们与先驱者一起思考,涉及的工具很简
单。但到了后半部分,我们将回到当下,不可避免地会接触到一
些技术性细节。为了保证行文简洁流畅,我们将把某些细节内容
放到附录中,大家可以根据需要查阅。我们还做了大量注释,以方便读者深入挖掘自己感兴趣的内容。在这本书的最后,我们列
出了一份参考书目。此外,脚注也给出了较为详细的解释。
佩尔西·戴康尼斯
布赖恩·斯科姆斯第1课 概率是可以测度的吉罗拉莫·卡尔达诺(Gerolamo Cardano)
要搞清楚一门学科的本质,认真研究该学科的开创者的想法
是一条可行的路径。事实上,某些基础性哲学问题从一开始就是
显而易见的。关于概率,我们的 第1堂课要介绍的第一个伟大思
想是:概率是可以测度的。这个观点的形成时间是16—17世纪,过程为何如此漫长,这个问题至今仍然是一个谜。希腊神话中有
命运女神堤喀(Tyche);德谟克利特(Democritus)及其追随者
假设,构建宇宙的所有原子都会受到某种物质偶然性的影响;卢
克莱修(Lucretius)在《物性论》(De Rerum Natura)中指出,这种偶然性就是原子的偏离;古埃及人和古巴比伦人学会 了用指
关节骨或骰子玩概率游戏,到了罗马时期,这种游戏流行开来,士兵们通过抽签决定基督斗篷的归属。后来,古希腊学园派怀疑
论者将概率视为人生的指南。( echoed by Cicero in De Natura.)不过,这
些时期似乎都没有出现有关概率的定量理论。( A superb history of early
probability is in James Franklin’s The Science of Conjecture: Ev-idence and Probability
before Pascal (Baltimore: Johns Hopkins University Press, 2002). Franklin examines every
scrap of evidence we have, from the Talmud, early Roman law, and insurance over many
ethnicities. He makes it clear that people had all sorts of thoughts about chance, but not a
single quantitative aspect surfaces.)
想一想,我们是怎么测量东西的?( The same issues come up in
measuring any basic quantity, for example, the weight of the standard kilogram or the
frequency of light. Careful discussion is the domain of measurement theory. For an
extensive discussion, see D. H. Krantz, R. D. Luce, P. Suppes, and A. Tversky,Foundations of Measurement, Vol. I (1971), Vol II (1989), Vol III (1990), (New York:
Academic Press). For an illuminating discussion of how the Bureau of Standards actu-ally
measures the standard kilogram, see D. Freedman, R. Pisani, and R. Purves, Statistics, 4th
ed. (New York: W. W. Norton, 2007).)以长度为例,我们会先找到一个长度标准,然后计数某个东西包含多少个这样的标准长度。比如,在
我们用脚步测量距离时,这个长度标准就是我们的脚。但是,不
同的脚有可能得出不同的测量结果,因此,1522年,有人提议改
进法定路德(杆)的确定方法。如图1–1所示,当人们从教堂鱼
贯而出时,将排成一列的16个人的脚的总长度设定为法定路德。(
For discussion, see S. Stigler, Seven Pillars of Statistical Wisdom (Cambridge, MA: Har-
vard University Press, 2016).)从图1–1可以看出,这些人的脚长度不一,但通过一群人来设定这个长度单位具有明显的平均效应,因此很
多人接受了这个方法。不过,当时似乎还没有人明确提出平均数
这个概念。
图1-1 法定路德的确定我们有必要指出,这个方法存在哲学上的异议。我们的目的
是定义长度,但在用脚长测量距离时,我们已经假定我们采用的
长度标准等长。( This kind of virtuous circularity appears throughout science. For an
illustration in a much richer setting, see George e. Smith, “Closing the Loop: Testing
Newtonian Gravity, Then and Now,” in Newton and Empiricism, ed. Zvi Beiner and eric
Schliesser (Oxford: Ox-ford University Press, 2014): 262–351.)因此,这是一个循
环论证的过程。
任何有头脑的人都不会因为这个异议而放弃用脚长测量距离
的方法。我们的测量活动就始于此,最终建立并完善了长度的概
念。脚的长度因人而异,路德会长短不一,标准米尺的长度在足
够高的精度条件下也会各不相同。借助物理学知识,我们可以不
断改进长度测量方法。因此,这确实是一个循环论证的过程,但
它并不是一个致命的缺陷,反而为我们指明了一条趋于完善的道
路。( 促使等概率这个概念逐步完善的道路是什么?继续阅读这本书,你就会找到
答案。)
概率的测度同样如此。在测度之前,我们先要找到(或者制
造)同等可能性的情况,然后计数这些情况发生的次数。于是,事件A的概率,记作P(A),为
注意,从上式可知:
1. 概率永远不会是负值;2. 如果所有可能发生的情况中均包含事件A,则P(A)=1;
3. 如果事件A和事件B不会同时发生,则P(A或
B)=P(A)+P(B)。
此外,某个事件不会发生的概率等于1与该事件发生概率的
差:
P(非A)=1–P(A)。
这个概念虽然十分简单,但如果运用得巧妙得当,就会产生
令人惊讶的效果。我们以生日问题为例。如果不考虑闰年,并且
假设出生日期的概率均相等,每个人的生日相互独立(即没有双
胞胎),那么房间内的所有人中至少有两个人的生日在同一天的
概率是多少?如果你以前没有见过这个问题,它的答案肯定会让
你大吃一惊。
一群人中有人生日在同一天的概率等于1减去所有人生日均
不相同的概率。第二个人与第一个人的生日不同的概率为
(364365)。如果前两个人的生日不同,那么第三个人的生日与
他们俩都不相同的概率为(363365),以此类推。因此,N个人
中有人生日相同的概率为
如果你对同额赌注感兴趣,就可以利用上述公式,找到使输赢概率趋近12的N的值。当房间里一共有23个人时,生日相同的
概率会略高于12。如果房间里有50个人,这个概率就会接近
97%。
人们经常利用生日问题来考虑一些令人吃惊的巧合情况,因
此生日问题出现了很多变种。比如,两个美国人的生日相同,而
且他们的父亲、祖父和曾祖父生日相同的可能性大到令人吃惊的
程度。为帮助大家应对这些问题,本堂课内容的附录部分给出了
一些有用的近似值。最后,本书在结尾部分又利用这些近似值,证明了菲尼蒂定理。现在,大家只要知道“等可能情况”这个基本
结构应用广泛和深入就可以了。概率测度的开始
创建等概率情况,最有效的方法莫过于抛掷质地均匀的骰
子,或者从洗好的一副牌中抽取扑克牌。概率的测度就是从这里
开始的。我们不知道首创者是谁,但数学家、医生、占星家吉罗
拉莫·卡尔达诺早在16世纪研究赌博游戏时就明明白白地提到过这
个概念。( Written about 1564 but published only posthumously. See O. Ore, Cardano,the Gambling Scholar (Princeton: Princeton University Press, 1953), for translation and
commentary.)卡尔达诺有时以赌博为生,因此他对等概率假设非常敏
感。此外,他对动过手脚的骰子以及其他作弊手法都了如指
掌:“……骰子有时并不诚实,可能是因为它被打磨过,也可能
是因为它被削扁了(这很容易被人看穿),还可能是因为相对应
的两面受到挤压而变得扁平了……牌类游戏的作弊手段更是层出
不穷。”( Our chapter 7. There are a lot of connections between the early gambling
literature and the foundations of probability. See D. Bellhouse, “The Role of Roguery in
the History of Probability,” Statistical Science 8 (1993): 410–20.)
17世纪早期,伽利略(Galileo)给他的赞助人托斯卡纳大公
爵写了一封简短的信,回答了后者提出的一个关于骰子的问题。
公爵认为,通过计算可能情况得出的答案似乎是错误的。投掷三
枚骰子时,得到10点和11点的数字组合方式各有6种,9点和12点
同样如此。“……但是,众所周知,骰子玩家通过长期观察发
现,掷出10点和11点的可能性比9点和12点的可能性更大。”( 这个
问题的表述有一个奇怪的地方,那就是对长期观察这个表达的解释。观察必须持续
进行很长时间。根据伽利略的计算,得到9点的概率是25216,约等于0.116;得到10
点的概率是27216,约等于0.125。两者相差0.009,约等于1100。大家可以计算一下
需要观察的次数,当作一次练习。)这是怎么一回事呢?伽利略答道,他的赞助人在计算得到9点和10点的可能情况
时,把三个3点计作一种可能,把两个3点和一个4点也计作一种
可能,这种方法是错误的。伽利略指出,后者涵盖了三种可能的
组合,它们彼此之间的不同点就在于是哪枚骰子掷出了4点。
<4, 3, 3>,<3, 4, 3>,<3, 3, 4>。
前者的确只有一种可能,即<3, 3, 3>。伽利略完全掌握了排
列组合的相关知识,似乎并没有觉得这是什么新鲜事物。
在构建等概率情况时,伽利略和卡尔达诺似乎都隐晦地使用
了独立性这个概念。他们认为,对于每一枚骰子,抛掷后得到6
个面中的每一个的概率都相等,在抛掷三枚骰子时,得到216个
可能结果中的每一个的概率也相等。在解决生日问题时,我们假
设所有人的生日都具有独立性。
帕斯卡(Pascal)和费马(Fermat)充分理解了这个基本体
系。众所周知,他们通过书信往来,解决了几个更加微妙且在概
念上又各具特色的问题。帕斯卡和费马
帕斯卡和费马于1654年开始的一系列书信往来,似乎标志着
概率论这个数学分支第一次开启了实质性研究。本书详细介绍这
件事,有三个原因:第一,这是一次史无前例的研究;第二,它
告诉我们,借助等可能情况,某些看似复杂的问题有可能被简化
为直截了当的计算;第三,它引入了期望值这个重要概念,期望
值是概率论这门学科的主要支柱之一。
帕斯卡和费马解决的这些问题,在概念特色上不同于卡尔达
诺和伽利略解决的那些问题。帕斯卡和费马对公平性进行了定
义,还对期望值进行了重点研究。
其中有两个问题是帕斯卡的赌友梅内骑士(Chevalier de
Méré)提出来的。帕斯卡把这两个问题连同他自己的想法,都通
过书信告诉了费马。他们俩是通过梅森学院建立联系的,自从梅
森(Marin Mersenne)神父于1635年创建了这家学院之后,包括
伽利略、笛卡儿(Descartes)和莱布尼茨(Leibniz)在内的杰出
数学家、科学家和哲学家都在这里分享过研究成果。
骰子问题:一名玩家需要在8次抛掷骰子的赌局中掷出一个6
点。此时,投注金额已经确定,这名玩家已经抛掷了3次,但没
有一次是6点。如果从赌注中拿出一定比例的钱给这名玩家,让
他放弃第4次的抛掷机会(仅放弃这一次),那么给他多少钱才
算公平?( 在继续阅读之前,大家可以先考虑一个问题。假设在赌局开始之前,双方约定在8次抛掷中率先掷出6点的玩家可以拿走桌上的10美元,那么给你5美元,让你放弃第4次投掷机会,你愿意接受吗?这是否公平?)点数问题:两名水平相当( 我们可以假设他们抛掷的是一枚质地均匀的
硬币。)的玩家正在进行一场多局赌博。每赢一局就可以得到一
点。他们一致同意,第一个达到特定点数的玩家获胜,并赢得全
部赌注。在进行了若干轮之后,赌局被打断了。此时,如何分配
赌注才算公平合理呢?
这两个问题都是围绕公平性阐述的。但是,概率论中的公平
性到底指什么呢?我们将会看到,帕斯卡和费马隐晦地利用期望
值的概念回答这个问题。
对赌注为V(x)、结果为x的赌局而言,期望值就是概率的加权
平均:
期望值(V)=V(x1) p(x1)+V(x2) p(x2)+…
如果玩家对交易的期望值保持不变,就可以视其为公平交
易,比如,抛掷质地均匀的硬币。如果是正面朝上,你赢1,反
之,你输1。那么,期望值为(+1)(12)+(–1)(12)=0。
我们把这个概念应用到骰子问题上。桌上的赌注没有变化,仍然是s。如果该玩家不放弃第4次抛掷的机会,那么他一共还有
5次机会。他的期望值为① 在余下的4次机会中赢1次的概率=1– P(4轮全输)=1–
(56)4。
费马在信中建议玩家拿走16的赌注,然后放弃第4次抛掷的
机会。( See appendix 1.)在这种情况下,他的期望值是
可以看出,两者相同,因此用16的赌注作为玩家放弃第4次
抛掷机会的收益是公平的。( Fermat sees this clearly, but Pascal seems to have
either made a mistake or misidenti-fied the problem. See appendix 1.)
点数问题也是一个期望值问题,曾让许多以前的思想家束手
无策。1494年,修道士卢卡·帕乔利(Luca Pacioli)考虑过一个点
数问题:在一场只要得到6点即可获胜的赌局中,一名玩家已经
得到了5点,另一名玩家得到了3点。也许是受到亚里士多德
(Aristotle)的分配正义思想的影响,帕乔利认为按照两个玩家
分别赢得的点数之比(5∶3)进行分配是公平的做法。大约50年
后,塔尔塔利亚(Tartaglia)提出了反对意见,理由是:根据这
条规则,如果游戏在一轮之后停止,那么其中一名玩家就会得到
全部赌注。赢得赌局所需的点数越多,这样的结果就越令人难以
接受。塔尔塔利亚试图修改帕乔利的规则,以便将这种情况考虑
进去,但最后他怀疑这个问题可能根本没有确定的答案。这个问
题也让包括卡尔达诺和梅内骑士在内的所有人绞尽脑汁,困惑不已。
这时候,费马提出了一个至关重要的见解。假设两名玩家距
离赢得赌局分别还差r点和s点,那么赌局肯定会在r+s–1轮内结
束。赌局可能会提前结束,但是由于每轮的胜负率是确定的,所
以我们不妨考虑一下所有r+s–1轮投掷的结果。这样一来,整个问
题就简化为一个关于等概率情况的问题,通过计数就可以算出概
率。
在帕乔利问题中,玩家1有5点,玩家2有3点,只要他们中的
任何一个得到6点,赌局就会结束。因此,赌局最多还可以进行3
轮,共有8种等概率情况。玩家2只有赢得接下来的3轮,才会获
胜,他的期望值是总赌注的18,而玩家1的期望值是78。因此,公平的方案是按照这两个期望值之比来分配赌注。
通过统计等概率情况计算期望值,可以解决这类问题。但
是,等概率情况有时会因为数目过大而难以统计。不妨考虑一下
塔尔塔利亚举的例子。赢得6点即可获胜,一名玩家没有得分,另一名已有1点在手。因此,赌局最多还可以进行10轮。把所有1
024种可能的结果全部写出来,是一件单调乏味的事。不过,帕
斯卡有一种更好的统计方法。
要统计玩家1获胜的情况,我们可以分别统计他在10轮投掷
中赢得6次的情况(10选6),在10轮投掷中赢得7次的情况(10
选7)……在10轮投掷中赢得10次的情况(10选10),然后将统
计结果相加。如图1–2所示,利用帕斯卡三角形[也叫塔尔塔利
亚三角形、奥马尔·海亚姆(Omar Khayyam)三角形( Known in Indiasince the second century BCe. For more of the history, see A. edwards, Pascal’s
Arithmetical Triangle: The Story of a Mathematical Idea (Baltimore: Johns Hopkins Uni-
versity Press, 2002).)],我们可以很方便地在第10行找到这些数字。
这一行告诉我们,从一组10个对象中选取若干个会有多少种不同
的方案。从左至右依次可以看到,选取0个对象有1种选择方案,选取1个对象有10种选择方案,选取2个对象有45种方案,选取3
个对象有120种方案,一直到最右端,选取10个对象有1种选择方
案。
我们需要求出10轮6赢+10轮7赢+…+10轮10赢的总和。利用
帕斯卡三角形的第10行,可以算出
210+120+45+10+1=386
该玩家的最终获胜概率为 (约等于38%)。
因此,公平分配方案是玩家1(之前没有得分)获得赌注的
3861 024,玩家2则获得剩余赌注。
在帕斯卡和费马之后,统计等概率情况和利用组合原理及期
望值来计算概率,就成了众所周知的概率测度的基本方法。图1-2 帕斯卡三角形惠更斯
帕斯卡与费马在书信中讨论的这些内容传到了克里斯蒂安·惠
更斯(Christiaan Huygens)( For more on Huygens, see S. Stigler, “Chance Is
350 Years Old,” Chance 20 (2007): 33–36.)的耳朵中。当时,这位伟大的荷
兰科学家正在巴黎访问。他不仅接受并拓展了书信中传递的那些
思想,之后还解决了那几个问题,并于1656年出版了关于这些问
题的第一部著作。1692年,约翰·阿布斯诺特(John Arbuthnot)
把它翻译成英文版,书名就叫《机遇的规律》(Of the Laws of
Chance)( Isaac Newton had a copy and made notes, which can be found in D. T.
Whiteside, ed., The Mathematical Papers of Isaac Newton, Volume 1 (Cambridge:
Cambridge University Press, 1967). Thanks to Stephen Stigler for the reference.)。
在这本书的开头,惠更斯提出了一条基本原理:
公设
下列命题构建于这样的公理之下:赢得任何东西的概率或期
望值,都与在公平赌局中获胜的概率或期望值一样,可以通过求
和的方式计算出来。比如,某个人的左手和右手分别握有3先令
和7先令。他让我在不知情的情况下选择一只手,然后他会把那
只手握着的钱送给我。我认为,这相当于他送给我5先令,这是
因为在公平的条件下,我获得5先令与赢得3先令或7先令的概率
或期望值是一样的。
惠更斯认为,他其实可以通过抛质地均匀的硬币的方法来决
定选择哪只手。( 多年以后,霍华德·雷法(Howard Raiffa)在解决所谓的“埃尔斯伯格悖论”(Ellsberg Paradox)时也提出了类似的观点。我们在第3课讨论有关概
率的心理学时将介绍这个悖论。)12×3+12×7=5,因此他说,赌注的价
值和得到5先令的价值是一样的。于是,他明确地(通过一个特
例)提出了帕斯卡与费马书信中隐含的一条原理:期望值是测算
价值的正确方法。
接着,他从公平性的角度论证了这种测算方法的合理性。假
设我用一枚质地均匀的硬币与某人打赌,赌注是10先令。由于对
称性,所以这个赌局是公平的。现在,假设我们一致同意修改赌
局,无论谁赢,都要分给输家3先令。这种做法不会破坏对称
性,所以修改后的赌局协议仍然是公平的。但现在输家拿到了赌
注中的3先令,赢家还剩7先令。诸如此类的协议都会保持公平
性,包括赢家分5先令给输家,最后双方各有5先令的协议。接
着,惠更斯表明这种论证方法还可以推广至任意有限数量的结果
和概率为任意合理值的结果。所以,利用对称性来证明等概率情
况的做法将在本书中反复出现。
牛顿追随者的想法
阿布斯诺特是牛顿的追随者,( Incidentally, Newton, one of the great
mathematicians of all time, had poor proba-bilistic skills. See S. Stigler, “Issac Newton as a
Probabilist,” Statistical Science 21 (2004): 400–403.)他在惠更斯著作的英译本
的序言中发表了一句值得我们注意的评论:
在力量和方向都确定的情况下,骰子落下后朝上的一面也是
确定的,只不过我不知道什么样的力量和方向,才能使我想要的
那一面朝上。因此,我称之为概率,意思是技能的缺乏。通过这段文字,阿布斯诺特引入了在确定的环境中如何正确
认识概率的问题。他给出的答案是:概率是人类无知的产物。
以抛一次硬币为例。用拇指弹击硬币,硬币在空中翻转,随
后被抓在手心里。很明显,如果拇指用同样的力量弹击硬币相同
的部位,硬币落下后朝上的面也会保持不变。所以,抛硬币是一
种有规律可循的物理现象,而不是随机的!为了证明这一点,我
们请物理系为我们制造了一台抛硬币机。如图1–3所示,在弹簧
被松开之后,停留在弹簧上的硬币一边翻转,一边弹起,然后落
在一只杯子里。因为弹簧的力量是受控的,所以硬币落下后总是
同一面朝上。这个结果令人发自内心地感到不安(本书的两名作
者也不例外),魔术师和不诚实的赌徒(包括本书的一位作者)
都具有这样的技能。
那么,为什么认为抛硬币具有随机性的观点如此普及,并取
得了巨大成功呢?庞加莱(Poincaré)给出了基本回答。如果将
硬币用力弹起,使之有足够的垂直速度和角速度,硬币就会对初
始条件产生敏感的依赖性。初始条件的一点儿不确定性将会被放
大,使结果具有很大的不确定性,以至于在一定程度上,我们可
以假设结果具有等概率,但这必须满足一些重要的限制性条件。
关于这一点,请参阅本章的附录2。我们将在第9课详细讨论这个
问题。图1-3 可以确定结果的抛硬币机伯努利
1713年,在雅各布·伯努利(Jacob Bernoulli)去世8年后,他
的《猜度术》(Ars Conjectandi)( Translated with extensive commentary by
edith Dudley Sylla as The Art of Conjectur-ing, Together with a Letter to a Friend on Sets
in Court Tennis (Baltimore: Johns Hopkins Univer-sity Press, 2006).)终于出版。在
这本书中,伯努利阐明了前辈们的做法。全书的第一部分引述并
评论了惠更斯的成果。一个事件的概率被明确地定义为发生该事
件的(等概率)情况数量与(等概率)情况总数之比。比如,从
一副扑克牌(不含大小王)中抽出一张梅花牌的概率是1352。此
外,伯努利还将条件概率(conditional probability),即第二个事
件B在第一个事件A已经发生的条件下的发生概率,定义为两个事
件均发生的情况数量与发生第一个事件的情况数量之比:
如果抽到的是一张梅花牌,那么这张牌是Q的概率为113。
在这些定义的基础上,伯努利指出互斥事件的概率可以相
加,以及概率满足乘法法则,即P(A∩B)=P(A)P(BA)。这些简单
的法则构成了所有概率计算的核心。
不过,伯努利的主要贡献是把概率和频率紧密地联系在一
起,并称为他的黄金定理。在此以前,人们只是猜测这两者之间
存在联系。伯努利举了一个例子。假设一只罐子中装有3 000块白色鹅卵
石和2 000块黑色鹅卵石,从罐子中抓取鹅卵石的行为相互独立,而且每次取出一块鹅卵石后会向罐子中补充一块同色的鹅卵石。
那么,在抓取鹅卵石的行为进行了一定的次数之后,我们是
否“确有把握”(moral certainty)使取出的白色鹅卵石与黑色鹅卵
石的数量之比接近3∶2?如果确有把握,这个抓取次数到底是多
少?伯努利选定了一个高概率作为“确有把握”的衡量标准,并确
定了所需的抓取次数。然后,他阐明了弱大数定律:
对于概率(在本例中等于35)周围尽可能小的任意区间,以
及无限接近确定值1 –e的近似值,都存在数N,使N次尝试中取出
白色鹅卵石的相对频率落在该区间的概率至少是1–e。
我们在后文中讨论频率时会详细阐述这个定律。小结
就像长度一样,概率也是可以测量的。我们将事情划分成等
可能情况,计数这些情况发生的次数,再除以可能情况的总数,即可计算出概率。这个定义满足以下条件:
1. 概率是一个0到1之间的数。
2. 如果A不可能发生,则P(A)=0。如果A在所有情况下都
会发生,则P(A)=1。
3. 如果A和B不可能在同一种情况下发生,则P(A∪B)=P(A)+P(B)。
4. 在A发生条件下B的发生概率等于B与A同时发生的情
况数量除以A发生的情况数量,即P(A∩B)=P(A)P(B|A)。如果
A和B相互独立,即P(B|A)等于P(B),则P(A∩B)=P(A)P(B)。
在发现并统计可能情况数量的过程中,人们遇到了一些数学
问题,比如复杂赌局的获胜概率、生日问题等。
期望值可以根据各种结果出现的概率来衡量它们的成本与收
益情况,这不仅有助于计算,还是公平性和价值的衡量方法。
大数定律(我们将在第4堂课和第6堂课继续讨论)表明,在
多次独立尝试中,我们可以通过频率求出次数的近似值(高概
率)。本堂课的内容一共有三个附录,分别介绍了帕斯卡和费马的
通信往来,抛硬币的物理学发展历程,以及深入分析概率数学与
现实世界中发生的偶然事件之间的联系。(本书最后单列出一个
附录,以满足读者复习相关知识的需要。)附录1 帕斯卡和费马
骰子问题
帕斯卡写给费马的第一封信已经遗失,但可以肯定的是,骰
子问题就是在这封信中提出来的。
费马在回信中指出,帕斯卡犯了一个错误:
假设我需要用一枚骰子在8轮投掷中得到某个点数才算赢。
下注后,如果我们一致同意我放弃第一轮投掷机会,那么根据我
的理论,作为对我放弃第一轮投掷机会的补偿,我拿走全部赌注
的16才算公平合理。
之后,如果我们一致同意我放弃第二轮投掷机会,那么我拿
走剩余赌注的16,也就是全部赌注的536,才算公平合理。
之后,如果我们一致同意我放弃第三轮投掷机会,那么作为
对我的补偿,我拿走剩余赌注的16,也就是全部赌注的25216,才算公平合理。
之后,如果我们一致同意我放弃第4轮投掷机会,那么我拿
走剩余赌注的16,也就是全部赌注的1251 296,才算公平合理。
你认为,如果玩家完成了前面三轮的投掷,这就是第4轮投掷机
会的价值。我认同你的观点。
下面是你在信中举出的最后一个例子,我完整地引述如下条件:我需要在8轮投掷中得到6点。我已经投掷了三次,但都没有
成功。这时候,我的对手建议我放弃第4轮投掷机会,并且为公
平起见,我可以拿走全部赌注的1251 296。你认为这样做是合理
的。
但是,根据我的理论,这是不公平的。因为在这种情况下,手持骰子的玩家在前三轮投掷中一无所获,总赌注分文未少。如
果他同意放弃第4轮投掷机会,作为补偿,他应该拿走全部赌注
的16。如果他第4次投掷仍没有成功,那么在双方一致同意他放
弃第5轮投掷机会的情况下,他依然应该分得全部赌注的16。既
然赌注总额一直没有变化,那么无论从理论上看,还是根据常
识,每次投掷机会都应该具有相同的价值。
很明显,这里的核心问题是期望值。如果放弃某一轮的投掷
机会并拿走一部分赌注,不会改变赌局的期望值,这种做法就是
公平的。
费马清楚地看到,任意一轮赌局的分析结果都是一样的。假
设某轮投掷结束后,还剩下n+1轮投掷机会,此时的赌注价值为
1。那么,选择参与赌局并在此轮获胜的期望值是16,而此轮失
败但最终仍有可能获胜的期望值是 。拿走
16的赌注后,用剩余赌注继续赌局的期望值是:到手的现金(数
额为16),再加上最终获胜的概率 与剩余赌注(数额为56)的乘积。费马的分析立刻得到了帕斯卡的认同。
点数问题
帕斯卡讨论的另一个问题也很有趣。他以一个赌局为例,两
个玩家各押注32枚金币,率先赢得三点的玩家获胜。
我们假设第一个玩家得到两点,另一个玩家得到一点。在接
下来的一轮赌局中,如果第一个玩家获胜,他就会赢得全部赌
注,即64枚金币。如果第二个玩家获胜,他们的点数之比就是
2∶2,此时终止赌局的话,他们各自拿回自己的赌注(32枚金
币)就可以了。
费马先生,请考虑下面这种情况。如果第一个玩家获胜,64
枚金币就会归他一人所有。如果他输了,则可以得到32枚金币。
此时他们终止赌局的话,第一个玩家就会说:“我肯定可以得到
32枚金币,因为即使我输了,我也会得到这么多金币。至于另外
32枚金币,也许会归我所有,也许会归你所有,风险均等。因
此,我们可以平分这32枚金币。但是,另外32枚金币肯定归我所
有。”这样一来,他将得到48枚金币,而另一名玩家则得到16枚
金币。
这不仅是在计算期望值,还以任何人都无法辩驳的方式证明
了这种分配方案的公平性。你确定拥有的部分,就归你所有;对
不确定的部分,在概率相等时则双方平分。这是对修道士帕乔利
的疑问的明确解答。
接着,帕斯卡表明这个推理过程还可以迭代:现在,我们假设第一个玩家得到两点,另一个玩家一无所
获。接下来,他们将争夺第三轮的胜利。如果第一个玩家获胜,那么他将赢得所有赌注,即64枚金币。如果第二个玩家获胜,赌
局就会回到前文讨论过的情况,即第一个玩家有两点,第二个玩
家有一点。
我们已经证明,在这种情况下,48枚金币将归那个赢得两点
的玩家所有。此时,他们终止赌局的话,这个玩家就会说:“如
果我赢了,我将获得64枚金币。如果我输了,我也会理所当然地
得到48枚金币。因此,先将确定归我所有的48枚金币给我,因为
即使我输了,这些金币也是我的;然后我们再平分剩余的16枚金
币,因为我们得到这些金币的概率均等。”也就是说,他将得到
56(48+8)枚金币。
现在,我们假设第一个玩家得到一点,第二个玩家一无所
获。瞧,费马先生,如果他们开始第二轮,就会出现两种可能的
结果。如果第一个玩家获胜,他就会拥有两点,而对手仍然一无
所获。根据前文讨论的结果,他将得到56枚金币。如果第一个玩
家输了,他们的点数之比就是1∶1,他将得到32枚金币。因此,这名玩家肯定会说:“如果此时终止赌局,就先从56枚金币中把
我肯定会得到的那32枚金币给我,然后我们再平分剩下的金币。
从56枚金币中拿走32枚,还剩24枚。我们平分之后,各得12枚。
12枚加上之前的32枚,我应该得到44枚金币。”
这是公平分配的一个递归过程。接着,帕斯卡又分析了点数
要求较高的赌局,并给出了这个问题的一般解。附录2 抛硬币的物理学原理
从罐子中取鹅卵石、抛硬币、掷骰子和洗牌都是基本的概率
模型,那么,这些模型与现实世界中的相应活动有什么关系呢?
这些基本模型还经常被应用于复杂得多的环境,计算事件发生的
概率。比如,伯努利就曾利用这类模型,对两名网球选手连续得
分的情况进行了研究;托马斯·吉洛维奇(Thomas Gilovitch)、阿莫斯·特沃斯基(Amos Tversky)和罗伯特·瓦隆(Robert
Vallone)( T. Gilovitch, R. Vallone, and A. Tversky, “The Hot Hand in Basketball: On
the Misper-ception of Random,” Cognitive Psychology 17 (1985): 295–314.)则利用它
们来研究篮球运动员的“热手效应”。但问题是,这些研究难道不
应该兼顾物理学和心理学两个方面吗?
上面提到的这些例子都有据可考。我们先来看单次抛硬币的
情况,以便让大家有一个初步认识。然后,我们因势利导去分析
其他例子。
让我们看一下抛硬币的物理学原理。( Joseph Keller, “The Probability
of Heads,” American Mathematical Monthly 93 (1986): 191–97.)当硬币从手上弹起
时,它有一个向上的初速度v(英尺秒)和一个翻转速度ω(转
秒)。牛顿告诉我们,如果v和ω已知,那么硬币下落需要的时间
以及落下后是正面还是反面朝上都是确定的。模型中硬币的相空
间如图1–4所示。
单次抛硬币相当于这个平面上的一个点。考虑图1–4中的这
个点。它的初速度很快(因此,硬币的上升速度很快),但翻转速度很慢。因此,被抛起的硬币就像手抛比萨一样,几乎不会翻
转。同理,v小、ω大的点的翻转速度很快,但由于被抛起的高度
不够,也可能连一次翻转都无法完成。因此,如果初始状态的硬
币位于靠近两条坐标轴的区域,它就不可能翻转。
图1-4 单次抛硬币的v-ω平面
邻近这个区域的依次是硬币翻转一次的区域、硬币翻转两次
的区域,依此类推。完整的图形如图1–5所示。图1-5 双曲线使得部分相空间变得泾渭分明。阴影区域对应的是使硬币正面朝
上的初始状态,空白区域对应的是使硬币反面朝上的初始状态。翻转速度的单位是
转秒
认真观察图1–5(并运用一些简单的数学知识),就会发现
图中远离0的区域彼此逐渐靠近。因此,初始状态的小变化会带
来正面朝上或反面朝上的不同结果。
要做进一步分析,就必须知道下面这个问题的答案:当真实
世界的人抛真正的硬币时,与之对应的点在图中的哪个位置?我
们做了一些实验,结果发现一次正常的抛硬币大约需要12秒,硬
币的翻转速度大约为40转秒。根据图1–5中的单位,初始速度的值大约是15,非常接近零;而翻滚速度ω为40个单位,远远超出
了该图的范围。根据该图的数学含义,我们知道这些区域彼此接
近的程度。再结合我们做的实验,可以看出:抛硬币的公平程度
可以精确到小数点后两位,但不能精确到小数点后三位。
上面分析的是一种简单模型的情况,它假设硬币将沿着一条
穿过其自身的轴翻转。事实上,真实硬币的情况要复杂得多,是
一种独特的进动。论文《抛硬币的动态偏差》(Dynamical Bias
in the Coin Toss)( P. Diaconis, S. Holmes, and R. Montgomery, “Dynamical Bias in
the Coin Toss,” Siam Review 49 (2007): 211–35.)在设定大量的附加条件并参
考大量文献资料的基础上,对硬币的运动方式进行了全面细致的
分析。分析结果表明,大力抛掷普通硬币会有微小的偏差,开始
时朝上的那一面在落下后仍然朝上的概率大约是0.51。
这些分析给了我们什么启示呢?标准模型可以非常近似地模
拟真实情况。要想探测出0.50和0.51之间的差异(也就是说,要
精确到小数点后两位),我们需要用标准模型进行大约25万次抛
掷。我们希望标准模型的其他一些实例同样有效。伽利略的骰子
与抛硬币的情况类似,而轮盘赌和洗牌则是另一种情况!( D. Bayer
and P. Diaconis, “Tracking the Dovetail Shuffle to Its Lair,” Annals of Applied Probability
2 (1992): 294–313.)
对简单的抛硬币进行诚实分析竟然会让我们陷入如此复杂的
局面,那么,按照莱布尼茨和伯努利的设想,对需要技巧的游戏
进行概率分析,或者将概率应用于医学和法律领域,情况会不会
更加复杂呢?伯努利非常赞同下面这个观点:
请问,人世间疾病的种类如此繁多,可以在任何年龄侵袭人体的无数部位,或者预示死亡即将降临,那么,这些疾病的数量
到底是由什么人决定的?谁可以决定哪种疾病(比如,是瘟疫还
是水肿,或者是水肿还是发热)更容易杀死我们呢?谁又能在此
基础上预测未来的生死呢?同样地,谁可以计数空气每天发生的
数不胜数的变化,并在此基础上预测出它一个月(甚至一年)后
的成分呢?
又或者,谁可以充分洞见人类思想的本质或者人体的奇妙结
构,从而敢于在赌博结果完全或部分取决于玩家的机敏度的游戏
中,确定到底哪一位玩家将会胜出呢?在这些以及类似的情况
下,最后的结果可能是由一些完全隐藏的原因决定的,这些原因
还可以通过无数种方式组合到一起,足以抹杀我们的所有努力。
因此,试图以这种方式预测未来的情况,显而易见是疯狂之举。(
Quoted from the translation of Sylla, 327.)
伯努利认为他的大数定律可以回答这些问题,在接下来的几
堂课中,我们将对他的答案是否恰当做出评估,并讨论另外几个
可能的答案。附录3 巧合与生日问题
我们每个人都会遇到巧合,在这种情况下,我们应该感到惊
讶还是担心呢?简单的生日问题(及其变体)已经变成了一个有
效的工具,可用作人们的惊讶程度的测量标准。如果23人中出现
有人生日相同的情况,大多数人都会感到惊讶,但本堂课开头介
绍的简单计算告诉我们,根本不需要为此感到惊讶。现在,我们
把这个计算方法抽象化,并做进一步延伸。
我们来看一下“手表”问题。最近,有秒针的老式手表变成了
一种时尚。我们认为,秒针的位置是“随机的”,即所有秒针完全
不同步,指向1到60秒的可能性完全相等。假设有N个人,每个人
都戴着一只有秒针的手表。那么,有两个或两个以上人的手表秒
针正好指向同一位置的概率是多少?
这是包含60个类别的生日问题,而最初的生日问题有365个
类别。抽象化之后,考虑类别数量C(在手表问题中,C=60,而
在生日问题中,C=365)。一共有N个人,他们彼此独立,并均
匀分布在 {1, 2, 3, …, C} 中。这些数字各不相同的概率是多少?
当然,这取决于C和N的值;如果N=C+1,概率就是0。
我们把这个概率叫作P(C, N)。根据前面的分析,P(C, N)=这个公式简单明了,在C和N的值确定之后,我们就可以用袖
珍计算器算出精确的答案。
但这对我们理解这个问题并没有多大的帮助。为方便以后应
用,我们可以通过一个简单的近似公式来计算。研究表明,当N=1.2 时,概率接近12。对手表问题而言,1.2
=9.3,所以,一场比赛至少有10个人赔率相同。但在直觉上,这
似乎是一个惊人的巧合。(对最初的生日问题而言,1.2
=22.9。)
我们用命题的形式来表述这个近似公式。
命题:如果有N个人和C种可能性,且N和C很大,则不匹配
的概率为
P(C, N) ~ e–N(N – 1)2C。
证明:在证明过程中,我们需要使用对数的一个简单属性,即当x很小的时候,log(1–x) ~ –x。那么当N和C较大时,N23>C非常小,计算所得的近似值是精确
的。
在本书作者之一佩尔西·戴康尼斯(Persi Diaconis)和弗雷德
里克·莫斯特勒(Frederick Mosteller)( P. Diaconis and F. Mosteller,“Methods for Studying Coincidences,” Journal of the American Statistical Association 84
(1989): 853–61.)的巧合现象研究中,生日问题应用得更多。他们还运
用这些想法,研究多重巧合的情况。比如,要使三个人的生日相
同的概率达到12,N应该多大?(答案是:约81个人)。
有人试图利用巧合现象大做文章,但我们反其道而行,提供
了一种简单的概率模型,供大家比较鉴别。该模型可用于研究教
室中的生日匹配现象,而且研究结果真实可信。但是,有的读者
可能会用它来研究高级餐厅里的人群。由于人们经常在生日当天
被邀请去餐厅就餐,所以在某个晚上出现多个生日匹配现象的可
能性非常高。这样一来,我们这个概率模型的假设条件就不成
立,所以它无法得出正确的结论。这个警示适用于本章中提到的
所有简单概率模型,更多内容详细见戴康尼斯和苏珊·霍姆斯
(Susan Holmes)2002年发表的论文。( P. Diaconis and S. Holmes, “ABayesian Peek into Feller, Volume I,” Sankhya 64 (2002): 820–41.)第2课 相关性判断就是概率弗兰克·拉姆齐
我们的第2堂课要讨论的第二个关于概率的伟大思想是:判
断是可以测度的,而具有相关性的判断就是概率。(下文将告诉
大家相关性的确切含义。)在第1堂课讨论的经典赌博游戏中,我们是根据对称性做出判断的。我们认为,对称的情况发生的可
能性相等。在这一课中,我们将看到关于各种可能情况的判断中
隐含的置信度也是可以测度的。在用本堂课介绍的方法测量这些
置信度时,我们还将发现,具有相关性的判断同样具有卡尔达诺
和伽利略在计数等可能结果时发现的那种数学结构。
我们如何估量下一年金融危机发生的可能性,采用某种治疗
方案后病人可以存活下来的可能性,以及被告有罪的可能性呢?
如何估量某位候选人在选举中获胜的可能性,发生大萧条的可能
性,以及某种草率的政治行为引发战争的可能性呢?在直觉上,我们不可能像在公平的骰子游戏中那样,通过计数等可能情况的
数量来计算概率。但是,根据莱布尼茨和伯努利的设想,法律、政治和医学等领域其实恰恰是概率计算最重要的用武之地。这些
概率就相当于建立在可获得的最佳证据基础上的置信度,[1]但这
并不意味着它们无法测算。
接下来,我们将通过赌博来讨论概率的估算。在现实世界
中,我们在很多情况下除了赌一把以外别无选择。预测市场
(prediction market)或许是一个最简单的例子。比如,有一些网
站,你可以在上面押注赌某个特定事件将会发生或不会发生,包
括谁将成为某场足球赛、赛马或选举的赢家。预测市场不是一个
新发明,早在16世纪就存在赌谁会当选教皇的市场了。[2]在典型的预测市场上,合约被定价为0~100点。任何时候你都可以看到
买入和卖出的报价,比如买入56.8点、卖出57.2点。如果你想买
入一份合约,你可以立即以57.2点的价格买入,或者报出57.0点
的买入价,然后等待愿意接受这个价格的卖家。如果你以57.0点
(即57美元)的价格买入一份希拉里·克林顿竞选美国总统获胜的
合约,这意味着一旦她竞选成功,根据这份合约你将得到100美
元的收益。当然,合约的价格会上下波动。
把当前的市场价格视为市场概率,这是自然而然的事。如果
C的发生概率是0.57,这个赌局的期望值就是57美元。也就是
说,如果C发生,则收益为100美元;反之,收益为0美元。如果
市场价格与概率的计算结果不相符,那么我们应该怀疑有人在从
事市场套利活动。我们认为,你的报价(如果价格低于x,你就
会少量购入,如果价格高于y,你就会卖出)应该可以准确地反
映出你的概率。
大量关于预测市场的信息资料如雨后春笋般展现在人们眼
前。购买股票、债券和保险是密切相关的活动,下面列出的这些
原则可能对我们从事这些活动有所帮助。[3]
我们将本堂课的正式内容分为两个部分,分别介绍一种简单
的方法和一种复杂的方法。就像早期的赌徒那样,对当下讨论的
这些问题而言,我们先要假设金钱是价值的量度。有了这个先决
条件,我们就可以通过直截了当的方式估算判断概率
(judgmental probability),并推断这些具有相关性的判断的数学
结构。第二部分则舍弃了这个假设前提,进行了更具一般性的分
析。这样一来,“概率和效用都是可以测量的”伟大思想就完整了。这套理论的主导思想是由年轻的天才弗兰克·拉姆齐于20世纪
20年代提出的。20世纪50年代,美国统计学家伦纳德·吉米·萨维
奇(Leonard Jimmie Savage)使其得到了全面发展。[4]部分Ⅰ:赌博与判断概率
在测度判断概率时,我们借鉴惠更斯的做法,逆向应用帕斯
卡与费马提出的方法。也就是说,我们用期望值来计算概率,而
不是通过概率来计算期望值。我们认真考虑某个人愿意在某个事
件上押下的赌注,以此估算该事件的期望值。你的判断概率的加
权平均值,就是事件的期望值。
具体来说:
如果赌局结果为A时的收益为1,反之为0,A的概率就是该赌
局的期望值。
如果你为该赌局支付的价格等于P(A),这可以被视为一次等
价交易。如果价格低于P(A),你就会愿意买入;如果价格高于
P(A),你肯定不愿意买入。因此,根据你的价格平衡点,就可以
测算出你对A的判断概率。
这种方法很牵强,因为它理想化地假设人们可以毫不费力且
准确地区分这些具体情况。但是,我们在做很多决策时,需要完
成的全部工作可能只是近似值计算过程的头几个步骤。我们到底
能走多远?这个问题没有明确的答案。接下来,我们继续研究这
套理想化的理论。
相关性判断
一般而言,判断概率是否具有通过计数得到的数学结构呢?菲尼蒂指出,如果一个人的押注行为是相关的,那么他的判断概
率的确具有概率的数学结构。这个基本论点很容易证明。( 就目前
而言,我们在论证过程中假设可以用金钱度量价值,但本章的第二部分将会舍弃这
个假设。)
我们通过理想化的模型来论证这个观点,这个模型的目的只
是让人受到启发,因此不需要与真实生活完全一致。假设一个人
像赌注经纪人(或者衍生品交易员)那样买卖赌注。如果他的期
望值是零,这就是一个公平的赌注;如果他的期望值是正值,这
就是一个有利的赌注;如果他的期望值是负值,这就是一个不利
的赌注。只要有人找上门来,他便来者不拒,一边买入公平或有
利的赌注,一边卖出公平或不利的赌注。在这种情况下,如果若
干桩交易以某种方式组合到一起,她就有可能掉入荷兰赌
(Dutch book)的陷阱,也就是说,无论在哪种情况下,她都会
遭受净损失。我们认为,如果荷兰赌对她毫无影响,她的判断就
具有相关性。
比如,假设你问我对弗格霍恩参议员成功连任的判断概率。
经过思考之后,我回答说0.6。然后,你问我鲍比·布罗哈德当选
的概率,我回答说0.1。接着,你又问我弗格霍恩或者布罗哈德当
选的概率,我回答说0.9。如果我坚持自己的看法,这些判断概率
就不具有相关性。你可以采用荷兰赌的策略,从我这里购买弗格
霍恩的获胜概率为0.6、收益为1的赌注,和布罗哈德的获胜概率
为0.1、收益为1的赌注,再卖给我弗格霍恩或者布罗哈德的获胜
概率为0.9、收益为1的赌注。这样一来,无论最终谁获胜,你都
可以得到0.2的收益。如果你心地善良,指出我的判断不具有相关性,而不是借此
机会牟利,那么我很可能会重新考虑我对这些概率做出的判断。
我们都会做出根本不相关的草率判断。有时这无关紧要,但如果
赌注非常高,这些判断变得非常重要,又会怎么样呢?举个极端
的例子。假设你是一个对冲基金经理,市场上还有其他对冲基金
经理。如果你意识到自己的判断不具有相关性,难道不应该自我
反思一下吗?
从根本上说,要具备相关性,就必须做到前后一致,在逻辑
上同样需要前后一致。一位智者说过:“我们都会相信一些前后
矛盾的事情。理性讨论的目的,就是当有人说‘你认为A和B都是
对的,但是通过一系列推理,而且你认为每一步推理都没有问
题,最终却可能发现B不是A的必然结果’时,你会意识到出了问
题,想改正它。”
不确定性判断同样如此。当然,这里没有赌注经纪人,也没
有人赌博。但和一致性一样,相关性似乎也是一个值得我们关注
的标准。
菲尼蒂告诉我们,相关性表明我们的判断具有概率的数学结
构。
相关性判断就是概率
如果我们说一个人的判断具有概率的数学结构,就相当于说
它们表现出比例的特点。它们是部分置信的比值,最小值为0。
重言式(tautology)是指某个命题在整个概率空间中都为真,其比值为1。由相互独立的部分(彼此矛盾的命题)构成的组合,整体的比值是各部分比值之和。如果一个袋子里有20%的红豆和
35%的白豆,那么有55%的豆子是红色或者白色的。我们马上会
看到,有了这个概念之后,我们就可以将概率的数学结构应用于
有限的概率空间了。( For those who are concerned about infinite spaces, there is a
completely analogous ar-gument for countable additivity using a countably infinite number
of bets. See e. Adams, “On Rational Betting Systems,” Archiv für mathematische Logik
und Grundlagenforschung 6 (1962): 7–29. Is it legitimate to use a countable number of
bets? This is controversial. De Finetti thought not. For further discussion, see B. Skyrms,“Strict Coherence, Sigma Coherence and the Metaphysics of Quantity,” Philosophical
Studies 77 (1995): 39–55. Reprinted in Skyrms, From Zeno to Arbitrage (Oxford: Oxford
University Press, 2012).)
相关性意味着概率
1. 最小值为零。假设你给出一个命题p,其概率小于0。那
么,你会认为“如果p发生则损失1,反之没有损失”这个赌注的期
望值是正值。
在这种情况下,你无论如何都会遭受净损失。如果p没有发
生,你从赌局中得不到任何收获,本钱也拿不回来了。如果p发
生了,你就会遭受双重损失,既输掉了本钱,又输掉了赌局。
2. 重言式的概率是1。假设你认为重言式(即在任何情况
下,它都是真命题)的概率不是1,而是大于或小于1。如果它的
概率大于1,那么对“如果p发生则收益为1,反之收益为零”的赌
注,你付出的代价将超过1。而结算赌注时,你只能赢1,因此你
将蒙受净损失。如果你判断重言式的概率小于1,你就会以低于1
的价格出售“如果p发生则收益为1,反之收益为0”的赌注。结算赌注时,买家的收益为1,而净损失则由你承担。
3. 相互独立部分的概率可以相加。现在考虑概率的可加性。
假设p与q相互独立(它们的合取会导致自相矛盾)。但请注
意,“如果p或q发生则收益为1,反之收益为0”的协议可以通过直
接和间接两种方式实现,直接方式是押注p或q,而间接方式是同
时押注p和q。
间接押注的总成本是P(p)+P(q)。根据相关性,直接押注的成
本应该等于间接押注的成本:P(p或q)=P(p)+P(q)。如果等号两边
不相等,那么显然有可能被人利用,以贱买贵卖的方式实施荷兰
赌。在满足模型假设条件的情况下,相关性从本质上看就是指可
通过不止一种方式实现的赌博协议能够得出一致的估算结果。
概率意味着相关性
如果判断就是概率,赌博的期望值就可以相加。
E(b1+b2+…)=E(b1)+E(b2)+…
由于荷兰赌肯定会导致损失,因此它的期望值E(b1+b2+…)
必须是负值,而E(b1)、E(b2)…都是非负值。由此可见,荷兰赌
是不可能实现的。如果判断就是数学概率,那么这些判断都具有
相关性。
当且仅当判断概率具有经典概率的数学结构时,这些判断概
率才具有相关性。概率的更新
我们已经回答了最初提出的那个问题,但是,一旦开启了这
种思考方式,它就会引领我们不断深入到这个有趣的领域之中。
前面,我们介绍了静态相关性(在某个固定时刻具有相关性的判
断概率)的一些特性。接下来,我们介绍动态相关性,即置信度
随时间发生具有相关性的变化。首先,我们必须了解菲尼蒂指出
的条件赌注具有哪些特性。
条件赌注
对于相关性,菲尼蒂还有一个非常重要的观点,即条件概率
与条件赌注之间存在某种联系。( Conditional probabilities explain much of
the pragmatics of indicative conditional con-structions — If Mary is lying, then Samantha
is guilty — in natural language. See e. Adams, The Logic of Conditionals: An Application
of Probability to Deductive Logic, Synthese Library 86 (Dordrecht, Holland: Reidel, 1975).
You may consider whether the ensuing discussion pro-vides a rationale.)所谓条件赌
注,是指一旦条件没有满足,就会被取消的赌注。因此,针对q
的条件为p的赌注具有以下形式:
如果p且q,则收益为a(如果p且q,则赌局赢);
如果p而非q,则收益为–b(如果p而非q,则赌局输);
如果出现其他结果,则收益为0(如果非p,则赌局取消)。
如果某个条件赌注被视为公平的,则估算条件概率,即P(q |
p),为b(a+b)。举例说明。弗雷德判断萨拉被提名并成功当选的概率是13,因此他认为“如果萨拉被提名并成功当选则赢23,反之则输
13”的赌注是公平的。与此同时,弗雷德判断萨拉获得提名的概
率是12,因此他认为“如果萨拉被提名则输13,反之则赢13”的
赌注也是公平的。注意,这两个赌注一起构成了萨拉当选的条件
赌注,条件是她被提名,估算条件概率为23。(如果萨拉未获提
名,弗雷德会赢13,但也要输13,因此他的净收益为0。这与因
为萨拉未获提名而取消赌局的结果是一样的。)
现在,我们假设弗雷德的条件赌注的损益情况与这个条件概
率不一致。比如,假设他认为以萨拉获得提名为条件的等额赌注
是公平的,并采取了这种押注策略,他的做法就不具有相关性。
如下所述,他有可能遭遇荷兰赌。
为了使荷兰赌的整个过程一目了然,我们将它分成两个阶
段。
阶段1。首先,我们制订押注方案B1:如果萨拉获得提名并
成功当选,我们付给弗雷德23;反之他付给我们13。再次,我
们为弗雷德制订押注方案B2:如果萨拉获得提名,他付给我们
13;反之我们付给他13。最后,我们以萨拉获得提名为条件,针对她能否成功当选制订押注方案B3:如果萨拉获得提名并成功
当选,弗雷德付给我们12;如果萨拉获得提名却败选,我们付给
弗雷德12;如果萨拉未获提名,则取消赌局。下表展现了各种可
能情况下弗雷德的损益情况。阶段1只是一个有条件的荷兰赌,即只在萨拉获得提名的情况下,弗雷德肯定会蒙受损失。阶段2。为了把它变成一个完整的荷兰赌,我们可以采用对
冲的方式,即再制订一个等额押注方案B4:如果萨拉获得提名,我们付给弗雷德112;反之他付给我们112。弗雷德认为这是公
平的。这样一来,无论选举结果如何,弗雷德的净损失都是
112。因此,弗雷德遭遇了荷兰赌。如果希望了解一般情况下的
分析结果,可参阅本堂课内容的附录1。
相关性更新我们已经讨论了条件赌注和无条件赌注在给定时刻的相关
性。当我们得到新的证据时,概率会发生什么变化呢?置信度是
否会发生某种具有相关性的变化呢?假设这个新证据是某个具有
确定性的命题e。那么,在改变判断概率时,遵循的标准规则
是:以e为条件调整原来的概率,并代之以新的概率。这就是所
谓的“以证据为条件”(conditioning on the evidence)。从相关性
角度看,这种做法有道理吗?我们想要强调的是,我们不再考虑
置信度是否具有相关性,而代之以寻找置信度变化规则的相关
性。
菲尼蒂对这个问题的讨论比较隐晦,第一个明确提出这个观
点的是哲学家戴维·刘易斯(David Lewis)。( Communicated by Paul
Teller, “Conditionalization and Observation,” Synthese 26 (1973): 218–58.)以证据为
条件,贝叶斯更新(Bayesian updating)就是在新情况下更新概
率的唯一具有相关性的规则,而其他任何规则都会为荷兰赌(有
时间跨度的荷兰赌,即历时性荷兰赌)大开方便之门。下文将介
绍一个模型,它是这个观点的一个精确版本。
模型
知识学家(包括科学家和统计学家)与赌注经纪人一样,在
根据证据更新概率时秉持着自己的一套原则,但我们猜测不出它
到底是什么。今天,他公布自己的判断概率,并据此买卖赌注。
明天,她会先进行观察(得出有限个可能的结果,而且每个可能
结果的先验概率都为正);然后,根据他的更新规则(表达可能
的观察结果与修改后的概率之间关系的函数)更新概率,并公开
更新规则。后天,她公布修改后的公平价格,据此买卖赌注。赌徒的策略应该包含两个部分:一是当天有限数量的交易,知识学家根据他的判断概率,认为这些交易都是公平的;二是根
据可能的观察结果为后天的有限数量的交易确定交易价格的函
数,知识学家根据他的更新规则,认为这些价格都是公平的。
相关的置信度变化意味着以证据为条件
用P(A | e)表示 P(A∩e) P(e),用Pe(A)表示e被观察到是赌注经
纪人根据非标准更新规则(与以证据为条件的规则不同)给出的
A的概率。假设P(A|e)> Pe(A)( The case where P(A.| e).< Pe(A) is similar.),用
δ表示P(A|e)–Pe(A)。那么,赌徒可以利用下面这个策略实现荷兰
赌。
今天:以赌注经纪人认为公平的价格向他报价:
1. 如果A且e,则收益为1;否则,收益为0。
2. 如果非e,则收益为P(A|e);否则,收益为0。
3. 如果e,则收益为δ;否则,收益为0。
明天:如果观察到e,则以当前的公平价格,即Pe(A)=P(A|e)–δ,向赌注经纪人报价,购买“如果A,则收益为
1;否则,收益为0”的赌注。
在这种情况下,所有可能的结果都会导致赌注经纪人损失
δP(e)。( Let’s work it out: Suppose e doesn’t happen. Then only the bets from the
first day count. The bookie paid out fair prices for the 3 bets, respectively:1. P (A
and e),2. (1. P(e)) P(A.| e).= P(A.| e).. P(A and e),3. δP(e).He loses bets 1 and 3 butwins bet 2 and collects P(A.| e).Adding it up, the bookie loses δP(e).Suppose e does
happen. Then the second transaction is made. We buy back the bet on A from the
bookie. He getsP(A.| e)..δ.It now makes no difference whether A happens or not. But
the bookie has won bet 3 and so getsδ.Adding it up, the bookie loses δP(e), as
before.)
当然,我们也可以从确定的盈利中拿出一小部分,把它们分
摊到各笔交易中,以增加报价的吸引力。这样一来,赌注经纪人
就会发现,所有交易在他接受的那一刻就会成为对他有利的荷兰
赌。
以证据为条件意味着置信度的相关性变化
如果知识学家的概率更新符合以证据为条件的规则,那么赌
徒策略的所有可能收益都只能通过当天的条件赌注来实现。因
此,如果他当天的判断概率具有相关性,而且她根据证据更新概
率,那么任何人都无法利用荷兰赌从他那儿获利。
置信度的相关性变化就是一致性
但是,我们能不能断定,历时性荷兰赌之所以具有这种威
胁,是因为在评估同一目标的两种实现方式时,我们给出的评估
结果不具有一致性呢?大家应该对刘易斯的荷兰赌比较熟悉。其
中,前两个押注方案是利用两个非条件赌注实现条件赌注。第三
个是额度不大的附加赌注,与菲尼蒂用来论证条件概率的荷兰赌
相似。
假设我们已经理解了菲尼蒂的论点,并且知道条件赌注的评
估结果必须具有一致性。那么,历时性荷兰赌就会变为:我们可以通过两种不同的方法制定符合我们的认知模型的条件赌注。一
种方法是在今天以菲尼蒂告诉我们的方式制定条件赌注;另一种
方法是等到明天,如果条件(取得证据e)得到满足,就按照明
天的价格押注。如果两者一致,就说明我们已经按照以证据为条
件的规则改变了我们的判断概率。置信度的相关性变化与以证据
为条件的规则是一致的。
相关性更新的延展
上文中的以证据为条件更新概率的荷兰赌,是在一个特定的
较为程式化的认知模型中发生的。我们可以放宽模型的限制条
件,或者通过多种方式修改模型。事实上,文献资料表明,统计
学家和哲学家都曾利用结构化的认知模型来研究相关性。戴维·弗
里德曼(David Freedman)与罗杰·普维斯(Roger Purves)撰写
的《适合赌注经纪人的贝叶斯方法》(Bayes Method for
Bookies)( David Freedman and Roger Purves, Annals of Mathematical Statistics 40
(1969): 1177–86.)就为我们提供了一个很好的切入点。在这篇文章
中,作者没有假设统计人员一定会形成先验概率。此外,作者还
指出,如果统计人员的决策行为具有相关性,就会表现出他有先
验概率和以证据为条件更新概率的特点。
有的研究还会延伸至证据不确定的情况。在理查德·杰弗里的
概率运动学(probability kinematics)模型中,( Richard Jeffrey (1965),The Logic of Decision, 3rd rev. ed. (New York: McGraw-Hill; Chi-cago: University of
Chicago Press, 1983).)并没有确定性的证据命题。相反,在证据经验的
作用下,证据命题的概率将发生变化,而以证据分类为条件的其
他命题的概率则保持不变。因此,对与概率的微小变化有关的更新来说,其一般概念具有丰富的内涵。( See P. Diaconis and S. Zabell,“Updating Subjective Probability,” Journal of the Ameri-can Statistical Association 77
(1982): 822–30.)此外,杰弗里对相关性与荷兰赌的理解也很到位。(
B. Skyrms, “Dynamic Coherence and Probability Kinematics,” Philosophy of Science 54
(1987): 1–20. Reprinted in B. Skyrms, From Zeno to Arbitrage (New York and London:
Oxford University Press, 2012).)如果你对这些感兴趣,可参阅本章的附录
2。
从数学角度看,荷兰赌的相关定理都是套利理论的一部分。
市场扮演着赌注经纪人的角色,以现行价格买入或卖出赌注。如
果市场不具有相关性,同样的赌注价格就有可能不同,这为套利
者利用市场的不相关性赚取利润创造了机会。如果是预测市场,而且这种不相关性的市场有很多个,套利其实就是荷兰赌。利用
套利理论,可以建立既适用于某个时点又适用于某个时间段的一
般相关性理论。( See B. Skyrms, The Dynamics of Rational Deliberation
(Cambridge, MA: Harvard Uni-versity Press, 1990) and “Diachronic Coherence and
Radical Probabilism,” Philosophy of Sci-ence 73 (2006): 959–68. Reprinted in B. Skyrms.
From Zeno to Arbitrage (New York and Lon-don: Oxford University Press, 2012).)
由于某些人对利用赌博来证明合理置信度的做法感到不安,菲尼蒂给出了一种基于校准(calibration)的替代性证明方法。(
B. de Finetti (1974), Theory of Probability, tr. A. Machi and A. Smith (New York: Wiley,1999).)( There is another motivation as well, based on incentives to reveal one’s true
probabilities.)我们希望自己相信的东西都是事实,因此我们给真相赋
值1,给谬误赋值0。在发现真相之前,你有一定的置信度。假设
在发现真相后,你将受到平方误差的惩罚。比如,你认为P(A)为
0.9,结果发现A为真,则你受到的惩罚是0.01;但如果A为假,则
你受到的惩罚是0.81。菲尼蒂指出,如果你的判断不具有相关性,那么无论真相如
何,你都可以通过相关性的置信度(概率)来降低惩罚的力度。
我们来看一个简单的例子。假设A和B相互独立,那么真相只有三
种可能性:两者都是假的;A真,B假;A假,B真。概率是真相
期望值的加权平均。( Also known as mixtures, or convex combinations.)令
x=P(A), y=P(B),z=P(A∪B),就会形成如图2–1所示的二维图
形z=x+y。
相关性观点认为,这些概率与相关性置信度是一致的。假设
某些置信度不具有相关性,与这些不相关的置信度对应的点就不
在该平面上。根据欧几里得几何学,无论真相如何,在该平面上
都一定存在一个十分接近真相的点。这些评分规则有多重应用,天气预报人员用它们来校准自己的预测,专家们则通过它们保证
自己表述的观点与自己的真实观点一致。( See A. H. Murphy and R. M.
Winkler, “Probability Forecasting in Meteorology,” Journal of the American Statistical
Association (1984): 489–500, and L. J. Savage, “elicitation of Personal Probabilities and
expectations,” Journal of the American Statistical Association 66 (1971): 783–801,respectively.)
虽然菲尼蒂证明判断概率的两种方法似乎十分不同,但它们
都显示出相同的数学属性,( This is called convexity.)即各种可能性的加
权平均值是概率。如果置信度不是真相期望值的加权平均值(概
率为1或0),就有可能导致糟糕的结果——要么为荷兰赌留下可
乘之机,要么偏离真相,而且偏离的程度肯定大于所有相关性置
信度。部分Ⅱ:效用与判断概率
金钱不能代表一切,在大多数的人类事务中,用来衡量损益
的都不是金钱,而是我们珍视的东西。有时候,两种商品具有互
补关系,彼此都可以增加或降低对方的价值,因此在用实物衡量
损益时,两个赌注的损益值可能不具有可加性。由于风险厌恶
(risk aversion)( 风险厌恶,是指投资者对投资风险反感的态度,可用来测量
人们通过付钱来降低风险的意愿。——译者注),即使金钱也不一定能满足
荷兰赌的假设条件。如果两个赌注对冲,可能会形成互补关系,因为风险降低了。在现代,效用与金钱之间并不是线性关系。解
决这些问题的方法是用效用取代金钱,重建理论。图2-1 三种结果的可能概率
但是,效用如何测度呢?概率和效用的测度都可以采用非循
环方式吗?答案是肯定的,由才华横溢的拉姆齐在一篇著名的论
文《真理与概率》(Truth and Probability)中给出。不过,我们
的故事开始的时间要早得多,经过几番跌宕起伏,才会轮到拉姆齐登场。
效用
明智的人早就知道金钱不是衡量价值的真正标准,但直到尼
古拉·伯努利(Nicholas Bernoulli)提出“圣彼得堡悖论”之后,人
们才开始关注赌博理论。1713年9月9日,尼古拉·伯努利在写给皮
埃尔·蒙特莫特(Pierre Montmort)( “Correspondence of Nicholas Bernoulli
concerning the St. Petersburg Game,” tr. from Richard J. Pullskamp, Die Werke von Jacob
Bernoulli Band 3 K9, Xavier University (2013). Posted at
http:cerebro.xu.edumathSourcesNBernoullicorrespondence_petersburg_ game.pdf.)的
信中提出了几个问题,其中包括下面两个问题:
第四个问题。A向B承诺:如果B用一枚普通的骰子,第
一轮就掷出6点,A就给B一枚硬币;如果B第二轮掷出6点,A就给B两枚硬币;如果B第三轮掷出6点,A就给B三枚硬
币;如果B第四轮掷出6点,A就给B 4枚硬币,以此类推。请
问B的期望值是多少?
第五个问题。问题同上,但是A承诺付给B的硬币数目
不是按照1、2、3、4、5…这样的规律增长,而是按照像1、2、4、8、16…或者1、3、9、27…或者1、4、9、16、25…
或者1、8、27、64…这样的规律递增。尽管这些问题大多不
难解答,但你会有一些非常奇怪的发现。
蒙特莫特回答道,这些问题并不难,只要求出无穷级数的和
即可,而“你的伯父雅各布·伯努利早就给出了这类级数的求和方
法”。尼古拉·伯努利在回信中建议蒙特莫特亲自试一试。虽然第四
个问题中的无穷级数之和是6,但第五个问题中的几个无穷级数
之和都是无穷大。这就是伯努利所说的“非常奇怪的发现”。这样
的结果意味着什么呢?这个赌博游戏的期望值怎么会大于所有的
有限和呢?两个人都困惑不解,于是伯努利向其他人抛出了这个
问题。1728年5月17日,瑞士数学家加百利·克莱姆(Gabriel
Cramer)从伦敦给尼古拉写了一封信:
我不知道我是否在欺骗自己,但我相信我能解答你向蒙
特莫特提出的那个古怪问题……为了使问题变得更加简单,可以假设B抛硬币。如果B第一次就得到正面朝上的结果,则
A承诺付给B一枚硬币;如果B第二次才得到正面朝上的结
果,则A付给B两枚硬币;如果B第三次才得到正面朝上的结
果,则A付给B 4枚硬币;如果B第4次才得到正面朝上的结
果,则A付给B 8枚硬币,以此类推。计算结果表明,A必须
支付给B的硬币数量是一个无穷大量。这看上去十分荒谬,因为所有理智的人可以接受的最大数字都不超过20。这恰恰
是悖论所在。人们不禁要问,数学计算结果与普通人的估算
结果之间为什么会有如此大的不同?我认为,其中一个原因
在于,数学家是根据金钱的数量来估计价值的,而理智的人
依据的则是金钱的效用。
接着,克莱姆提出了两个重要的观点。第一,如果没有无限
多的赌资,这场游戏就不可能无休止地进行下去,而且即使赌资
巨大,这个赌局的预期效用也不会太大。第二个观点与我们现在
讨论的内容密切相关,即真实价值与财富数量不成正比。我们不难发现,如果针对有钱人的主观价值(Moral
Value)做出假设,就会得到一个较小的(期望值)。原因
在于我做出的假设并不绝对公平,因为1亿美元带来的愉悦
感肯定比1 000万美元多,尽管前者达不到后者的10倍。
于是,我们就有了明显不同于货币价值的效用概念,即主观
价值。10年后,尼古拉的堂弟丹尼尔·伯努利(Daniel Bernoulli)
在《圣彼得堡皇家科学院评论》(Commentaries of the Imperial of
Science of Saint Peterburg)上提出了这个问题(即圣彼得堡悖
论),并给出了基本相同的答案。此前,丹尼尔从尼古拉那里获
悉了克莱姆的研究成果,因此他在论文中明确表示荣誉应当全部
归属于克莱姆:
那时这位杰出的学者告诉我,著名数学家克莱姆曾针对
相同的问题提出过一个理论,而且时间比我的这篇论文早好
几年。事实上,我发现他的理论与我的非常相似。我们对这
类问题独立给出的答案竟然如此一致,这堪称一个奇迹。
克莱姆和丹尼尔·伯努利也各自提出了具体的效用函数。克莱
姆认为效用是金钱的平方根;伯努利则认为金钱增量产生的效用
与已经拥有的金钱数量成反比,财富的派生效用等于财富数量的
对数。( On either of these suggestions, one can recreate the problem, but postulating
prizes that grow fast enough as pointed out by Karl Menger in 1934: K. Menger, “The Role
of Uncertainty in economics,” in Martin Shubik, ed., Essays in Mathematical Economics in
Honor of Oskar Mor-genstern (Princeton: Princeton University Press, 1934; 1966).)接
着,伯努利又对风险厌恶进行了描述,并讨论了购买保险的合理
性。( D. Bernoulli (1783), tr. L. Sommer as “exposition of a New Theory on theMeasure-ment of Risk,” Econometrica 22 (1954): 22–36.) ( The St. Petersburg game
continues to be provocative, and there are many perspectives on it. For more, we suggest
you look at R. J. Aumann, “The St. Petersburg Paradox: A Discus-sion of Some Recent
Comments,” Journal of Economic Theory 14 (1977): 443–45, and P. Samu-elson, “The St.
Petersburg Paradox: Defanged, Dissected and Historically Described,” Journal of
Economic Literature 15 (1977): 24–55.)
效用的测度
除非效用可以用数量来衡量,否则讨论财富的效用函数将毫
无意义。那么,效用如何测度呢?19世纪英国的功利主义者认为
这个问题应该由心理学(或者心理学与哲学一起)解决。他们同
意克莱姆和丹尼尔的观点,认为金钱每增加一个单位,其效用将
随着财富的增多而逐渐减少,并以此作为社会改革的基础。
但在20世纪早期,一个实证主义经济学派对这个问题进行了
深入研究。他们认为,如果效用无法测度,我们就只能利用比较
和主观的语言来描述包含经验内容的效用。比如,对卡尔而言,如果A的效用大于B的效用,这就意味着卡尔更倾向于A。或者
说,如果卡尔可以选择,那么他将选A而不是B。效用标度只具有
序数意义,也就是说,任何两个排序相同的效用标度都具有相同
的经验内容。
1944年,约翰·冯·诺依曼(John von Neumann)和奥斯卡·摩
根斯特恩(Oskar Morgenstern)出版了《博弈论与经济行为》
(Theory of Games and Economic Behavior),彻底改变了这个局
面。( J. von Neumann and O. Morgenstern, Theory of Games and Economic Behavior
(Princ-eton: Princeton University Press, 1944).)这部著作通过引入关于概率的经典研究成果,在序数效用论的基础上构建了基数效用论。
假设根据你的偏好,将某些最好的结果称作“好”,将最不好
的结果称作“坏”。再假设你对赌博游戏(或彩票)的偏好满足下
列条件:“好”的概率为p,其他情况都属于“坏”。我们可以随意选
择“好”和“坏”的效用值,但要保证前者大于后者。效用标度(与
摄氏度、华氏度等温度标度类似)中的0和1正好可以满足这个条
件。为简单起见,我们将“好”的效用值设为1,而“坏”的效用值设
为0。
现在,假设对其他任何结果O的效用而言,我们都可以找到
一个结果是“好”的概率为p,而在其他情况下结果都是“坏”的赌
局,并使p与O这个肯定结果没有差别。( 这个假设条件到底是什么意思
呢?不要着急,在后文中我们将会告诉你答案。)然后,令O的效用值等于
p,也就是说,O的效用值等于这个赌局的期望效用。由于已经知
道结果是“好”的概率,我们可以用期望效用来测算效用。请注
意,我们无须抱怨效用的序数性,因为这里只使用了序数判断,尽管判断的范围已经延伸至客观的赌博游戏。其实,为序数效用
奠定量化基础进而产生基数效用的,恰恰是赌博中的概率。
此外,我们有必要指出“赌博”这个词可能带有其他含义,在
这里它表示结果的概率分布。因此,本书中可能出现的若干赌
局,同样指的是结果的概率分布。我们假定在针对有限个结果押
注时,一个个体对所有这些赌局的偏好具有一致性。在这个条件
下,我们可以得出一条定理:必然存在一个效用,使赌局的期望
效用与该个体的偏好一致。让我们具体说说偏好必须满足哪些条件。首先,偏好必须能
对所有赌局排序。这并不意味着你对两个赌局的偏好一定存在差
异,也有可能是一样的。但是,在做比较时不能毫无头绪,而应
该说出A与B哪个更好、哪个更差,或者两者一样,这才是一组理
想化的偏好。其次,偏好必须具有连续性和独立性。
连续性:如果p优于p',p'优于p,则存在概率a,使得
ap+(1–a)p与p'没有差别。
独立性:p优于p'的条件是当且仅当
对于所有的a与p,ap+(1–a)p 优于ap'+(1–a)p。
对独立性定义中的两个赌局来说,收益p的概率都是(1–a)。
它们唯一的区别就在于概率为a时你的收益的不同,所以你的偏
好应该是受到控制的,控制因素是概率为a时你对赌局收益的偏
好。这就是独立性的内容。
我们并不打算证明偏好的这两个性质,但我们可以对它们的
作用原理稍加了解。我们先为赌局制定一个包含“好”与“坏”的效
用标度,效用值就是“好”的概率。现在我们需要说明的是,对那
些介于“好”与“坏”之间的赌局而言,效用可以表示你对赌局的偏
好排序情况。我们知道你对“好”的偏好程度大于“坏”,但我们还
需要证明你对“好”、“好”与“坏”之间的某个非无效赌局、“坏”的
偏好程度依次减少。
假设我们有一个非无效赌局“p‘好’+ (1–p)‘坏’”。由于“好”等于确定无疑的“好”,“坏”等于确定无疑的“坏”,而且“好”优于“坏”,因此我们可以应用独立性,p“好”+ (1–p)“好”,p“好”+ (1–p)“坏”,p“坏”+ (1–p)“坏”,并且断定这些偏好的排序没有问题。在应用独立性时稍微增
加复杂度,就可以证明两个非无效赌局的排序情况,即在效用标
度上位置较高的赌局优于位置较低的赌局。
在测度“好”与“坏”之间除特殊赌局之外的其他任何赌局q的效
用时,我们可以找出一个特殊赌局p,使得p与q对我们而言没有
任何差别。于是,我们为赌局q赋予与p相同的效用。为什么我们
总能找到这样的参照赌局呢?因为连续性。通过重复应用独立
性、有序性和连续性,我们就可以得到完整的适用于有限结果的
冯·诺依曼–摩根斯特恩定理。
在上一章我们说过,用金钱论证荷兰赌会引起人们的哲学忧
虑。如果我们用冯·诺依曼–摩根斯特恩效用来表示收益,就不存
在这个问题了。不过,我们先用效用来测度判断概率,现在又用
判断概率来测度效用,这难道不是在兜圈子吗?当然不是。我们可以用经典的概率(骰子、公平彩票、幸运
转盘等),来测度所有事物对某个人的效用。然后,我们用这些
效用来测度她对概率游戏结果以外的其他事情的判断概率,比如
明天是否会下雨、选举结果,以及大家是否会失业等。这是弗朗
西斯·安斯科姆(Francis Anscombe)和罗伯特·奥曼(Robert
Aumann)用一种简洁的方法,于1964年取得的一项成果。( F. J.
Anscombe and R. J. Aumann, “A Definition of Subjective Probability,” Annals of
Mathematical Statistics 34 (1964): 199–205.)
但是,这相当于认定行为人面临的是经典的等可能情况,并
规定行为人认为这些情况发生的可能性完全相等。要全面描述行
为人的判断,就必须描述所有概率以及源自个人偏好的所有效
用。也许你认为这不可能做到,但是,拉姆齐在他的论文《真理
与概率》中做到了。( F. P. Ramsey, “Truth and Probability” in The Foundations of
Mathematics and Other Logi-cal Essays (London: Routledge and Kegan Paul, 1931): 156–
98.)他是如何做到的?
拉姆齐
关于这个问题,我们已经略有了解,但我们还不清楚拉姆齐
提出的“伦理中立”的观点。所谓伦理中立,是指命题p本身的真
或假对行为人的偏好没有任何影响。也就是说,对任何结果的集
合B来说,无论是p为真时的B还是p为假时的B,在行为人看来都
没有任何差别。比如,电脑开机所花时间是奇数还是偶数(以毫
秒为单位),抛硬币的结果是正面朝上还是反面朝上,这些问题
大家会关心吗?通常,我们只关心某些事情,因此伦理中立的命
题有很多。从直觉上讲,以伦理中立的命题为前提设立赌局,好处在于它们的期望效用只取决于结果的概率与效用,而其自身的
效用并不是复杂因素。
我们可以按照下列方式确定一个伦理中立命题h概率为12。
假设有两种结果A和B,并且你对前者的偏好程度强于后者。如果
对你而言,[如果h则A,反之则B]与[如果h则B,反之则A]
没有任何不同,这个伦理中立命题h的概率就是12。现在,我们
为公平的抛硬币游戏找到了一个主观的替代物。这一点非常重
要,反复加以利用的话,就可以构建出效用标度。拉姆齐采用的
就是这个办法,它与冯·诺依曼–摩根斯特恩定理的区别不大,但
提出的时间要早得多。有了结果的效用之后,我们就可以像菲尼
蒂那样,用它们来测度那些非伦理中立命题的概率。下面,我们
举例说明如何应用这个方法。
赛马
假设有4个命题(HH、HT、TH、TT),它们相互独立且完
全穷尽。法默尔·史密斯(Farmer Smith)并不关心到底哪个命题
是真命题。具体来说,不管他关心的东西最终会产生什么样的结
果,他关心的都只是那些结果,而非这些结果到底是HH、HT、TH还是TT产生的。因此,用拉姆齐的术语来表达的话,这4个命
题都是伦理中立命题。
另外,假设就他关心的东西而言,他对A、B、C、D的偏好
程度依次下降,同时下面的赌局
如果HH则A,如果HT则B,如果TH则C,如果TT则D,以及调整A、B、C和D的位置后形成的其他任何赌局,比
如,如果HH则D,如果HT则B,如果TH则C,如果TT则A,对他而言都没有任何差别。因此,对他来说,HH、HT、TH、TT具有相同的概率,都等于14。(这也许是因为它们在他
眼中与质地均匀的硬币的两次独立抛掷一样,而且他做判断的方
法与卡尔达诺、伽利略、帕斯卡及费马相同。)
在一场赛马比赛中,斯特波尔与莫莉这两匹马将一较高下。
斯特波尔是法默尔·史密斯的马,因此对他来说,斯特波尔获胜与
莫莉获胜的命题都不可能是伦理中立命题。这场比赛他可以下
注,如果他赢了,就有可能得到一头猪。
他最偏好的结果是得到那头猪且斯特波尔获胜,因此他给这
个结果赋予的效用值是1。他最不喜欢的结果是得不到那头猪且斯特波尔落败,因此他给这个结果赋予的效用值是0。下面是他
在选择效用标度时面临的任意选择:
1︱得到猪且斯特波尔获胜,………
0︱得不到猪且斯特波尔落败。
假设某个赌注约定,如果HH或HT或TH,则法默尔·史密斯
赢得那头猪且斯特波尔获胜;如果TT,则法默尔·史密斯得不到
猪且斯特波尔落败。对法默尔·史密斯而言,“得到猪且莫莉获
胜”与这个赌注没有任何区别。所以该赌注的期望效用是34,我
们可以把它填入效用标度:
1︱得到猪且斯特波尔获胜,︱得到猪且莫莉获胜,………
0︱得不到猪且斯特波尔落败。
再假设某个赌注约定,如果HH,则法默尔·史密斯赢得那头
猪且斯特波尔获胜;如果HT或TH或TT,则法默尔·史密斯得不到
猪且斯特波尔落败。对法默尔·史密斯而言,“得不到猪且莫莉落
败”与这个赌注没有任何区别。于是,效用标度就变成:
1︱得到猪且斯特波尔获胜,︱得到猪且莫莉获胜,…
︱得不到猪且莫莉落败,0︱得不到猪且斯特波尔落败。
对史密斯而言,“如果莫莉获胜则得到猪,反之则得不到
猪”的赌注,与“如果HH或HT,则得到猪且斯特波尔获胜;如果
TH或TT,则得不到猪且斯特波尔落败”这个赌注没有任何区别。
第一个赌注不是以伦理中立命题为前提条件的,但我们可以认为它的效用值是1。也就是说,第二个赌注(“如果HH或HT,则得
到猪且斯特波尔获胜;如果TH或TT,则得不到猪且斯特波尔落
败”)的期望效用是 ×1+ ×0= 。因此,第一个赌注(“如果莫
莉获胜则得到猪,反之则得不到猪”)必然满足
P(莫莉获胜)×效用值(得到猪且莫莉获胜)+[1–P(莫
莉获胜)]×效用值(得不到猪且莫莉落败)= 。
我们已经知道这两个效用值分别是34和14,所以我们现在
可以确定法默尔·史密斯为一个非伦理中立命题赋予的判断概率。
他认为莫莉是一个同额赌注,即
P(莫莉获胜)= 。
拉姆齐从相关性偏好的排序性入手,向我们展示了在确定概
率和效用时使偏好与期望效用保持一致的方法。(拉姆齐在他的
论文中只是概括地介绍了这个方法,但重要观点都包含其中。)
这是关于概率和效用的表示定理。根据人们偏好高期望效用的规
则,我们可以用判断概率和个人效用来表示相关性偏好。如果偏好的结构非常丰富,那么在通常情况下概率是唯一确定的,效用
值则取决于0和1之间如何选择。
更值得注意的是,拉姆齐完成这项工作的时间早于安斯科姆
和奥曼,也早于冯·诺依曼和摩根斯特恩,甚至略早于菲尼蒂。后
来,人们又提出了更加细致周密的概率表示定理,其中最著名的
是萨维奇在1954年出版的《统计学基础》(The Foundations of
Statistics)中提出的方法。( L. J. Savage, The Foundations of Statistics (New
York: Wiley, 1954).)
当然,这些效用–概率表示定理中的假设都是高度理想化
的。关于这个问题,所有在这个领域做出过重大贡献的人都非常
清楚。比如,拉姆齐指出:
我没有详细推演其中的数学逻辑,因为我认为这就好比
只需保留两位小数,而你却计算到小数点后7位一样。我的
推演只能给出数学逻辑可能的作用原理。
但是,对于许多实际事务来说,在计算概率和效用时精确到
小数点后两位就已经非常好了,即使只求出一位小数,也比没有
要好。
我们已经看到了认为概率论就是一种逻辑(相关性置信度的
逻辑)的观点是如何形成的。归根结底,它就是一种语用逻辑,是一种决策逻辑,是在结果不确定的情况下相关性偏好对行为的
作用逻辑。因此,我们可以根据有条理的行为人在做选择时的偏
好来测度他的判断概率。这又引出了下一个问题:行为人通常有
多强的相关性?我们将在下一堂课讨论这个问题。小结
判断是可以测度的,相关性的判断就是概率。
假设我们有一种测量价值的方法,并且我们根据期望值买入
和卖出各种赌注。如果我们赋予期望值的权重与数学概率不符,就有可能掉入荷兰赌的陷阱。如果期望值与概率相匹配,我们就
不会给他人以可乘之机。在新证据的基础上,人们可以根据类似
的观点,对概率进行更新。
如果还没有找到测量价值的方法,那么我们可以制定一套方
法,同时从相关性偏好入手,建立一个判断模型,这样一来,判断就是数学概率,期望值就是效用值,偏好的初始排序与期望效用一致。附录1 条件赌注的相关性
对任意命题p与q,考虑针对p且q和针对非p的赌注,以及两
个赌注的组合结果。如下表所示。
如果针对非p的赌注满足d=e,则结果相当于一个条件投注。(
只要条件的估算概率为正值,结果就一定相当于一个条件赌注。)
假设每个投注及该条件赌注都被视为公平的,则估算概率为也就是说,P(p∩q)=P(p)P(q | p) ,或者P(q | p)=P(p∩q)P(p)。
这是概率的乘法法则(通常作为条件概率的定义出现)。
如果条件赌注和非条件赌注彼此相关,那么在市场中加入条
件赌注后不会引发任何新变化。利用条件赌注得到的任何损益都
可以通过等价的非条件赌注组合来实现,因此不会形成荷兰赌。
但是,如果某个人的判断概率导致其用于实现某个条件赌注的两
种方式给出不相关的评估结果,那么我们显然可以通过低买高卖
的方式形成荷兰赌。所以,相关性问题也是一个关于可通过多种
方式实现的赌约的评估结果是否一致的问题。附录2 概率运动学
假设你在夜间起床,借着从窗户射进来的微弱月光,观察桌
子上的一颗豆形软糖。这种软糖有红色、粉色、褐色和黑色等多
种颜色。此时的光线不足以让你看清这颗软糖的颜色,但足以让
你在各种可能的答案之间游移不定。这是观察结果无法确定的一
个例子,没有任何命题可以概括你的观察内容。你也许会说对这
种体验的描述就是符合条件的命题,但这样的命题不存在于任何
合理的概率空间中,对我们没有任何益处。因此,这是一个关于
不确定性证据的例子。
这个例子似乎并不值得我们认真思考,但我们经常会面对不
确定性证据。有时,我们需要借助在烛光或月光下的观察来做出
一些重要决策。比如,那个微笑意味着什么?或者,严肃一些,想象一下放射科医生观看肺部扫描影像或病理学家解读活检结果
的情景。( See Richard Jeffrey and Michael Hendrickson, “Probabilizing Pathology,”
Proceedings of the Aristotelian Society (1989):.211–26..DOI:
http:dx.doi.org10.1093aristotelian89.1.211.)稍加思考,你就会发现,我们
身边到处都是不确定性证据。
我们经常假装自己拥有确定性证据,并做出解读,把不确定
性命题视为确定性命题。这种做法有时是无可厚非的,但我们必
须承认,不确定性证据的问题值得我们认真思考。
回到豆形软糖的例子。豆形软糖有多种口味,红色的可能是
樱桃味或肉桂味,褐色的可能是巧克力味或咖啡味。你的家中有各种各样的豆形软糖,其中大多数褐色软糖都是巧克力味,但也
有一小部分是咖啡味。假设你知道褐色软糖是巧克力味的概率,也知道其他颜色的软糖是其他口味的概率。此时,如果你只是观
察这颗软糖,而不去品尝它的味道,那么在颜色的概率分布有所
变化的情况,以颜色为条件的味道概率似乎应该保持不变。如果
是这样,你的置信度就会在颜色的基础上按照理查德·杰弗里的概
率运动学发生变化。[在杰弗里和迈克尔·亨德里克森(Michael
Hendrickson)所举的病理学例子中,他们把颜色换成了诊断,把
味道换成了预后果。]
到底在哪种意义上,相关性的研究与概率运动学有关联呢?
我们不妨进一步完善我们的软糖模型。假设你在取得观察结果之
前和之后对颜色–味道的匹配情况分别确定了一个概率(P1和
P2)。而且,有人(也从床上爬了起来)走进你的房间,然后打
开灯。于是,你确定了第三个概率(P3)。我们认为你现在可以
确定这颗软糖的颜色。
我们需要找到一种说法,以表明你在月光下的观察体验只与
颜色有关,或者说,你没有品尝这颗软糖。为达到这个目的,我
们可以假设你在开灯后通过观察颜色取得的确定性证据可以推翻
你之前取得的不确定性证据。也就是说,你的最终概率与你直接
打开灯,通过观察软糖颜色确定的概率(省略了对颜色进行观察
并取得不确定性结果的中间环节)是一样的。这种说法意味着,颜色是对确定性证据和不确定性证据的充分分割。
为了实现相关性,可以假设你在更新确定性证据时遵循一种
相关性规则。本堂课已经证明,这种相关性规则只能是以证据为条件的规则。那么,根据相关性,以观察到的颜色为条件,可以
由P2得到P3。再根据相关性和充分性,以观察到的颜色为条件,可以由P1得到P3。因此,根据概率运动学,可以由P1得
到P2(因为以颜色为条件可以保证以该颜色为条件的味道概率保
持不变)。( B. Skyrms, “Dynamic Coherence and Probability Kinematics,”
Philosophy of Science 54 (1987): 1–20. Reprinted in B. Skyrms, From Zeno to Arbitrage
(New York and London: Oxford University Press, 2012).)第3课 概率心理学不同于概率逻辑学
阿莫斯·特沃斯基我们的第3堂课要讨论的关于概率的第三个伟大思想是:概
率心理学与概率逻辑学是两门迥然不同的学科。理想化、标准化
的假设在实践中经常遭到破坏,判断概率和决策理论在规范性和
描述性方面割裂,产生了巨大的分歧。
当然,人们很早以前就知道这两门学科不完全相同,但又普
遍认为两者在应用方面十分接近。弗兰克·拉姆齐说他的理论既是
精确的逻辑学,又近似于心理学。直到不久前,经济学的主流立
场亦如此。期望效用理论可能不是精确的心理学,但它足以担当
实证科学的核心决策理论的重任。
确立心理学和逻辑学的范式非常强,因此,作为最早提出心
理学与期望效用理论之间存在重大偏差的人,莫里斯·阿莱
(Maurice Allais)和丹尼尔·埃尔斯伯格(Daniel Ellsberg)的第
一反应是试图对逻辑学进行修改,使之与心理学相匹配。( We
cannot help but remark that people have systematic problems with deduction as well. Some
deviations from correct logic are common enough to have become named falla-cies. There
are problems with conditionals and quantifiers. Students often become confused when
dealing with Aristotelian syllogisms. For many examples, and one psychological theory
designed to explain them, see P. Johnson-Laird and R. Byrne, Deduction (Mahwah, NJ: erl-
baum, 1991).)这毫无疑问,并引发了一些有趣的理论研究。不过,丹
尼尔·卡尼曼(Daniel Kahneman)和阿莫斯·特沃斯基通过一系列
的研究,有力地证明这两个学科之间有着不可逾越的鸿沟。随着
证据的积累,人们终于找到了将实证心理学应用于实证经济学的
方法,这一点在当下行为经济学的蓬勃发展中得到了充分体现。(
D. Laibson and R. Zeckhauser, “Amos Tversky and the Ascent of Behavioral econom-ics,”
Journal of Risk and Uncertainty 16 (1998): 7–47.)行为经济学可以对公共政策产生影响。如果个体并没有表现
出理性经济人应有的行为特点,而政策却假设个体都是理性经济
人,就可能会造成不幸的后果。在卫生保健这个重要领域中,政
策就有可能会偏离理性决策模型。个体往往会忽视未来的低概
率、高风险事件,而过分重视当前的费用。在一项政策分析中,杰弗里·利伯曼(Jeffrey Liebman)与理查德·泽克豪泽(Richard
Zeckhauser)指出,由于个体行为的这种特点,医疗保险表现出
认购不足的趋势,而传统的经济学理论却预测补贴型保险应该会
表现出超额认购的趋势。( See, for instance, J. Liebman and R. Zeckhauser,“Simple Humans, Complex Insurance, Simple Subsidies,” NBeR working paper 14330
(Cambridge, MA: National Bureau of eco-nomic Research, 2008).)他们得出的结论
是:“如果从行为角度分析医疗系统广泛存在的大范围补贴政
策,分析结果就会有本质上的不同。”
如果卫生保健领域、受社会服务影响较广泛的领域(比如公
共教育),以及刑事司法系统的消费者心理偏离理性选择,社会
政策就很有可能会更加关注心理学。在这里,我们对决策心理学
与决策逻辑学进行简单的对比。图3-1 丹尼尔·卡尼曼
在前文中我们了解到,拉姆齐于1926年简要阐述了偏好的效
用–概率表示定理。如果一个人在面对非常多的可选方案时的偏
好符合某些貌似合理的原则,那么在表示这些偏好时,我们可以认为它们源于个人概率和个人效用,其中期望效用高的选择优于
期望效用低的选择。
这种表示定理后来得到了证明,其中安斯科姆与奥曼在证明
时假设客观概率是可以获得的,而萨维奇与拉姆齐则没有这样
做。“某些貌似合理的原则”到底是什么呢?前文中,我们在讨论
冯·诺依曼–摩根斯特恩效用时曾介绍过两个重要概念,即有序性
和独立性。有序性是指你真的知道该如何选择。对p和q这两个选
择而言,你可能倾向于前者,可能倾向于后者,可能不偏不倚。
而且,你的偏好是可传递的。独立性是指你对两张彩票的偏好应
该只取决于那些可带来不同奖金的结果。在萨维奇和安斯科姆、奥曼的假设中,都包含了以某种形式出现的有序性和独立性。
萨维奇把独立性(确定事件推理)视为理性决策的基本原
则,但立刻遭到了法国经济学家莫里斯·阿莱的质疑。( See M. Allais,“Le comportement de l’homme rationnel devant le risque: critique des postulats et axiomes
de l’école Américaine,” Econometrica 21 no. 4 (1953): 503–46.) 1952年巴黎召开了
一次关于风险的会议,组织者阿莱在午饭期间向萨维奇提出了下
面两个问题。
问题1 请在下面两个选项中做出选择:
A. 稳赚10亿美元。
B. 有89%的概率得到10亿美元,有1%的概率颗粒无收,有
10%的概率得到50亿美元。
问题2 请在下面两个选项中做出选择:A. 有89%的概率颗粒无收,有11%的概率得到10亿美元。
B. 有90%的概率颗粒无收,有10%的概率得到50亿美元。
(注:原始问题涉及的金额都以百万美元为单位,但考虑到
货币贬值问题,我们在这里换成了10亿美元。)
大家不妨花一分钟思考一下,看看应该如何选择。
萨维奇在回答第一个问题时选择了A,而回答第二个问题时
则选择了B。阿莱随后向其他与会专家提问了同样的问题,结果
许多人(但不是所有人( Paul Samuelson and Kenneth Arrow, for instance, made
choices consistent with ex-pected utility theory.))都做出了与萨维奇相同的选
择。到目前为止,这个实验已经重复了很多次,结果一直非常稳
定。
如果你的选择与萨维奇(以及本书的两位作者)相同,那么
请你再花一分钟时间,想一想你为什么会这样选择。
接下来,我们看看这些选择如何违背了独立性原则。我们把
这些选项看作公平彩票提供给我们的选择。一共有100张编号为
1~100的彩票,每张被抽中的概率相同。问题1可以重新表述为在
下列选项中做出选择:注意,虚线以上部分的赌注对选项A和B而言是相同的。因
此,根据独立性原则,两个选项的不同之处都是由虚线以下部分
赌注导致的。
我们删除虚线以上部分的赌注,并代之以金额为0的结果:
这正好可以得到问题2的两个选项。选项A和选项B的虚线以
上部分仍然相同,因此,我们在选择时仅需要考虑虚线以下部
分。就虚线以下部分而言,第一个问题和第二个问题完全相同。
如果你在回答第一个问题时选择A,而不选择B,那么根据独立
性原则,你在回答第二个问题时也应该选择A,而不选择B。
萨维奇在《统计学基础》一书中讨论了这个问题。他说,在
得知自己仓促做出的选择违背了确定事件推理原则之后,他回家
进行了反思,并修正了他的判断。
假设你回答第一个问题时的思路与萨维奇及本书作者相同,即你认为10亿美元已经远超你的需要,超过这个金额的资金可带
来的效用基本为零,因此你选择了A而非B。那么,在回答第二
个问题时,出于同样的原因,你可能会继续选择A而非B。
假设你在回答第一个问题时的思路与很多人一样,即如果你
选择B,并且不幸地抽到了不可能中奖的90号彩票,那么你的心情肯定会非常糟糕(你会觉得自己十分愚蠢,而且无比懊悔),因此你选择了A而非B。如果你真的这样想,那么90号彩票的实
际收益就不是零,而是负数。如果你在意这些感受,就必须把它
们视为结果。如果考虑了这些结果,你的选择就没有违背独立性
原则。。
在回答阿莱的问题时,许多人(虽然不是所有人)似乎都违
背了看似合理的理性偏好原则。不久,丹尼尔·埃尔斯伯格又提出
了一组稍有不同的问题。( D. ellsberg, “Risk, Ambiguity and the Savage
Axioms,” Quarterly Journal of Economics 75 (1961): 643–69.)
为了展示涉及风险(客观概率已知)的选择与涉及不确定性
(客观概率未知)的选择有哪些不同,曾泄露美国五角大楼秘密
文件( If you don’t know what the Pentagon papers are, you should find out.)的埃尔斯
伯格提出了一组问题。在区分这两类选择并强调这样做的重要意
义时,他沿用了经济学家约翰·梅纳德·凯恩斯(John Maynard
Keynes)( J. M. Keynes, A Treatise on Probability (London: Macmillan, 1921).)和富
兰克·奈特(Frank Knight)( F. H. Knight, Risk Uncertainty and Profit (Boston:
Houghton Mifflin, 1921).)的方法,后者的方法源自约翰·斯图尔特·穆勒
(John Stuart Mill)( J. S. Mill, A System of Logic: Ratiocinative and Inductive
(London: Harrison, 1843).)。埃尔斯伯格的第一个问题清晰地展示出两
类选择的不同之处:
有两只罐子。第一只罐子中装有100个球,包括红球和黑
球,但我们不知道两者的比例。不过,我们知道第二只罐子中有
50个红球和50个黑球。假设你面对两个赌注:一是从第一只罐子中取出的是一个红
球,则赢得100美元;二是从第一只罐子中取出的是一个黑球,则赢得100美元,你愿意选择哪一个?(受试者对这两个选项的
态度通常是没有差别。)
这是人们在面临不确定性(亦称模糊性)时的选择。
假设你面对的是这样两个赌注:一是从第二只罐子中取出的
是一个红球,则赢得100美元;二是从第二只罐子中取出的是一
个黑球,则赢得100美元,你愿意选择哪一个?(受试者的典型
反应同样是没有差别。)这是人们在面临风险时的选择。
根据主观概率理论,有人在做这些选择时赋予红球和黑球
(包括从第一只罐子和第二只罐子中取出的红球和黑球)的主观
概率都是12。但现在又出现了第三道选择题:一是从第一只罐子
中取出的是一个红球,则赢得100美元;二是从第二只罐子中取
出的是一个红球,则赢得100美元,你会如何选择?
一些受试者认为两个选项没有差别,但许多人强烈倾向于选
择第二只罐子,也就是红球和黑球比例已知的那只罐子。如果决
定输赢结果的是黑球,他们同样强烈倾向于选择第二只罐子。这
是人们在不确定性和风险之间做出的选择。
如果你也做出了这样的选择,就不要急着阅读下文,先花一
分钟时间思考一下你的理由是什么。
你的偏好有多强?你愿意押注红球和黑球比例已知的罐子还
是比例未知的罐子呢?受试者对第二只罐子的强烈偏好似乎与预期效用决定偏好的
原则不一致。这表明,他们认为在两种情况下,抽到红球和黑球
的概率都是相等的。而且,概率之和为1。但这样的话,从第一
只罐子抽取小球的期望收益应该和从第二只罐子抽取小球的期望
收益相同。
因此,对埃尔斯伯格问题的常见回答必然至少违背萨维奇的
一条原则,但到底是哪些原则呢?我们可以把范围缩小为有序性
和独立性。如果你想了解埃尔斯伯格的例子到底违背了有序性还
是独立性原则,可以参阅本堂课的附录部分。
如果你在思考这些问题时做出了不同于埃尔斯伯格示例的选
择,你能找出其中的原因吗?有些人总是担心在不确定的情况
下,自己可能会上当受骗。虽然他们不知道自己会如何被骗,但
他们认为自己会被骗。如果你有这种感受,这个问题测试的其实
就不是萨维奇原则。
有些人在不确定的情况下做决策会感到不舒服,但在面对风
险的情况下做决策却没有这种感受。我们有什么理由认为他们不
该如此呢?(还有一些人在不确定的情况下做决策会感到无比激
动,而在面对风险的情况下做决策则没有这么强烈的感受。我们
又有什么理由认为他们不该如此呢?)但是,如果在回答埃尔斯
伯格的问题时有这种心理感受,它们就应该被视为结果的一部
分。如果把它们考虑在内,萨维奇原则就不会有反例了。启发法和偏见
1974年,阿莫斯·特沃斯基和丹尼尔·卡尼曼发表了论文《不
确定情况下的判断:启发法和偏见》(Judgement Under
Uncertainty: Heuristics and Biases),( A. Tversky and D. Kahneman,“Judgment under Uncertainty: Heuristics and Biases,” Science 185 (1974): 1124–31.)对
主观效用理论可能重复产生的偏差进行了详尽的描述。之后,他
们及其他人通过后续研究又发现了更多的偏差。他们认为,这个
领域与心理学的其他领域一样,快速判断都会受到启发法的影
响。这些启发法通常是正确、有效的,但在某些环境中它们会产
生“认知错觉”,致使人们误入歧途。随着时间和精力的投入,以
及对偏见的认知越来越深入,错误是可以修正的:
更透彻地理解这些启发法及其造成的偏见,可能有助于我们
在不确定的情况下做出比较准确的判断和决定。
这篇论文描述了可能导致偏见的三种启发法,即代表性启发
法、可得性启发法以及调整和锚定启发法。根据刻板印象做出的
判断就属于第一种启发法,它具有速度快的特点,准确程度通常
与一个人的刻板印象差不多,但容易导致人们对不一致的证据视
而不见。比如,如果对某个人的描述符合工程师的一般形象,那
么无论我们被告知这个人是从多名工程师和少数几名医生当中随
机挑选的,还是从多名医生和少数几名工程师中随机挑选的,对
我们判断这个人到底是工程师还是医生都没有任何影响。刻板印
象会挤出基本信息,只有进行更仔细的思考,才会用上这些基本
信息。第二种启发法根据一个人可以很容易想到的例子数量来判断
概率,因此会受到记忆力的影响。比如,清晰的记忆有可能使我
们对概率的判断产生偏差。如果新闻报道灌木丛火灾时配有触目
惊心的视频,就有可能让我高估灌木丛火灾的发生概率,即使火
灾发生在澳大利亚。如果你最近遭遇过某个事件(或者有与该事
件相关的遭遇),就有可能高估这类事件的发生概率。恐怖分子
擅长系统地利用这种启发法。
第三种启发法是锚定。我们从一个初始数字(锚)开始,经
过调整后得到最终的估算结果。能对初始数字提供建议的人,也
会影响最终的估算结果。所有的二手车销售员和房地产经纪人都
会利用锚定和调整效应。在东方的集市上,讨价还价已经变成了
一门艺术,锚定效用有时会被发挥到极致。本书的一位作者在世
界各地背包旅行期间,就曾在集市上砍过价。在他把价格砍到要
价的一半并准备付钱时,一个当地的朋友说,“等等,这个价格
太高了”。又经过一番讨价还价,最终成交价格是初始要价的
120。
心理学家知道,由于锚定效应产生的偏差可能会对各种数量
产生影响。特沃斯基与卡尼曼指出,如果对两个事件的初始概率
的调整不充分,就可能会高估合取概率而低估析取概率。
这篇论文也列举了其他例子,此外,卡尼曼还在他的著作
《思考,快与慢》(Thinking, Fast and Slow)中给出了更多的例
子。( D. Kahneman, Thinking Fast and Slow (New York: Farrar, Strauss and Giroux,2011). The two-process view that animates this enjoyable book should be seen as a
deliberate oversimpli-fication, and we recommend that the interested reader also consultthe original papers.)随着证据越来越多,认为主观概率从总体上看近似
于心理学的观点越来越不可信。框架
1984年,卡尼曼与特沃斯基在《美国心理学家》(American
Psychologist)杂志上发表了论文《选择、价值和框架》
(Choices, Values and Frames)( D. Kahneman and A. Tversky, “Choices,Values and Frames,” American Psychologist 39 (1984): 341–50.)。在这里,我们集
中讨论框架。阿莱等人的研究项目直接应用了框架理论,这削弱
了萨维奇原则,并建立了一个描述充分的决策理论。
他们通过下列选择题,证实了框架效应(framing effeets):
框架I
美国正在为一种即将暴发的致命疾病做防范准备。如果不采
取任何行动,预计将会有600人死亡。请在公共卫生项目中做出
选择。
1. 请从下面两个选项中做出选择:
A. 有200人获救。
B. 有13的概率挽救600人的生命;有23的概率无人获救。
2. 请从下面两个选项中做出选择:
A. 有400人死亡。
B. 有13的概率无人死亡;有23的概率死亡600人。卡尼曼与特沃斯基在一项调查中提出了这两个问题。他们发
现,在回答第一个问题时,有接近34的人选择A而非B;在回答
第二个问题时,有接近34的人选择B而非A。但事实上,这两个
问题的A、B选项并无区别,只不过措辞不同。
研究表明,依据措辞而不是依据内容做出选择的框架效应,普遍存在。特沃斯基及其同事发现,医生和病人在做一些攸关生
死的医疗决策时,可能都会尽量小心谨慎,但他们仍然会受到框
架效应的影响。( B. J. McNeil, S. J. Pauker, H. C. Sox Jr., and A. Tversky, “On the
elicitation of Prefer-ences for Alternative Therapies,” New England Journal of Medicine
306 (1982): 1259–62.)这个现象表明,贝叶斯定理的实际应用可以提高
医疗决策的整体水平。这是几名经验丰富的医生开展的一个项
目。( H. C. Sox, M. C. Higgens, and D. K. Owen, Medical Decision Making (New York:
Wiley, 2013).)在第6堂课上,我们将具体介绍贝叶斯定理。
卡尼曼与特沃斯基请受试者选出肺癌的首选治疗方案,但在
表述上他们分别选择了生存率和死亡率这两个不同的角度。
框架Ⅱ
生存率框架
手术治疗:在100个接受手术的人中,术后有90人存活,一
年后有68人存活,5年后有34人存活。
放射治疗:在100个接受放射治疗的人中,治疗后所有人均
可存活,一年后有77人存活,5年后有22人存活。死亡率框架
手术治疗:在100个接受手术的人中,术中及术后有10人死
亡,一年内有32人死亡,5年内有66人死亡。
放射治疗:在100个接受放射治疗的人中,治疗期间无人死
亡,一年内有23人死亡,5年内有78人死亡。
在生存率框架中,有18%的人倾向于选择放射治疗方案;而
在死亡率框架中,有44%的人倾向于选择放射治疗方案。( Amos
Tversky and Daniel Kahneman, “Rational Choice and the Framing of Decisions,” Journal
of Business 59 (1986): S251–78.)
再一次,由于描述方式不同,内容相同的观点得到的评价却
不同。这个现象没有违背独立性原则,也没有违背偏好的可传递
性原则,但它违背了相同的决策问题应该激起相同的偏好的原则
(通常是内隐的),即不变性原则,它是理性决策的规范原则。
我们看到,人类心理学与理性选择渐行渐远。面对阿莱问题
中表现出来的风险厌恶,一些理论家试图放弃独立性原则,以使
他们的理论与可观测的行为一致。面对埃尔斯伯格的问题,一些
理论家主张放弃独立性原则,还有人主张弱化偏好的有序性要
求。有些人认为他们的理论就像心理学一样,是纯粹描述性的;
但也有人认为他们的理论是规范性的。但为了与心理学取得一
致,似乎还有很多工作要做。( 数量庞大且还在不断增加的心理学与行为经
济学实验结果表明,有相当比例的人都有系统地违背几乎所有理论的行为。这些实
验还表明,违背理论的行为可分为几种,所违背的原则也因人而异。有的人甚至追
求期望效用最大化。)特沃斯基与卡尼曼得出的结论是,关于选择的描述性心理学
理论和关于选择的规范性逻辑学理论不是一回事。规范性理论
(逻辑学)是期望效用理论,而充分的描述性理论与规范性理论
之间必然存在系统的可观测的偏差。这并不意味着人们无法学会
及在有需要的时候使用逻辑,我们有足够的时间认真思考。这就
是卡尼曼所谓的“慢思”。
我们认为《波尔–罗亚尔逻辑》(The Port–Royal Logic)最
后一章的观点是正确的。下面这段文字引自这本书的第16章“关
于未来事件我们应该做出的判断”:
为了避恶趋善,我们必须对自己应该做什么加以判断。我们
不仅需要考虑善与恶本身,也要考虑它们发生或不发生的概率,还要直观地考虑它们在整体中所占的比例。
这些考虑可能看似微不足道,如果仅此而已,那么确实如
此。但是,我们可以让它们发挥重要作用,其中最主要的作用就
是让我们更合理地面对希望与恐惧。( The Port Royal Logic, tr. Thomas
Spencer Baynes (edinburgh: James Gordon, 1861): 367–68.)
期望效用理论是一种可以提高思维能力的工具。小结
与其他领域的推理一样,人类在进行概率推理的过程中也经
常犯错误。
有些错误具有系统可重复性,虽然不是人人都会犯这样的错
误,但犯这些错误的人有很多。这些错误包括阿莱的风险厌恶问
题,以及埃尔斯伯格的对已知概率的偏好大于未知概率的问题,卡尼曼和特沃斯基发现的一系列效应将这些问题联系在一起。系
统错误可以通过会产生重要结果的决策(比如医疗决策)的相关
理论训练予以纠正;出于商业或政策原因,系统错误还有可能被
加以应用,比如行为经济学。
某些错误(我们认为它们是错误)违背了理性决策的某个假
设,比如独立性或有序性。但卡尼曼和特沃斯基强调,还有一些
错误事实上违背一致性。对于相同的选择,框架(收益或者损
失)不同,个体的评价结果也不同。
概率心理学和概率逻辑学因此分道扬镳。附录1 埃尔斯伯格:有序性还是独立性?
在埃尔斯伯格的例子中,如果受试者同时遵循有序性和独立
性原则,就不会偏离期望效用。那么,受试者违背的到底是有序
性还是独立性呢?为了回答这个问题,埃尔斯伯格建议我们把第
一只罐子中的小球全部标记为“Ⅰ”,把第二只罐子中的小球全部
标记为“Ⅱ”,之后把所有小球装到一只罐子中。现在,这只罐子
中一共有200个小球,一部分是红Ⅰ,一部分是黑Ⅰ,还有50个
红Ⅱ和50个黑Ⅱ。然后,我们研究一下围绕这只组合罐子设定的
各种赌注的偏好情况。下面介绍的方法是由肯尼斯·阿罗
(Kenneth Arrow)向埃尔斯伯格建议的。
假设有4个赌注,收益情况参见下表。由于赌注Ⅰ和赌注Ⅳ
中收益为a和b的小球各有100个,因此这两个赌注都只涉及风
险,假设对你而言它们没有任何区别。此外,对赌注Ⅱ和赌注Ⅲ
而言,由于我们没有理由认为抽中红Ⅰ与抽中黑Ⅰ的可能性有大
小之分,而且这两个赌注具有相同的不确定性,因此可以假设它
们对你来说没有任何不同。模糊厌恶(ambiguity aversion)表现为对赌注Ⅰ或Ⅳ的偏好
程度高于Ⅱ或Ⅲ,但我们假设你认为Ⅰ和Ⅳ以及Ⅱ和Ⅲ之间没有
任何不同。因此,如果你的偏好具有有序性,而且你有模糊厌恶
心理,你就会偏好Ⅰ和IV而非Ⅱ和Ⅲ。在这种情况下,你违背了
独立性原则。
你对Ⅰ的偏好程度高于Ⅱ。根据独立性原则,你的偏好并非
取决于那些收益相同的情况,而取决于下表中用粗体标示的其他
情况。
同样,你对Ⅳ的偏好程度高于Ⅲ,是因为你的偏好取决于下
表中用粗体标示的情况。
所有的一切都取决于黑Ⅰ和红Ⅱ带来的收益。鉴于此,你对Ⅳ的偏好超过Ⅲ,同时对Ⅰ的偏好超过Ⅱ,从下表可以看出,你
的偏好不具有相关性。附录2 动态一致性与阿莱
假设与阿莱一样,你的偏好也违背了独立性原则,那么你有
可能面临霍华德·雷法于1968年提出的动态一致性问题。( H. Raiffa,Decision Analysis (Reading, MA: Addison Wesley, 1968).)
你应该还记得,在回答问题1时,你对选项A的偏好程度高于
B:
而在回答问题2时,你对选项B的偏好程度高于A:
这就会带来一个问题:如果有人告诉你中奖彩票不在1~89号
之列,那么你倾向于选择哪个选项呢?也就是说,在下面两个选
项中,你倾向于选择哪一个呢?假设你倾向于选A',那么在回答问题2的一个变体时,你就
会遇到麻烦。(如果你倾向于选B',那么在回答问题1的一个变
体时,你同样会遇到麻烦。)
在回答问题2时,你对B的偏好超过对A的偏好,但如有有人
告诉你中奖彩票不在1~89号之列,你的偏好就会颠倒过来,对
A'的偏好将超过对B'的偏好。
假设你拥有问题2的选项A,但你倾向于选B,那么你可能需
要付出一定的代价(e),用A从一位友好的经纪人那里交换B。
随后,中奖彩票是否在1~89号之列的消息被发布出来。如果在,你就会损失e。在这种情况下,那位友好的经纪人提出,他愿意
与你再次交换彩票,但他需要收取一笔较小的费用e'。由于你对
A'的偏好超过对B'的偏好,因此你接受了这笔交易。
就这样,你一共损失了e+e'。你的经纪人利用你的动态不一
致性,从你手中购买资产,再将其出售给你,从中赚取利润。
[如果你认为A'与B'没有任何差异,那么你愿意再次交易,但不
愿意为之付出任何代价。在这种情况下,经纪人为了完成第二次
交易,甚至愿意支付给你e2,即使这样他仍然有收益。]只要违
背了确定事件原则,就有可能遭遇这个案例讨论的情况。第4课 频率与概率之间有什么关系?
雅各布·伯努利早期从事概率研究的人都意识到,在直觉上依赖等可能情况
具有一定的局限性。17世纪的伟大哲学家莱布尼茨对将新的概率
计算方法应用于医疗、法律、商业等实际事务的做法寄予厚望,雅各布·伯努利也抱有同样的想法,因此两个人进行了深入的书信
交流。( See e. D. Sylla, “The emergence of Probability from the Perspective of the
Leibniz– Jacob Bernoulli Correspondence,” Perspectives on Science 6.1 and 2 (1998): 41–
76.)他们决定从频率入手,为概率判断寻找证据。很多务实的人通
常都会采用这种做法。即使在今天,如果你问一位科学工作
者“概率为13”意味着什么,他通常会答道:它意味着如果长时间
地进行相似的实验,在大约13的时间里该事件会发生。本堂课将
讨论这个答案的优缺点。
莱布尼茨和伯努利本人并没有利用频率来确定概率。对他们
来说,概率就是合理置信度的一种表现形式。那么,频率和概率
在形式上到底有什么联系呢?雅各布·伯努利运用大数定律,即我
们本堂课要介绍的关于概率的第4个伟大思想的一个变体,成功
地给出了部分答案。
大数定律确立了概率和频率之间的一个非常重要的联系。伯
努利在《猜度术》里证明的是大数定律的初始形式,即弱大数定
律。( Written about 1689, published posthumously in 1713. english translation by e. D.
Sylla as J. Bernoulli, The Art of Conjecturing, Together with Letter to a Friend on Sets in
Court Tennis (Baltimore: Johns Hopkins University Press, 2006).)后来,波莱尔
(émile Borel)与坎泰利(Francesco Cantelli)通过加强弱大数定
律,提出了强大数定律。不过,强大数定律需要更强大的数学框
架。大数定律这个伟大思想有一个声名狼藉的孪生兄弟。很多科
学家认为,概率就是频率,或者说两者非常接近,进一步研究这
个问题是不值得的。这个观点因为有一个伟大的孪生兄弟而赢得
了很多人的信任。接下来,我们先介绍17世纪的那个伟大思想,然后提醒大家注意它的那个声名狼藉的孪生兄弟,最后探讨20世
纪的频率研究。雅各布·伯努利与弱大数定律
雅各布·伯努利证明了第一个大数定律。通过足够多次的抛硬
币实验,结果为正面朝上的相对频率就有可能无限接近正面朝上
的概率。
伯努利想要确定从罐子中取(取后放回)多少次小球,才可
以保证相对频率落在概率周围特定区间的可能性达到某个程度。
下面,我向大家介绍我举这个例子的目的。假设一只罐子中
装有3 000块白色鹅卵石和2 000块黑色鹅卵石,但你并不知道它
们的数量。你决定通过实验来确定鹅卵石的数量(之比),于是
你不停地从罐子中取出鹅卵石(每次取一块,然后把它放回罐子
中继续做实验,确保罐子中鹅卵石的数量不变),并分别记录取
出白色鹅卵石和黑色鹅卵石的次数。实验的目的是弄清楚在经过
很多次尝试后,取出白色鹅卵石与取出黑色鹅卵石的次数之比正
好是3∶2(即两种鹅卵石的数量之比)的可能性,是否有可能达
到其他情况的十倍、百倍、千倍乃至更多倍(至少达到确有把握
的程度)。
很快,他又采取了一种更加谨慎的说法,宣称这是一个频率
是否会落在某个概率区间内的问题。他说,如果频率等于概率,那么多次重复实验只会让事情适得其反。在这一点上,频率和机
会明显被视为两个截然不同的事物。
考虑到概率、期望区间以及频率落在该期望区间内的很大可能性,伯努利(根据独立性默认假设)推导出了所需实验次数上
的上限,他称之为黄金定理。随后,伯努利又推导出大数定律。
我们知道,伯努利喜欢在实证研究中使用界限这个概念,但
他在这方面做得并不太好,很容易让人联想到大量的实验。《猜
度术》以一个例子结尾。已知概率是35,相对频率的期望区间的
上限和下限分别是2950和3150,频率落在该区间内的期望概率
是1 0001 001。伯努利的界限表明,如果实验次数至少为25 550
次,就可以达到这个期望概率。我们拥有这个量级的数据集,但
在伯努利生活的时代却是遥不可及的。( Stigler suggests that this may be
why Bernoulli did not publish Ars Conjectandi in his lifetime. See S. Stigler, The History
of Statistics: The Measurement of Uncertainty before 1900 (Cambridge, MA: Harvard
University Press, 1990).)伯努利骗局与频率主义
雅各布·伯努利推导黄金定理的目的是根据经验数据确定概
率,因为他深知,通过计数对称性情况的数量来确定概率的做
法,在许多领域是行不通的。……试图通过这种方式来确定概率,显然是非常愚蠢的做
法。然而,我们可以用另一种方法来达成目标。它虽然无法给我
们先验概率,但我们至少可以确定后验概率,也就是说,可以通
过反复观察相似例子的结果来获取概率。这是因为我们应该假
设,之前在类似环境中发生或者未发生的每一种现象,都有可能
在同等数量的情况之中出现或者不出现。
所谓根据频率确定后验概率,指的是在实验次数及成功实验
的相对频率等数据已知的条件下,求概率落在某个区间内的可能
性。显然,伯努利解决的并不是这个问题。他解决的是根据概率
推导频率的问题,而不是根据频率推导概率的反演问题(inverse
problem),后者是由托马斯·贝叶斯解决的。
但是,雅各布·伯努利却认为自己解决了反演问题。为什么
呢?他借助“确有把握”这个概念,含糊地证明自己解决了这个问
题。“确有把握”是指概率非常接近1,以至于人们几乎可以将其
视为确定性事件。伯努利的第9条“一般规则或公理”指出:
然而,由于完全确定很难实现,因此必要的和惯常的做法
是,将确有把握视为绝对确定。(伯努利提出把9991 000的概率视为确有把握的合理性标
准。)
伯努利认为他已经证明,只要实验的次数足够多,相对频率
就确有把握(近似)等于概率。但是,如果频率等于概率,概率
也就等于频率。因此,伯努利进一步认为根据频率推导概率的问
题也得到了解决。这就是伯努利骗局,它其实根本经不住仔细推
敲。条件概率分散在不同方向上,概率的期望区间大小不一,概
率落在期望区间之内的概率也不同。
确切地说,伯努利的条件概率是在概率确定条件下关于频率
的概率,而不是在频率确定条件下关于概率的概率。
它们指的是概率已知时频率落在特定频率区间内的概率,而
不是频率已知时概率落在特定区间内的概率。伯努利给出的是在
某一次实验中概率已知情况下频率落在某个区间内的概率,而不
是频率已知时概率落在某个区间内的合理置信度。
认为大数定律可以解决反演问题的观点是一个谬论,但它有
很强的迷惑性,( 在适当的条件下,它的结论有可能近似正确,但即使这样它也
仍然是一个谬论。想要正确评估这个结论,我们需要先了解贝叶斯的观点(参见第6
课),然后是菲尼蒂的观点(参见第7课)。)尤其是它的非正式表述。而
且,这个谬论非常顽固,如果不进行缜密思考,就很容易轻信
它。我们发现法国数学家、哲学家安东尼·库尔诺(Antoine
Cournot)就掉进了这样的陷阱,( A. A. Cournot, Exposition de la théory des
chances et des probabilités (Paris: Hachett, 1843). See the discussion of the history of this
idea in G. Shafer and V. Vovk, “The Sources of Kol-mogorov’s Grundbegriffe,” Statistical
Science 21 (2006): 70–98.)他认为小概率事件应该被视为不可能发生的事件。他还认为这一原则( ......
您现在查看是摘要介绍页, 详见PDF附件(8165KB,372页)。





