不要相信你的直觉

最近在复习概率论，看到了一些有趣的问题，于是顺道上网整理了一些相关问题，归纳如下。

我看完的结论就是：不要相信你的直觉，人的本能感觉通常是和概率统计相悖的。

辛普森悖论问题

1986 年，为了对比肾结石治疗中两种手术的优劣，有人统计了接受这两种手术的病人数量和成功率。在统计中，作者按照严重程度把病人分为大块结石和小块结石两组，然后分别统计了两组病人中手术 A 和手术 B 的成功率。得到的结果可以清晰地展示在下面的这个表格中：

           手术A          手术B
小块结石  93%(81/87)    87%(234/270)
大块结石  73%(192/263)  69%(55/80)
总计     78%(273/350)  83%(289/350)

让我们来一行行地看一下这个表格。先看第一行：对于小块结石的病人，手术 A 的成功率为 93%，手术 B 的成功率只有 87%。很明显，手术 A 胜出。（表格中百分比后面的两个数字分别是成功案例数 / 总案例数）。我们再看第二行：对于大块结石的病人，手术 A 的成功率为 73%，手术 B 的成功率只有 69%。手术 A 再次胜出。数字是不会说谎的。看到这里，我们似乎已经可以得出结论了：无论对于小块结石还是大块结石的病人来说，手术 A 都有着较高的成功率。这个结论背后有坚实的数据作为支撑，证据确凿，铁证如山。如果你得出了这样一个结论，请继续往下看第三行，你的内心可能会在一瞬间崩溃。第三行中不再把病人分为大小结石两组，而是显示了每种手术在所有病人中的成功率。根据第三行的数据，手术 A 在所有病人中的成功率为 78%，手术 B 在所有病人中的成功率为 83%。这样看起来，好像手术 B 的成功率又比较高！

为什么分开比较时手术 A 在每组病人中都有较高的成功率，但进行合计后手术 B 反而有较高的成功率？

真实结论

由于在总样本中占据了较大的数量，右上和左下的两个格子中的成功率对比直接决定了合计行中两种手术的成功率对比。

所以这个结果这与我们的直觉正好相反：直觉告诉我们如果手术 A 在两组病人中都更好，那么在所有病人中也应该更好。

变种/类似问题

有人统计【雷阿伦】和【科比】的职业生涯统计，发现无论两分球命中率还是三分球命中率，【雷阿伦】都高于【科比】，但总命中率【科比】却高于【雷阿伦】。

这是违反直觉的。一般人认为，如果一个人的两分球和三分球都更准，那么总体也应该更准才对。

但问题的关键在于：两分球和三分球在两人出手中所占的比重不同，所以不能进行直接的比较。

举一个极端的例子：

【科比】和【雷阿伦】都投球1000次。
其中【科比】投了 999个两分球，命中460个；投了1个三分球命中0个。
其中【雷阿伦】投了500个两分球，命中250个；投了500个三分球命中200个。

可得：

【科比】两分球命中率为 ⁴⁶⁰⁄₉₉₉ = 46%, 三分球命中率为 0/1 = 0%, 总命中率为 (460+0)/1000 = 46%
【雷阿伦】两分球命中率为 ²⁵⁰⁄₅₀₀ = 50%, 三分球命中率为 ²⁰⁰⁄₅₀₀ = 40%, 总命中率为 (250+200)/1000 = 45%
结论完全符合描述。

补充说明

Two-Child Paradox （两孩悖论）也是同样的问题。

张大伯买米问题

农民张大伯去买一斤小米。米店老板掏出一个秤，放在地上，随手拿起一把刀割破了一个米袋，抱起来，米就从破口处哗哗哗的掉到秤上，（类似于拿着茶壶倒茶的样子）。等到秤的示数为一斤时的瞬间，老板堵住了米袋子的口子，然后把秤上的小米给了张大伯。

张大伯心满意足的走在回家的路上，心中感慨老板真是个豪爽的人。

突然，他觉得不太对劲：小米在落在秤盘上时应该会产生一个力……所以他买到的米其实不足一斤。他感到吃亏了，准备回去找米店老板理论。

那么张大伯实际上吃亏了吗？

真实结论

并没有吃亏。张大伯得到的米，确实不多不少，正好一斤。

袋子拿的越高，产生的冲量的确越大，但，在空中的小米也越多。落到秤上产生瞬间冲力的小米，和空中被忽略计算的小米，这两者重量恰好相等。

补充说明

推导公式还是比较简单的。可以网上看看。

信息瀑布问题

一个课室的讲台上有一个箱子，里面有两种颜色的小球：红色和蓝色，各自种类数量不相同。

现在班上的同学开始排队取小球。按照顺序，每一个人取了一个小球，自己偷偷看完后，再将小球放回箱子（这样后面的同学抽蓝色的球概率不变），并且宣布一个自己的对箱子中主要的球的主要颜色的猜测（即猜红色多还是蓝色多）。

假设所有同学是绝对理性人，他的猜测是根据自己所掌握的信息（自己抽出小球颜色和之前的人宣布的猜测）最大化自己猜测的正确性。

那么：

如果前面两个人的猜测都是蓝色，那么第3，第4到第n个人宣布自己猜测为蓝色的概率是多少？

真实结论

100%。即，只要前两个人意见一致，后面的人足够理性，那么全部人的意见将绝对一致。

分析如下：

第一个人，抽到什么颜色小球，理性来说，他就会猜测该色小球多，因为他没有其他判断参考条件，而他抽到较多颜色的小球概率p的确更大。所以自身小球颜色 X1，完全影响最终决策 Y1。我们记错 X1 -> Y1。

第二个人，他有两个参考因素，一个是第一个人的预测，一个是自己抽到的小球颜色。如果两者不一致，他就只能丢硬币做随机预测，可能 X2 -> Y2, 也可能 Y1 -> Y2；如果两者一致，那么毫无疑问，（X2 = Y1）-> Y2。

第三个人的时候就有意思了。

如果前两个人意见一致，那么他会抛弃自己所见到的的小球颜色，直接和前两者相同，因为他参考的信息三个，Y1， Y2 和 X3。他会选择多数。所以， Y3 = Y2 = Y1。那么信息瀑布就形成了，他之后的所有人，都不会再关心自己手中小球的颜色，一定会预测相同的颜色。

而如果前两人意见不一致，即Y1 不等于 Y2。那么对于第三个人来说，他就可以忽视前两人的意见，其预测，也完全取决于自己手中小球的颜色。于是 X3 -> Y3。你会发现，他的决定和第一个人完全一致。而这种情况下，第四个人，则会和第二个人处于完全相同的状况，他会忽略第一个人第二个人的意见和处理过程。

所以，对于第二种情况，我们可以简单地认为，前两个人直接消失，将第三个人视为第一个人，第四个人视为第二个人。那么依然，只要第三个人和第四个人的意见一旦一致，那么信息瀑布就发生了。

当人数越多，那么2n和2n+1的意见不一致在概率将会越小。

所以，信息瀑布一定会发生，而且触发信息瀑布，只需要接连两人意见一致就足够了。

补充说明

所以，羊群效应（盲目跟风），其实是很理性的行为……

另外，海盗分金问题和这个题目有一定的关联相似性。

纳什均衡问题

你正在图书馆枯坐，一位陌生美女主动过来和你搭讪，并要求和你一起玩个数学游戏。美女提议：“让我们各自亮出硬币的一面，或正或反。如果我们都是正面，那么我给你3元，如果我们都是反面，我给你1元，剩下的情况你给我2元就可以了。”那么该不该和这位姑娘玩这个游戏呢？这基本是废话，当然该。问题是，这个游戏公平吗？

真实结论

不公平。只要美女以 3正5反的方式亮出硬币，最终你的收益将是 -¹⁄₈ 次/元。

简单感觉是，俩人丢硬币，都是正面的概率是1/4，都是反面也是1/4，一正一反的概率是1/2，那么通过这个游戏，我的收益似乎是 ¹⁄₄ * 3 + ¹⁄₄ * 1 - ¹⁄₂ * 2 = 0

但我们假设自己以 x 的概率出正面（0 <= x <= 1），而美女以 ³⁄₈ 的概率出正面，那么总收益是

³⁄₈ * 3 * x + ⁵⁄₈ * 1 * ((1-x) - (³⁄₈ * (1-x) + ⁵⁄₈ * x) * 2) = - ¹⁄₈

友情悖论问题

“一个人的朋友数量往往比他朋友的朋友数量要少。”这句话是否成立？

真实结论

这句话成立。

我们假设下图中两人连线，则代表是朋友。

A-B-D
  | /
  C

那么A,B,C,D的朋友数量是1,3,2,2，平均数是 ⁸⁄₄ = 2 而A的朋友的朋友是3（来自B） B的朋友的朋友是1（来自A），2（来自C），2（来自D） C的朋友的朋友是3（来自B），2（来自D） D的朋友的朋友是3（来自B），2（来自C）最终，A,B,C,D朋友的朋友平均数是： ¹⁸⁄₄ = 2.25个。

看起来，他们的朋友，都比他们自己受欢迎。

补充说明

这个结论对个人意义不太大，但偶尔也可以拿来解释“为什么一个人的EX数量，通常没有他/她的EX的EX数量多……”

三门问题

最早来源于一个美国的电视节目。在节目中，参赛者会面对三扇门，其中一扇门后是一辆汽车作为奖品，另外两扇门后各有一只山羊。

主持人首先会让参赛者选择一扇门，选定之后，主持人会在剩下的两扇门里打开一扇后面是羊的门（主持人知道车子在哪扇门后），以增加现场气氛。接下来，主持人会问参赛者，你现在还有一次机会换一扇门，要换吗？

真实结论

要换。换完中奖率是2/3，不换的话中奖率是1/3。

该问题网上很多细节解释，用穷举法也很容易证明。

补充说明

我们看个简化的问题：

某家有两个孩子，已知年纪大的为男孩，那么另一个孩子是男孩的概率是？ ¹⁄₂
某家有两个孩子，已知至少有一个是男孩，那么另一个孩子是男孩的概率是？ ¹⁄₃

因为结果坍塌了。

此时，我们产生第三个问题：

某家有两个孩子，已知其中有一个是男孩且出生于星期二，那么另一个孩子是男孩的概率是？

答案是： ¹³⁄₂₇

你彻底理解了吗？

凶手问题

假设我们在一起谋杀犯罪现场找到了一枚凶手留下的指纹，警察将这个指纹和随机 20000 个人的指纹进行对比后，找到了一个与现场指纹吻合的嫌犯。

现在，这名嫌犯被带上法庭，并被指控为杀人凶手。

法庭上的专家告诉你，现代的指纹对比技术的正确率为 99.99%。换句话说，这种比对技术把两个人的指纹误认为同一个的几率只有万分之一。

如果你现在是法官的话，你会怎么去判断这件事情？这是不是意味着这名嫌犯无罪的概率只有万分之一？

如果警方用来进行对比的 20000 人全部都是无辜群众，那么用凶手的指纹和他们进行逐一对比后，至少产生一例吻合的几率是多少？

真实结论

20000 人全部都是无辜群众，技术正确率为99.99%的情况下，至少产生一个吻合的几率是86%。

因为该指纹比对机器，连续对两万次的概率是 0.9999 的两万次方=0.14，剩下的 0.86 就是至少出一次错的概率。

变种/类似问题

假设你的Team有50个人，那么他们中间俩个人生日是同月同日的概率有多少？

答案：97%

假设一年有365天，50个人的生日都不同月同日的概率为：

第一个人可以完全随机一天生日，所以概率为 100% 第二个人不能和第一个人同一天生日，所以生日只能是剩余的364天之一， 364/365。第三个人不能和前面的人同一天生日，所以生日只能是剩余的363天之一， 363/365。

P(50) = 1 * (1-¹⁄₃₆₅) * (1-²⁄₃₆₅) * …. * (1 - (50-1)/365) = 0.03

所以，随机50个人，会有97%的概率，有俩人生日正好是同月同日。

长绳问题

假设有一条长度为L的绳子，其长度刚好围地球赤道一圈。现在我们将这个绳子增加15米，请问再次围绕地球赤道一圈，如果绷紧了绳子，那么绳子与地面之间会有缝隙，求绳子距离地面的这个缝隙多高？

有1厘米吗？有1毫米吗？

真实结论

缝隙高2.38米。

假设地球半径为 r ,则绳子长为 L = 2 * 3.14 * r = 6.28r

现在绳子长为L + 15 = 6.28r + 15

我们假设地球增大了，新地球半径为R

6.28r + 15 = 2 * 3.14 * R ===> R = r + 2.38

红眼病自杀问题

说一个岛上有100个人，其中有N个红眼睛，其他的都是蓝眼睛。这个岛有三个奇怪的宗教规则。 1. 他们不能照镜子，不能看自己眼睛的颜色。 2. 他们不能告诉别人对方的眼睛是什么颜色。 3. 一旦有人知道了自己的眼睛颜色，他就必须在当天夜里自杀。

某天，有个旅行者到了这个岛上。由于不知道这里的规矩，所以他在和全岛人一起狂欢的时候，不留神就说了一句话：【你们这里只有红眼睛和蓝眼睛的人。】

最后的问题是：假设这个岛上的人足够聪明，每个人都可以做出缜密的逻辑推理。请问这个岛上将会发生什么？

真实结论

在旅行者说这句话的第N天，他们全部都会自杀。

如果这个岛上只有1个红眼睛，其他人都是蓝眼睛。那么，当旅行者说了这句话之后，此人立刻就会知道自己是红眼睛，他就会在当天自杀。即，当n取第一个值n0=1时，命题成立。

假设当这个岛上有N个红眼睛的时候，在旅行者说了这句话之后的第N天，这些红眼睛会全部自杀。

那么，当这个岛上有N+1个红眼睛的时候，在每个红眼睛看来，岛上都确定有N个红眼睛，并等待着他们在第N天自杀。而在第N天，大家都没有自杀。所以一到第N+1天，每个红眼睛都明白了这个岛上还有第N+1个红眼睛——他自己。于是大家都在第N+1天自杀了。

所以命题得证：如果这个岛上有N个红眼睛，那么在旅行者说这句话的第N天，他们全部都会自杀。

补充说明

典型的数学归纳法。

其他

1

100斤苹果，含水量90%，放了几天缩水了，含水量80% 问苹果现在还剩多少斤？

答案是： 50

2

前提假设生男孩和女孩的概率都是1/2。一个女孩多男孩少的国家实施这么一条政策：夫妇必须生孩子生到有男孩为止。请问长此以往，该国家的男女比例。

答案是： 1:1

不要相信你的直觉

辛普森悖论问题

真实结论

变种/类似问题

补充说明

张大伯买米问题

真实结论

补充说明

信息瀑布问题

真实结论

补充说明

纳什均衡问题

真实结论

友情悖论问题

真实结论

补充说明

三门问题

真实结论

补充说明

凶手问题

真实结论

变种/类似问题

长绳问题

真实结论

红眼病自杀问题

真实结论

补充说明

其他

1

2

FreeKnight.Wong

周记20230220-20230226

周记20230213-20230219

周记20230130-20230212

周记20230122-20230129

周记20230114-20230121

2023年，一切重新开更

双月记202102-03

月记202101

美术流程整理

2020年记