首页 趣味数学题正文

奇妙的不确定性,猴子能偶然敲出莎翁全集的概率有多大?

xiawuyouke 趣味数学题 2022-01-14 18:01:53 33 0 概率

限猴子定理(Infinite monkey theorem)指的是无限次在打字机上随意敲击键盘最终能打出任何作品,甚至是莎翁全集,该论断最早似可追溯至 1913 年法国数学家埃米尔·博雷尔所著的一本概率书中,并自此在流行文化中反复出现。

如何模拟这样一只“能敲出莎翁全集的猴子”呢?简单来说,就是写个程序,先生成大批随机字符,再将这些字符与莎翁全集进行匹配。该程序最终由程序员亚伦·罗素(Aaron Russell)完成,并命名为“猴子模拟器”,下载链接附于文末参考资料处。

猴子模拟器能够随机生成 31 种字符,包括 26 个英文小写字母、空格、逗号、句号、分号和连字符。随机生成四个字符后,程序就会在莎翁全集的纯文本库中检索匹配项(字母大小写不做区分)。若程序检索到一个或多个匹配项,它会在原字符串末尾追加生成一个字符,同时再次检索匹配项,以此推进,直到无匹配项为止,然后,程序会再生成一组四个字符的新随机序列循环上述过程。随机字符生成速度为每秒 50 个(注意,该程序单循环检索上限为 36357 次,同时也无法匹配除上述 5 种外的其他标点符号,如莎翁原文中的 10475 处问号和 8827 处感叹号。)


奇妙的不确定性,猴子能偶然敲出莎翁全集的概率有多大?


上方截图为程序生成了序列"y sak"并匹配到" and for my sake even so doth she abuse me(而她正是为了我才把我欺)",该句出自莎翁十四行诗 第 42 首 。实际上,“y sak”与莎翁全集有 37 处匹配,这只是其中一项。

此外,在 1.13 亿秒后,就是 50 只猴子每秒打一个字符的速度,大约需要 26 天。最长的匹配项是“ we lover(我们情人)”,出自莎翁《爱的徒劳》,第 2 幕第 1 场 中鲍益一句台词:“ With that which we lovers entitle affected(他染上的是我们情人们所说的相思病)”,若无限猴子定理论断正确,只要时间足够,模拟器便能生成莎翁全集。下面我们计算生成概率。注意,字符从第一个"T"算起(The complete works···),莎翁全集共计约 5000000 个字符(包括空格)。

如果对猴子不要太苛刻要求的话,不考虑区分字母大小写和特殊标点,那么每个字符位可能出现 31 种情况(参见段二所述)。因此,首个生成字符匹配原文的概率是 1/31,头两个字符都匹配的概率就是 1/(31 × 31),即 1/961。进而,莎翁全集从头到尾都匹配的概率就是 1/31^5000000,约等于 1/10^(1·5×5000000),即 1/10^7500000 。换言之,理论上每次猴子都有 1/10^7500000 的概率敲出莎翁全集,这一概率相当小。注意到 10^7500000≈2^25000000,这与抛一枚硬币 25000000 次,每次结果都是正面朝上概率相当。

再以彩票为例,中头奖的概率约 1/14000000≈10^7.1。那猴子敲出莎翁全集这件事就相当于连续赢得约 1000000 个彩票头奖(10^7500000 约为 10^7·1 的 1000000 次方)。差不多也就是每周买张彩票,每周都中头奖,还要连着中两万年。当然,在现实生活中,这无疑太扯淡了。


奇妙的不确定性,猴子能偶然敲出莎翁全集的概率有多大?


但这对于理论上存在的猴子而言只是时间问题...

尽管这只可怜猴子随机敲出 500 万字莎翁全集的概率如此之低,但它终归还是概率学意义上的可能事件。按数学期望,我们得在猴子第 10^7500000 次随机敲出 500 万字后,才看得到这部全集。即便是用每秒生成 50 字符的猴子模拟器,恐怕也得等上相当久的时间。

下面就来计算这一等待时间。已知等待时间问题服从几何分布:

如果 p 是某事件发生的概率,该事件独立且试验次数不限,那么该事件在第 n 次试验首次发生的概率等于它在前(n-1) 试验均未发生的概率(1-p)^n-1,乘以它在第 n 次试验发生的概率 p,用数学公式描述如下:

事件在第 n 次试验前(含第 n 次)均未发生的概率是(1-p)^n ,这与事件在第 n 次试验前发生相互对立,因此又有下面公式:

只要 p 不是零,通过增加试验次数 n,总能使上式的概率趋近 1。

本质上,这反映出的正是大数法则,样本数量越多,则其算术平均值就有越高的几率接近期望值。

或许都读者认为猴子敲出莎翁全集在逻辑上无论如何也讲不通,也许吧,但从数学概率上讲得通足矣。

再换个角度做些更有趣的分析。可以很容易地计算出我们期望等待多长时间。

比如有 99% 的机会产生莎士比亚。那么按前面的推导,第 n 次试验前得到全集的概率为 F=1-(1-p)^n,有下面公式得到 n:


奇妙的不确定性,猴子能偶然敲出莎翁全集的概率有多大?


这里对数可以取任何底数,不妨取自然常数 e。对于极小的数 p,有如下近似 log(1-p)≈p,所以又有又有下面式子:


奇妙的不确定性,猴子能偶然敲出莎翁全集的概率有多大?


可以把上式表达得更简洁些。假设 p = 1/T,即事件发生的概率为 1/ T。 再令 F = 1 - 1/K 。那么就有


奇妙的不确定性,猴子能偶然敲出莎翁全集的概率有多大?


代入具体值体会一下:设某独立事件单次试验发生的概率为 1/1000,再设其在第 n 次试验前仍未发生的概率为 1%,则 n=1000 log(100)=4600。这意味着有 99% 的把握认为该事件在 4600 次试验前就发生。

可用上述公式研究下列 3 种事件:


奇妙的不确定性,猴子能偶然敲出莎翁全集的概率有多大?


独立事件发生概率为 p = 1/T,在指定发生概率下计算试验所需次数 n。在 p 为极小数和 F 接近 100%时,n≈T logK。

如表所示,同时掷两个骰子,理论上在 163 次投掷后,有 99% 的把握掷出两个六点。 再如,要猴子模拟器生成一个特定这 17 个字符的匹配项,比方说“to be or not to b(生存还是毁)”,该独立事件概率为 1/31^17≈2.3×10^25,这是一个特定的序列:莎士比亚大约有500万个17个字母的序列。那么得到任意 17 字符串匹配都正确的概率为 5000000*1/31^17=1/4.5×10^18。

注意到模拟器生成字符的速度为每秒 50 个,并假设其不停地生成字符,那么预计约 132 亿年后,我们将有 99% 的把握才能读到这本莎翁全集。然而,132 亿年又是一个什么概念呢?要知道根据大爆炸理论,宇宙诞生距今不过 137 亿年。


奇妙的不确定性,猴子能偶然敲出莎翁全集的概率有多大?


并且要知道,理论与实践有时相差甚远,一个重要原因是理论条件太过理想,而现实中却更难以满足。英国佩恩顿动物园设计过一项行为艺术试验,将一台电脑被放到了猴笼里,结果颇令人尴尬:经过训练的猕猴最后只留下 5 页几乎全是字母“s”的纸和一把沾满猴粪的键盘。


奇妙的不确定性,猴子能偶然敲出莎翁全集的概率有多大?


▲ 佩恩顿动物环境公园里,猕猴正忙于莎翁全集的“撰写工作”。摄影:VIVARIA

要让看似不可能的事件最终发生,需要无数次重复试验。无限猴子与打字机作为流行文化形象无疑为此提供了一个绝佳示例。

小到身边周遭环境,大到宇宙空间,不确定性与无穷过程俯仰皆是,而作为万物灵长的我们对其仍知之甚少。不过倒也不必为此愧疚,毕竟对日常买菜做饭而言,微积分和三角函数确实几无裨益。对大多数人来说,保持一颗好奇而谦卑的心就已足够。


免费下载:微信扫码关注网站官方公众号【中小学趣味数学 qwshuxue
趣味数学二维码
1、回复 “101”免费领取《【小学奥数】学er思内部题库word可打印
2、回复 “102”免费领取《【记忆力教程】快速高效学习教程
3、回复 “103”免费领取《一分钟速算教程
4、回复 “104”免费领取《Top 32经典英文启蒙绘本PDF+MP3
5、回复 “105”免费领取《儿童英语绘本195本【PDF版】
6、回复 “106、107、108”免费领取《更多神秘礼物……
版权说明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

本文链接:http://www.allfloor.org/38378.html

发表评论

评论列表(0人评论 , 33人围观)
☹还没有评论,来说两句吧...

小学趣味数学题及答案_教案「免费下载」_小故事-阿尔法趣味数学网

http://www.allfloor.org/

|

Powered By Z-BlogPHP 阿尔法趣味数学网

使用手机软件扫描微信二维码

关注我们可获取更多热点资讯

www.allfloor.org