机选中彩票的几率?
这个问题,我当年高中做过实验 取500个不重复的随机数(我的天哪,这是我高中时编写的最复杂的程序了)然后对这500个数进行排序,并按顺序查找是否包含在6个红球数和3个蓝球数的范围中,如果包含就输出yes,否则就输出no。就这样一个简单的程序,我在计算机上运行了近2个小时,输出了6万多个yes和7千多个no。
为了更加直观地说明问题,我们画出了6张散点图(每个图形显示2000组数据),分别表示6个红球数和3个蓝球数的情况。从图中可以明显看到,有700多个样本(约14%)输出的结果正确(包含在范围中),而其它900多个样本(约18%)都出现了错误。也就是说,在机选的情况下,出现错误的概率约为28%,比直接买彩票中大奖的概率(一千万分之一)还要小很多! 这里需要强调一点的是,上述计算只是基于概率论中的大数定律给出的估算,并没有严格基于随机数发生器产生的数值进行计算。所以,尽管这个结果与我们经常听到的“机器中奖率远高于人”的说法一致,但是这个结论并不严谨。为尽可能减小误差,我们可以通过增加采样个数(即增大数据集)来提高估计的准确性。比如增加到1亿个随机数,那么出现错误的结果将下降到不足1%,比中彩票头奖还低!可见,增加采样个数对于提高结果的正确性具有显著作用。不过随着采样个数的成倍增加,编程实现起来变得越发繁琐复杂,而且最终结果的正确性与样本个数的关系并不是单调递增的,在某个临界值附近存在最优解使得误差最小。