科学就在我们身边——奇妙的数学定律

作者:东华大学 李璘

  如果你经常去图书馆,那么你可能发现一种奇妙的现象,图书馆的大部分书的头几页通常会比较脏,这是一种很普遍的事情,表面上看来并不奇怪,因为许多到图书馆读书的人大多是先看看书的开头,不喜欢的话就不会再接着读下去了。但是如果你有兴趣的话,再进行一下深入考察,你就会发现同样现象的存在。比如,数学书后的对数表、化学书后的一些化学常数、财务课本后的终值、现值系数表等等,由于这些数学用表是一种工具,只有需要查数据的人才会去碰它,因此,如果头几页比较脏,就说明人们查阅的数据大多在头几页里,同时反映出人们使用的数据并不是散乱的,而是有些数据使用的频率较高。你也可以统计一下所学过的数学、物理课本上面各种数据的开头数字。如果你统计的数据足够多,你就会惊讶的发现,打头数字是1的数据最多,大约占了所有数据的三分之一左右,打头是2的数据其次,往后依次减少。是一种巧合吗?难道人们仅对1情有独钟?
  1935年,美国通用电气公司的一位物理学家弗兰克·本福特也发现了这一“见怪不怪”的现象,当时他在图书馆翻阅数学对数表时发现,对数表的头几页比后面的更脏一些,这说明表的头几页在平时被更多的人翻阅。于是,这位物理学家对此产生了极大的兴趣。通过更进一步的研究,本福特发现,只要统计的样本足够多,同时数据没有特定的上限和下限,则数据中以1为开头的数字出现的频率是0.301,这说明30%的数字都以1开头。而以2为首的数字出现的频率为0.176,而以3打头出现的频率为0.125,往后出现的频率依次减少,9出现的频率最低,只有4.6%。这就是著名的“本福特定律”,也叫做“第一数字定律”。该定律告诉人们在各种各样不同数据库中每个数字(自然数从1到9)作为首个重要阿拉伯数字的使用频率。除数字1始终占据约接近三分之一的出现频率外,数字2的出现频率为17.6%,3出现的频率为12.5%,依次递减,9的出现频率是4.6%。在数学术语中,这一数学定律的公式可以表示为f(d)=log[1 + (1/d)],此公式中f代表使用频率,d代表待求证数字。
  除了对数表,本福特对数字又做了更深一步的研究,他对其他类型的数据进行了统计、调查,发现各种完全不相同的数据,比如人口、死亡率、物理和化学常数、棒球统计表、半衰期放射性同位数、物理书中的答案、素数数字以及斐波纳契数列数字中均有这一定律的身影。换句话说也就是只要是由度量单位制获得的数据都符合“第一数字定律”。
  本福特定律在我们的日常生活中很常见,但几十年来人们一直无法更合理的解释这个现象。此外,在生活中还有一些类似的数据与这一定律并不十分吻合。比如彩票数字、电话号码、汽油价格、日期和一组人的体重或者身高数据,这些数字大多是比较随意的,或者是任意指定的,是一些受限数据而不是由度量单位制获得的。这些数据就不符合“第一数字定律”所表现出来的规律。很多数学家研究了彩票的中奖号码,发现这里面并没有这样的规律,否则数学家就可以利用该规律来增加自己彩票中奖的概率了。
  “第一数字定律”是如此的奇妙,到底什么样的数据符合“本福特定律”,什么样的数据不符合这一定律?这个问题同样让数学家感到困惑。多年来许多科学家对于这些数字的奇异现象依然迷惑不解,一直难以得到合理的解释,但这一定律却在我们的生活中发挥出了实实在在的作用。虽然本福特定律没有让买彩票的人美梦成真,但是这一定律却能让造假帐的人胆战心惊,让作假账的人现出原形。
  数学家发现,公司帐本中的数据打头数字出现的频率与“本福特定律”有着惊人的巧合。如果做假账的人更改了账本上真实的数据,就会使账本上打头数字出现的频率发生变化从而偏离“本福特定律”。更有趣的是,数学家们还发现,在那些假账中,数字5和6居然是最常见的打头数字,而不是符合定律的数字1,这就表明,伪造者试图在账目中间“隐藏”数据。比如说一个公司的年度账目数据正常情况下应当满足这一定律,经济学家就可以根据这一定律查找出伪造数据,因为伪造的数据很难满足这一定律。也就是说,如果审核账本的审计人员掌握了“本福特定律”,伪造者就很难制造出虚假的数据了。
  最为典型的就是美国安然公司“假账”事件。2001年,“9.11”事件发生后不久,曾是美国最大的能源交易商、年营业收入达近千亿美元、股票市值最高可达700多亿美元、全球500强中排名第七的安然公司在事先没有任何征兆的情况下突然宣布破产,当时传出了该公司高层管理人员涉嫌做假账的丑闻,一时间,会计造假成了中外关注的焦点。事后,人们惊奇的发现,安然公司在2001年度到2002年度所公布的每股盈利数字不符合“本福特定律”,这些数字的使用频率与这一定律有较大的偏差,这证明了安然公司的高层领导确实改动过数据。
  最近,数学家又把“本福特定律”用于投票选举中。票数的数据也符合这一定律,如果有人篡改选票的数量,就会露出蛛丝马迹。接着,数学家依据这一定律分别发现了2004年美国总统选举中佛罗里达州的投票欺诈行为以及2004年委内瑞拉、2006年墨西哥的投票欺诈行为。
  到现在,“本福特定律”的形成原因依然还没有得到最终解释,但不可否认,它在我们的生活领域中却越来越广泛地被应用,这就是科学的奇妙之处,它无处不在,它时刻都在我们生活的周围,不仅仅只是一个简单的数字出现的奇异现象,简单中蕴藏着意想不到的神奇。