第5章 《收成变动研究》
在我成为生物统计学家后不久,有一次,我去斯托尔斯康涅狄格大学找史密斯教授讨论问题,他给了我一份礼物。这是一篇论文,题目是《收成变动研究三:降水量对洛桑小麦产量的影响》。这篇论文共有53页。它是一个重要数学论文系列的第三篇,第一篇于1921年发表在《农业科学期刊》第六卷上。收成变动是实验科学家的烦恼,但却是统计方法的基本材料。“变动”这个词很少出现在现代科学文献中,它已被其他词语所取代,如表示具体分布参数的“方差”。“变动”这个词含义非常模糊,不适合现代科学使用,但它用在这一系列论文中却是恰当的,因为作者以不同年份不同田地的收成变动为出发点,得出了新的分析方法。
大多数科学论文末尾都有一长串与论文内容相关的参考文献,《收成变动研究一》只列出了三篇参考文献:一篇发表于1907年的文献试图将降水量与小麦的生长联系起来,但没有成功;另一篇是用德语写成的,发表于1909年,描述了计算一个复杂数学公式最小值的方法;第三篇是卡尔·皮尔逊发表的一组数据表格。先前没有什么论文涉足这一杰出研究系列所涵盖的题目。《收成变动研究》自成体系,其作者正是哈普敦镇洛桑实验站统计实验室的文学硕士R. A. 费希尔。
1950年,约翰·威利出版公司邀请费希尔在出版过的论文中挑选一些最重要的论文,结集成一本书。这本书题目叫《数理统计论文集》,扉页上印着一张费希尔的近照。照片上的人头发已经白了,双唇紧闭,领带歪在一边,白色的胡须参差不齐。照片下面写着“剑桥大学遗传学系R. A. 费希尔”。《收成变动研究一》是书中的第三篇文章。在这篇论文前面,作者写了一小段话,指出了它的重要性以及它在作者所有作品中的地位:
作者在洛桑的早期,对这家实验站在漫长的历史中积累下来的关于天气、产量、产量分析等内容的大量记录进行了深入研究。这些材料显然对于这种研究具有独特的价值,因为它们可以用于确定气象条件能够在多大程度上预测接下来的作物产量。这篇论文是研究这一问题的一系列论文的第一篇。
“研究这一问题的一系列论文”共有六篇文章。《收成变动研究二》发表于1923年。史密斯教授送给我的那篇论文《降水量对洛桑小麦产量的影响》是第三篇,发表于1924年。《收成变动研究四》于1927年问世,《收成变动研究六》发表于1929年。第五篇研究报告没有出现在费希尔的论文集当中。这些文章的标题很难显示出其内容的重要性,但这样的一系列论文在科学史上是很少见的。在这些论文中,费希尔提出了数据分析的原创性工具,提供了这些工具的数学推导过程,描述了它们在其他领域的应用,并把它们用到了他在洛桑发现的“粪堆”中。这些论文显示了独出心裁的原创性,而且充满了未经证实的迷人想法,让理论家们在20世纪剩余的时间里忙得不亦乐乎。在未来的岁月里,它很可能还会继续启发人们做出更多工作成果。