在“二战”中,英国军方研制了一种在飞机上使用的防弹装甲材料。然而,这种材料比较重,为了不至于牺牲飞机的机动性和航程,只能在飞机的局部区域使用这一材料。这样一来,设计师就面临一个重要的问题:需要把这种材料首先用于飞机的哪个部分?
盟军决定采用数据驱动的方法。他们检查了执行任务后返回的B-29轰炸机并且标记了每一个中弹点。在收集了数据之后,决策似乎是显而易见的:把装甲材料用于弹孔最多的地方(图1)。当他们要推行这一计划时,研究小组中的统计学家亚伯拉罕·沃尔德(Abraham Wald)提出了不同的意见。他向国防部指出,正确的策略应该是反过来做:把装甲材料用于那些没有中弹的部位。这是因为所有的记录都来自成功返回基地的飞机。如果一架飞机成功往返的话,那么看上去像蜂窝乳酪的机身就并非是我们关注的重点。相反,引擎部位等没有弹孔的地方才是需要额外保护的关键部位,因为这些部位中弹的飞机根本就没有返回。
图1幸存者偏差
一架“二战”时期的轰炸机上假想的中弹点分布。返航飞机上的中弹点表明这些部分可以被击中而飞机仍然可以安全返航,而那些被击中其他部位的飞机却未能返航(本图片遵守CC BY-SA 4.0创作共用许可协议,取自维基百科)。
这个经典的例子表明,基于只包含成功的样本数据,所得到的初始结论可能会被完全推翻。科学中类似的偏差非常多:文献往往聚焦于那些能够获得基金、在同行评审的期刊上发表文章、获得授权专利、成立新企业以及长期多产的研究人员。聚焦这些成功的案例引发一个重要的问题:既然目前对于科学的理解几乎都是基于成功的故事而得到的,我们能否确信这些结论不需要大的修正?
科学中的失败尚未得到系统性的研究,其原因主要是人们难以精确跟踪失败的构想,个体和团队以采集真实信息。为弥补这一缺失,我们可以探索新的数据资源并与现有资源相结合。例如,2001年以来,美国专利商标局的所有专利申请都在其优先权日期18个月以内被公开,而不管这些专利是否获得授权。通过跟踪所有的专利申请,我们就可以区分出那些获得美国专利商标局专利授权的成功构想,以及那些没有获得授权的构想。基金申请数据库中包含了受到资助和未受资助的基金申请,这也构建了一种丰富的信息资源,帮助我们更好地认知科学研究中的成功与失败。当然,只有数量有限的研究人员能够访问美国国家卫生研究院和荷兰科学研究组织这样的资助机构的内部数据库。这一数据如果与现有的文献和引用数据库相结合,就能探寻成功和失败中蕴含的丰富内容。
在这一方向上的初步努力已经有了令人惊喜的发现。以我们自己的一项研究为例398。我们追踪年轻科学家提交给美国国家卫生研究院的R01申请,并关注其是否恰好处在资助的边界上,这样我们就可以比较“侥幸成功”和“不幸失败”的申请人,从而观察他们更长期的生涯表现。尽管这两组年轻科学家在提交R01申请之前有着几乎一致的科研水平,获得了非常相似的资助申请评分,但是最终一组“侥幸成功”,5年间平均得到130万美元的资助,而另一组则“功亏一篑”。这种早期学术生涯的挫折对于年轻科学家的影响有多大?
为此,我们跟踪了两组人员后续的表现,发现早期生涯的挫折确实有影响:
它显著增加了人员流失率。不幸失败的申请人永远离开美国国家卫生研究院系统的可能性要比侥幸成功的申请人高出10%以上。这一流失率是惊人的,因为要成为一名美国国家卫生研究院的首席研究员(PI),申请人需要有良好的业绩记录以及多年的训练。换句话说,一次挫折可以终止一个人的学术生涯。
然而最令人吃惊的是,数据显示从长期来看,不幸失败的个体如果继续其科研工作的话,会系统性超越侥幸成功的个体,前者在后续10年发表的文章具有明显更高的影响力。这一发现相当震惊。两个具有相似表现,都在努力发展的“双胞胎”似的研究人员,一个在早期就获得了基金资助,而另一个没有获得,但结果反而是那个没有获得资助的研究人员后续发表了具有更高影响力的文章。
一个可能的解释是筛选机制。不幸失败组中的“幸存者”具有先天的良好特质,从而使得继续留在领域内的人总体上比侥幸成功的人表现更好。但是我们发现这一机制本身并不能解释两组人员的表现差异。换句话说,那些早期没有获得基金资助但仍然坚持不懈的人并不是一开始就表现良好,而是逐步磨砺,也成了更好的自己,印证了“玉汝于成”这个成语。
这些结果看上去特别反直觉,因为科学遵从“富者更富”的规律,但结果却是失败而不是成功带来了更多的成功。这些发现表明科学中的失败具有很强的反作用——损伤了一部分人的研究生涯,却无意中促进了其中某些人的成功。如同早期的成功一样,早期的失败也可以成为未来成功的风向标。这是一个好消息,因为科学家即使不是每天,也会每周都经历失败。
这一研究也得出了一个更广泛适用的观点:尽管我们在理解成功方面取得了一些成功,我们也许在理解失败方面却遭遇了失败。由于研究人员更多的是经历失败而不是成功,了解他们失败的时间、原因、方式及其后果,不仅对于理解和改进科学至关重要,也将通过揭示创造性活动的全过程而极大增进我们对于人类想象力的理解。
科学的真相:退稿增强了文章的影响力
如果一位研究人员提交的论文一再被退稿,他可能就会觉得这篇文章并没有那么好,即使发表出来也很有可能无人问津。然而数据显示的却是另外一番景象:退稿事实上增强了文章的影响力。我们能知道这一点,要归功于一项研究。这项研究跟踪了2006—2008年发表在923种生物学期刊上的80 748篇文章的投稿历史400。研究表明二次投稿的比例是很低的:75%的文章都发表在第一次投稿的期刊上。换句话说,科学家们擅长于判断他们的文章最适合哪个期刊。但是,通过比较二次投稿后发表的文章与那些第一次投稿就发表的文章,研究人员惊讶地发现:与那些第一次投稿就被录用的文章相比,那些发表在同一期刊上,但第一次投稿被拒,第二次投稿才被录用的文章,在发表后的6年时间里会获得更高的引用。失败为何能够提升影响力呢?
一种可能性是作者擅长于估计其研究的潜在影响力。因此,那些一开始提交到高影响期刊的稿件即使被退稿,其本质上也是更“适合”被引用的。但是,这一理论不能完全解释观察到的现象:因为不管二次投稿会投向更高还是更低影响力的期刊,都得到了更高的引用量。这就说明了另一种可能性:编辑和审稿人的反馈以及为了二次投稿而额外花在修改文章上的时间,使得最终文章的质量更高,也更适合被引用。因此,如果你有一篇文章被退稿,请不要为重新投稿而沮丧——那些打败不了你的确实会让你变得更强大。
本文节选自《给科学家的科学思维》,2021年12月,湛庐文化出品
作者:王大顺/艾伯特-拉斯洛·巴拉巴西
出版时间:2021年12月
出版社:湛庐文化 / 天津科学技术出版社