有时候,我们看到一篇很好的paper,可能就很想用数据和代码复制出结果。我记得我们学院有不止一位老师说过,论文写作不是教出来的,学习和模仿TOP期刊的论文就是最快、最好的学习方法,在此基础上,我们再谈自己的创新之处。可能有很多朋友都在学习DID、RDD等计量方法,毕竟算是现在的主流,我个人认为最好的学习方法就是找到一篇论文的数据和代码从头到尾实现一遍。今天就想跟大家分享一些获得论文的数据和代码的途径,欢迎大家补充!
一、国外AER、REStat等期刊官网
国外TOP期刊基本上都会要求作者提供论文的原始数据和代码,既能约束学术不端行为,帮助现有的研究不断进步,也能保护作者的知识产权。
AER(American Economic Review,美国经济评论)、REStat(Review of Economics and Statistics,经济与统计评论)等期刊都会在官网上提供论文的原始数据和代码。
二、国内《中国工业经济》官网
国内方面,《中国工业经济》期刊算是“第一个吃螃蟹的人”,从2016年第11期开始在官方网站公开所刊发论文的原始数据和代码、处理数据、案例研究材料、因正文篇幅所限而未刊发的附件等。不过,公布的代码的质量也是参差不齐,有些作者甚至“掐头去尾”玩起了心计,根本无法复制论文的结果。国内社会学领域TOP期刊《社会》也开始公布部分刊发论文的原始数据和代码。非常建议国内的《经济研究》、《管理世界》、《经济学季刊》和《世界经济》也开放这一板块,要求作者提供数据和代码。
三、一些学者的个人主页
很多学者会在自己的个人主页上公布发表的论文的数据和代码,比如计量大师Joshua Angrist(https://economics.mit.edu/faculty/angrist)、写土豆的大神Nathan Nunn(https://scholar.harvard.edu/nunn/home)等等。
四、向作者索要数据和代码
在国外,这是一种很常见的方式,如果在网上找不到数据和代码可以直接发邮件给作者,相比之下,国内这方面的氛围就相当差了。我就曾经尝试给一位作者发了一封邮件,就没有成功,作者以“数据非个人所有”为由拒绝了我。当然,也不排除一些好心的国内学者可能会提供数据和代码。