要实证收入分配的库兹涅茨倒U曲线,赵山文需要的是能反映世界上各个经济体收入分配状况和经济发展水平的数据。
在阅读文献过程中,赵山文了解到世界上很多研究机构和学者都在整理收集这方面的数据,有的甚至是官方数据,有的还在网上共享。
在众多数据库中,赵山文找到一个较权威的数据库—世界银行的世界发展指标(wdI)数据库,该数据库给出了世界上214个国家或地区1960以来主要发展指标的统计数据,并且不定期进行更新。
赵山文充分研究世界银行wdI 数据库,发现这个数据库中的基尼系数、收入最高20%人口所占份额、收入最低20%人口所占份额可以衡量一个经济体的收入分配状况,净人均国民收入、非农产业占Gdp的比重、城市人口占总人口的比重可以用来衡量一个经济体的经济发展水平,遂下载得到了原始数据。
得到原始数据后,下一步是处理数据。
处理数据的工作量也很大,有的学者为了写一篇小论文,甚至用一年时间来处理数据。
在博一第二学期快过完一半多后,赵山文在一次跟导师的交流中被袁老师指责,说他读博都快一年了,还出不了一点科研成果,同门的一个硕士师弟都写出一篇论文在投稿了。这给赵山文很大压力,他决定尽快完成兹涅茨倒U曲线的实证分析。
为了快速把数据处理完,赵山文晚上熬夜处理数据,有时弄到凌晨一两点,直到感觉头都在疼了才倒到床上休息。这段时间是赵山文掉发最多的时期,好多同学读完博士头都秃了,可能就是熬夜多造成的。
赵山文下载得到的原始数据是Excel格式的,和Stata格式的数据可以互相转换,他曾试图直接用Stata处理数据,但发现处理数据还是Excel功能更强,就用Excel处理完再转换成Stata格式。
赵山文分析自己得到的原始数据后发现,世界银行wdI数据库中的基尼系数和收入份额指标只是在1981年后才有了较多数据,在之前只有少量几个数据,最后的数据到2013年。在此期间,各个经济体的数据在各个年份也存在大量缺失值,只是零星存在一些数据,有的则完全没有。
根据基尼系数的可得性,赵山文选取wdI数据库中149个国家或地区1981-2013年的数据用以实证库兹涅茨倒U曲线。
处理完数据后,相当于得到了研究总体规律的样本。赵山文综合比较前人的研究成果,设定回归模型,用收入分配状况做被解释变量,解释变量设为常数项加上发展指标和发展指标的平方项。
有了模型、变量、样本和数据,下一步是用Stata软件进行回归分析。到这时,赵山文学习过的高级计量经济学(1)、高级计量经济学(2)和Stata软件应用简介课程终于发挥了作用,Stata软件应用简介课程让赵山文会通过编写程序对数据进行各种计算,包括回归分析,2门计量经济学高级课程的学习又让他懂得回归分析原理,能看懂计算结果。
这是赵山文第一次做实证研究,他尽可能尝试各种计量方法,让自己的研究具有更高的科学性。
作为非计算机专业的同学,赵山文以前一直感觉编程都是计算机专业人员做的事,其他人做不了编程这种事,在用Stata软件做实证研究中,他才发现编程原来没有那么难,自己这个非专业的人也能学会。
其实,Stata软件就跟生活中的计算器一样,是一个工具,只不过计算器用手操作输入指令,而Stata软件用程序语言输入指令。
Stata软件的程序语言不多,反复就用那么几十个英语单词,赵山文经过一段时间学习,学会了把一个回归分析的所有指令编写成程序,各个回归分析的程序大同小异,稍微修改一下又可以用到其他方法的回归分析中。
通过世界银行wdI数据库的数据和Stata软件,赵山文使用混合回归、固定效应、差分Gmm和系统Gmm等多种计量方法对倒U曲线进行再实证。
实证结果显示:最新的数据和方法仍然支持倒U曲线,说明收入分配的库兹涅茨倒U曲线代表了人类社会由传统向现代发展的现代化进程中收入分配演变的一般趋势。
以收入分配的库兹涅茨倒U曲线为主题,赵山文写出了两篇小论文,一篇侧重理论分析,但也有数据支撑,另一篇侧重实证分析,但也有简单的理论铺垫。
在研究过程中,赵山文在每周的师门研讨会上都跟袁老师交流自己的研究情况,遇到急需解决的问题时就直接去找袁老师单独请教,袁老师给予了精心指导。副导师龚老师擅长做计量实证,赵山文在计量方法上多次找龚老师请教,龚老师的指导保证了赵山文实证研究的规范性。