陆铭复旦大学 现实·理论·证据──谈如何做研究和写论文(复旦大学 陆铭)

2017-08-13
字体:
浏览:
文章简介:导读:本文研究了什么问题,我现在越来越喜欢直接在文章开头写:本文研究了什么什么问题,这里面你就需要说明创新,这时你就要把你的文章和既有的文献作比较,这就涉及到了

导读:本文研究了什么问题,我现在越来越喜欢直接在文章开头写:本文研究了什么什么问题,这里面你就需要说明创新,这时你就要把你的文章和既有的文献作比较,这就涉及到了文献评论,如果文献评论不是非常长时,突出你研究的重要性和创新,其余放在第二部分文献综述中再去说,千万不要只说本文研究了什么,你需要告诉大家你解决了什么问题,接下来要交代论文的结构,我们研究了公共信任与劳动力流动的关系:,中国农村居民在农村社会

第一,本文研究了什么问题。我现在越来越喜欢直接在文章开头写:本文研究了什么什么问题,显得很清楚,开门见山。你会发现很多作者,包括发在很好的中文刊物上的作者,通常是写到第二页,读者仍然不知道他在讲什么,这是很失败的。如果你是读者,已经读了一页多,还不明白他要说什么,肯定糊涂了。人们看你文章的第一个目的就是发现你的文章为什么重要。

当你提出问题以后,你要去告诉别人为什么重要,这里面你就需要说明创新,这时你就要把你的文章和既有的文献作比较,这就涉及到了文献评论。如果文献评论不是非常长时,你可以把他简单地放在引言部分。如果比较长,可以把最主要的、最经典的、最有意义的放在这里,突出你研究的重要性和创新,其余放在第二部分文献综述中再去说。

第三就是概括你的工作,很清楚地告诉大家你解决了什么问题。千万不要只说本文研究了什么。问题这么多,你需要告诉大家你解决了什么问题,运用了什么方法,你要不厌其烦地告诉大家你的贡献与创新。接下来要交代论文的结构,通常是八股文的写法,比如本文第二部分写了什么,第三部分写了什么。

接下来我们再举个例子,是我和张爽刚定稿的一篇文章[14]。我们研究了公共信任与劳动力流动的关系:

中国社会在传统上属于低信任度的社会(Fukuyama,1995),正是因此,公共信任作为在一种长期互动中形成的社会资本是弥足珍贵的。在中国农村由传统社会走向现代化的过程中,劳动力的大规模流动对中国农村社会形成了巨大的冲击。

那么,劳动力的流动会不会影响到农村社会中的公共信任?反过来,中国农村居民在农村社会中形成的公共信任是否会影响到他们的劳动力流动?对以上问题的思考和实证研究,不仅能让我们观察到农村公共信任在转型过程中的变化趋势,还能够为公共信任的影响机制提供证据,并以此为理解当代中国农村社会的变迁提供一个新的视角。‖

这是第一段,第一句话我就讲了我们的研究为什么重要:因为中国本身信任度就不高,所以这个研究就特别重要。第二段我特别括号中粗体字标注了本文讲了哪些问题。我们基本上讲到了这项研究的新意,思想贡献和方法贡献:

一项针对波兰的社会学研究(Sztompka, 1999)发现,在经济转型中,人们的公共信任经历了一个先下降再上升的过程。在转型前期,公共信任下降的重要原因在于人们在新旧体制的交替过程中面临着巨大的不确定性;而当转型取得了较为显著的成效时,人们对于公共机构的信任又会明显提高。

在中国的转型过程中,公共信任会经历与波兰经验相同的变化吗?市场化又是如何引起公共信任的变化的?以上问题非常重要,但还没有得到研究者的足够重视。

(问题的新意)从理论上来说,市场化是中国农村传统社会所受到的一切冲击的根源,市场化将通过三个层面的作用机制来引起信任的变化,分别是:家庭层面的劳动力流动、社区层面的收入差距、以及宏观层面的市场化政策等机制。(思想的贡献)‖ 接下来我们讲的是研究方法。

本文将重点研究市场化在家庭层面的作用机制——劳动力流动对于公共信任的影响;与此同时,我们还将研究公共信任对于劳动力流动的影响机制,由此来清楚地解释劳动力流动与公共信任之间的相互影响,而这种双向的相互影响可能导致的估计偏误恰恰是文献中没有被充分被重视的问题。(方法的贡献)‖

这便是我在方法上的贡献。然后再概括一下结论:

―我们发现,在中国农村的市场化转型过程中,社区层面的劳动力流动会增加对农村当地的公共信任,而社区层面的公共信任又会减少劳动力流动。而且,我们还发现,社区层面的收入差距会减少公共信任,省级层面的市场化对于公共信任的影响则显示出和波兰的经验一致的U型曲线。(主要发现)‖

由于得到的这些结论十分有趣,很容易让人了解这项研究的价值和贡献。

文献综述(评论)

接下来是文献综述,如果你在引言中没有很好的引述,那么你在文献综述中应该做到以下几点:一,简要回顾相关研究的发展;二,要对既有文献作适当的―批评‖ (不能简单罗列,一定要结合自己的问题和工作进行比较)。评论既不要太过火也不要不够,不够说明你没贡献,太过火则不中肯,更不要为了批评别人,把你在自己的文章中也没解决的问题提出来。

最好只评论你解决了的问题。你没解决的问题可能谁都解决不了,不要去show,不要以为只有你知道,实际上很多人都知道。

文献评论的写法千万要根据你自己的研究来。比如我刚才提到的收入差距和经济增长的文章,我们讲了这样几方面的贡献,一、数据用了国别数据,二、处理了内生性问题,三、我们区分了长期短期。我们要区分哪些是最重要的,正如我前面所说,最重要的贡献是思想上的,其次是方法上的,最后才是数据上的。

因此,我们的写法是首先论证我的思想与众不同,我们研究的是收入差距对于经济增长的影响在长短期的不同,这是在既有文献中没有很好地解决的。

第二,我们的研究中处理了内生性的问题,我们要指出既有文献中没考虑教育的内生性,而我们考虑了,这也是要指出的。第三是数据方面的贡献,我们运用的是中国的数据,而既有文献中使用的大多数是跨国数据,而这些数据的不同可能导致结论的不同。

在考虑增长问题时,国别数据是潮流,因为跨国数据十分难处理数据的异质性,所以本文用中国的数据来研究这个问题。当你知道你做的工作是什么的时候,文献综述十分好写。我们同学觉得文献评论难写,是因为你们没有思考,当你思考后,你便知道一个问题什么重要什么不重要,什么是老问题什么是新问题。不理解就写不出来,理解了就十分容易。

理论与实证

接下来,我们来看理论怎么做,实证怎么做。在此我讲的不是数学,而是起点问题。 先讲理论。无论数学模型也好,用文字表述的理论也好,你首先要界定问题是什么,你要揭示的现象是什么,界定哪些行为人对这个问题是重要的。比如我们最近研究的国有企业

改制中资产流失的问题[15],其中职工是不重要的,因为他们对资产定价及利益分配起不了作用,而只有企业管理和政府是重要的。

随后是你如何去理解行为人的目标函数的问题。你放什么变量,什么是内生的,什么是外生的。在企业转制中,是采取拍卖还是协议转让,这个变量肯定十分重要。有种我认为错误的看法是,拍卖可以避免国有资产流失,这个错误的本质是认为国有企业的转制方式是外生的。

我们假设这世界上有个好人,设计了公平公正的拍卖机制,当然这个机制可以提高拍品价格。但是我要问,拍卖是外生的吗?转制的形式其实是被选择的,是内生变量。于是你会发现,真正外生的是我们在历史上遗留下来的权力结构,在这种结构下,是拍卖还是协议转制并不那么重要。

我们可以看到,拍卖并没有避免国有资产的流失。在很多拍卖中你会发现只有一个―竞拍者‖,在表面上看似有个拍卖机制,但其实拍给谁已经决定了。

中国还有个词叫―陪标‖,拍给谁是定了的,只不过走一个形式,最后返还点好处给陪标者。而控制拍卖的人还可以通过制定规则的方式排除其他竞拍者。因此,在拍卖中也会产生资产流失,这不是在教科书的理论中可以解决的问题。

这个例子很好地说明了,你把什么变量设成内生、什么设成外生对你理解一个问题是十分重要的,而这也是数学不能告诉你的。 接下来的问题是,约束条件是什么?在每一个决策行为中,约束无非就是预算约束、资源约束,但在中国你要特别考虑制度约束。因为很多中国的问题受制度约束。

你还要考虑结构性问题,我们刚才讲了行为人,你要考虑不同人是通过什么发生联系的,它是一个市场机制吗?如果是,又是个什么样的是市场呢,完全竞争还是垄断?这些会成为你模型的起点。因为在不同市场上内生和外生变量是不同的,比如在完全竞争中,价格是外生的,而在垄断结构中却是内生的,是可以被企业控制的。

你如何设定这个市场是竞争还是垄断,这也是数学本身无法告诉你的。实际上当你在把价格设定为内生还是外生的时候,已经表明了你对市场结构的一个判断。

此外,在行为人之间是否有可能存在非市场互动?这已经成为经济学研究的一个前沿课题。 再接下来,研究的背景是什么样的社会政治制度结构?比如我们最近研究的城乡分割还是城乡融合的问题,在中国是由城市的政府最大化城市居民利益来决定劳动力市场分割的政策,这个结构在我们的模型中是一个非常重要的条件和制度背景。[16]

随后,用经济学静态的,动态的,比较静态的方法得出你的结论。复杂的数学有利有弊。一个数学方法复杂时,求解的难度就会增加,经济学研究总是希望模型和数据是可以处理的,而有一个办法就是减小变量的数量或者变量间的作用机制。

运用复杂的数学方法,在边际上舍去一个变量或变量间的作用机制时,很可能这恰恰是十分重要的变量和机制;但当它被放进来,模型可能就解不出来了。在我们做城乡分割到融合的动态模型时,我们原先想放进城乡差距扩大对资本积累的直接的负面影响,但是我们发现模型解不出来,于是只能忍痛割爱。虽然我们在这篇文章中放弃了这个变量,但在接下来的工作中,我们可能会用静态的方法研究这种影响。

这里我要说明的问题是,一个问题好不好,不是由数学决定的。我经常会拿到学生论文时问他们,这地方为什么要这样假设,为什么要放非线性函数而不放线性函数。他们答不上来。我指出这里可以放线性函数,他们的反应会是―这样会不会太简单?‖可是,如果用一个简单的方法可以得到一个复杂数学方法同样的结论,为什么要舍易求难?唯一的理由是―show your ability‖。

你无非想让大家知道你数学很厉害,但是,OK,我知道你的数学厉害了,然后呢?复杂数学方法的意义是可能会帮你搞清楚少数几个变量间的作用机制,在经济学发展的早期,经济学家的工作可能的确是去抓住最为重要的几个变量,但是在现实中有很多变量都是非常重要的,这时候为了让模型更贴近现,有时候可能需要放弃复杂的数学方法。

大家会发现,现在越来越多的文章倾向于简单的数学方法,因为比复杂的数学方法更重要的是你想讲什么故事。现在经济学发展的情况是基础的理论构建已经逐渐完善,对我们来说,更重要的是解释现实问题。而如同我刚才提到的:并不是说只有复杂的数学才能告诉你一个真实的世界是什么样的。

接下来我们讲实证。你首先要知道你想看什么,你模型背后的理论基础是什么,这些决定了你放什么变量。因为在不同的理论机制下,可以有不同的解释变量,这完全取决于你想看什么。我特别强调,要注意阅读文献,了解文献中的变量是怎么设置的,怎么度量的,十分重要。千万不要不知所以地往模型塞变量。接着是数据,数据可以截面的、可以是面板的,数据来源可以是公开的、可以是调查的。

实证模型的设定要跟着理论走。实证研究里,经常被大家提到的问题就是内生性问题,这主要就是说你观察到的一个变量对另一个变量的影响并不一定完全是它对另一个变量的影响。比如,教育程度高的人收入水平也高,但收入水平高是不是因为受教育程度高?不一定。

因为教育程度高的人能力也高,所以这里面就存在一个估计偏误问题,属于遗失变量的内生性问题。我前面讲到的劳动力流动和公共信任之间的双向关系,就是联立性的内生性问题。两个实际变量有共同时间趋势,放在一起看来是相关的,但是只是因为它们有共同时间趋势而已,这是伪回归问题。

再接下来是不显著变量的处理问题,很多人喜欢把不显著变量扔掉,但如果这个不显著的变量是应该控制的,那么,把它扔到了残差项里的话,就可能导致遗漏变量偏误。

那么最后一个问题是:R平方高不高是不是问题?很多同学在做实证文章的时候常常问,我的R平方只有0.08到0.09,也就是说我的模型只能解释数据的8%到9%。我说恭喜你,已经不错了,因为在实证文章里有时R 平方只有0.05。R平方是什么意思?就是说,我们的模型能解释数据的variance的多少,可能对于绝大部分的variance的解释,经济学家是不知道的。

案 例

我特别强调案例研究,案例研究被经济学家忽略的太多了。有的时候去研究一个问题时,你会发现对某些特定问题而言,它的事实可能是不清楚的。它的机制是什么?也不清楚。计量结果里,到底是什么样的机制在起作用?也不知道。那么,为什么选择的案例能解决我们问的问题呢?这也需要我们仔细考虑。