我今天的讲座主要有两部分。我想谈的第一部分是论文的三部曲:选题、技巧和写作。

一个好的主题是一篇论文成功的一半,但不是每个好的主题都能被创造出来。技能是我们接受的训练,我将在这里分享我的经验。最后一点是写作。从本质上说,经济学还没有完全摆脱文学的本质,所以写一篇好文章是非常重要的。我们还没有达到写一份像物理和化学这样的实验报告然后寄出去的地步。我以前不知道,但后来我和一位化学研究员谈了谈,谈到了他们发表在《科学与自然》上的文章。编辑部)认为你的结果基本上没问题,就把它们发给你,不管你写了什么。我们的经济学还没有达到这个阶段。与此同时,他还告诉我,《科学与自然》杂志每年发表成千上万篇文章,其中只有1%可能有用,其他的文章很快就会被遗忘。写一篇关于我们经济学的文章比写一份实验报告要花更多的时间,所以不容易被遗忘。这也是一件好事。在那之后,我将给出三个例子,所有这些都是我自己的研究,不是我的研究有多好,但是我知道我是如何来到这里的,这是非常重要的,因为有时候你读了别人的文章却不知道他是怎么写的,所以我可以谈谈我自己的一些感受。一个是关于中立政府的,发表于《经济研究》。第二篇文章是关于政府基础设施投资和居民消费。我们刚刚完成这篇文章,并将在英文出版物上发表。最后一篇文章是关于市场化和党的精英主义。我们仍在写这篇文章。我只想在这里提一下。

第一部分概览:论文发表三部曲

选题——好的选题是论文成功的一半

首先,选择主题。我们做经济研究,有很多话题。那么什么样的话题才是好话题呢?我认为在中国进行经济研究时,我们仍然应该以问题为导向。当然,有些人会说我的志向是获得诺贝尔奖。我必须做纯理论的问题,但我觉得中国人在做这种纯理论的问题上没有比较优势。

你怎么说没有比较优势?林先生喜欢举一个例子。经济中心过去在英国。后来,随着美国经济的崛起,经济学转移到了美国,但过程非常漫长。我们知道,1896年美国的国内生产总值超过了英国,1914年人均国内生产总值超过了英国。那么,这个经济强国是什么时候搬到美国的?我们通常说是在1947年萨缪尔森出版《经济分析基础》之后。自美国人均国内生产总值超过英国以来,30多年过去了。我们乐观地认为,中国的国内生产总值将在十年内超过美国,即从1896年到1947年,大约需要50年。你得看看这个重要经济城市的转移。从2020年开始,我们还要再等50年。或许这个重要的经济城市可以转移到中国。这是一个判断,中国要成为一个重要的经济城市,还需要很长时间。第二,你应该知道美国大学的经济系是一门很强的学科。他手下有多少人每天无事可做,每天都在研究它。李稻葵总是喜欢说为什么美国让经济学变得如此复杂。最初,由于高收入,经济并不那么困难。如果劳动力市场的工资很高,就必须提高门槛。如何提高门槛?就是做你的智力测试,对你的智力要求越来越高。因此,在美国从事经济研究的一群人智商很高,而且非常聪明。像克鲁格曼这样的人非常聪明和自负。他每天无所事事,不像我们,中国有很多事情。他每天坐在办公室里,无事可做,每天都在思考一些经济问题。许多博士生也在这样做。如果你想和他们竞争,你很难在纯理论上取得突破。这并不是说我们做不到。这是事实。人们的环境比我们的好,比我们的需要更多的时间。因此,我们的比较优势仍在中国的实践中。看我们能否从中国的实践中提出一些问题,并做好研究,必须以问题为导向。这对我尤其重要。

我收到了很多文章,读了他的前言和摘要,所以这篇文章可能不会发表。既然我们有了序列号,提交的文章数量就更多了。我们每年将收到大约780篇文章。我们提交审查的三分之一和三分之二的文章被我们的三位主编驳回。大部分时间我们都在阅读摘要,这并不意味着我们不认真,因为当你看他的摘要时,你会发现里面什么都没有,所以你只能拒绝它。三分之一的申请被另一半拒绝。因此,选题非常重要。

你是否能在中国找到一个有意义的话题已经被其他人研究过了,但是你有一个好的方法,或者其他人根本没有研究过。在这一点上,作为一个中国学者,有优势。在过去的30年里,中国发生了巨大的变化。中国是世界上最大的发展中国家。中国现在是世界第二大经济体,有很多有趣的东西。中国的法治并不完善,许多事情都在变化,不断变化。这实际上是一个很大的实验场,我们应该有好的材料去挖掘。我发现许多人喜欢在我们收到的一些文章中讨论一些纯粹的理论问题。例如,我们总是收到关于科斯定理的文章。我只是想,科斯定理已经研究了几十年了,你能找到新的东西吗?我认为这是不可能的,所以这类文章被一目了然地拒绝了。你能说中国现实中有一件事可以用科斯定理或科斯定理的延伸来解释吗?因此,它仍然是面向问题的,这也是新问题最有可能被发现的地方。

什么是好的选题?什么样的话题是好话题?首先是要有新的理论观点。我刚才说过,对你来说,做纯理论的事情并不容易,而是要以问题为导向。你一定在现实中发现了一些东西,但是现有的理论无法解释它,所以你必须发展一个新的理论。我不知道这里是否有博士生。每个人看起来都很年轻。当我收到文章时,我最讨厌哪种文章?一个现有的理论模型,他改变了人们的假设,推导非常复杂,最后推导出来的是一件非常琐碎的事情。如果你改变现有模型的假设,你会经常犯错误。这一次,我们看到一篇文章说克鲁格曼的核心和外围理论是错误的,并且在克鲁格曼的文章中有重大错误。他指出了我们几乎接受的两点。幸运的是,我看到了模型,显然他犯了一个错误。他对这个问题不太熟悉。你仔细想想,克鲁格曼的文章是诺贝尔奖获得者。如果他犯了这么大的错误,他还会获得诺贝尔奖吗?不要高估你的智力。克鲁格曼非常聪明。不要总是拿别人的模型来改变你的假设,看看你是否能引入新的东西。别这样。如果你写了一个理论模型,你会知道一个理论模型是基础,基础和基础。为了得出他所需要的结论,这个假设已经太简单了。然后你去改变他的假设,那是完全不同的,不可能的。在我看来,我们仍然应该从现实中找到有意义的话题,而不是纯粹改变别人的理论模型。例如,中国经济为何成功的问题当然非常大。不管你在哪个领域,你都可以在你的领域里问这个问题。在我的领域,我如何解释中国的经济成功,现有解释的缺点是什么?例如,我们通常认为腐败不利于经济增长,并且有很多很多理论和实证研究已经证明腐败不利于经济增长。我们知道腐败在中国非常严重。透明国际(Transparency International)给中国打分,消费者价格指数(CPI)为最低30%,但为什么中国的腐败至少不会阻碍中国的经济增长?如果你正在研究制度经济学和新政治经济学,我认为有很多事情可以做。为什么腐败没有成为中国经济增长的障碍,我们能探究一下吗?第二个主题是解释一个谜或事故。谜是一种逻辑上找不到答案的现象。你就像约瑟夫·李约瑟的谜一样。众所周知,李约瑟在写《《中国古代技术史》》的时候提出了一个问题。中国古代的技术水平已经达到如此高的水平。然而,似乎没有逻辑的方法来解释为什么现代工业革命没有在中国发生。当然,在这个问题上有很多研究。 另一个例子是,中国有巨大的外汇储备,但我们为什么需要外国直接投资?事实上,我们仍在输出资本,那么为什么要投资外国资本呢?这显然是个问题。回顾过去,中国的投资回报率实际上非常高。如果你能找到一个项目来投资,回报率可能会超过10%。如果是这样,为什么我们有经常账户盈余?为什么这笔钱没有投资到中国,而是变成了外汇储备,供其他人使用?我们在美国投资的回报率是多少?每年2%。当你去中国的民间信贷市场,年利率现在超过20%。这显然是某个地方的问题。现在我们总是说中国经济不平衡,我们能不能深入地问一些这样的问题,找到一些这样的谜题,然后给这些谜题一个解释?事实上,有许多像中国这样的神秘事物。另一个例子是,中国的法治环境很差,法院的裁决不会得到执行。那为什么要签合同?我去企业调查,发现他们基本上都要签合同。此外,法律环境很差,但经济表现并不差。这里在起什么作用?

另一个是事故。你发现了与现有理论预测相反的经验事实。理论上讲,需求会随着价格的上涨而减少,但是你会发现需求会随着价格的上涨而增加。这是经济学中的经典理论。你有不同的解释吗?一般来说,如果文章要发表,你必须已经构建了一套理论来解释现有的事物,或者你可能已经发现了一个谜或一个意外,这样你的问题就能吸引评论者的目光。这样,你的文章成功了一半,因为你发现了一个好问题,然后你给出了一个解释。罗纳德·科斯研究所实际上是一个非常小的研究机构。有几个人在做这件事。领导者是李·本汉姆。他班对年轻人的要求是,第一,要有一个大“窝”,而“窝”是“哦,我没想到”,这也是一个惊喜。你可以给出一个合理的解释。我是说,一个合理的解释。当有人看着它说,“哦,啊哈”,也就是说,你可以抓住某人的眼睛。

在第三个方面,应用现有的理论来解释这个现象。例如,你可以测试现有的理论。有许多理论没有被前人检验过。然后你就有了新的数据,新的测量方法。例如,在最近的国际经济界,做经验信息输出是相当热的。过去,产业组织基本上是理论模型,但现在,理论模型差不多完成了,每个人都开始做测试。用数据来测试,这是现在非常热门的事情。

新数据也很重要。如果我们在这里收到很多文章,被拒绝的可能性极低。一篇由微观数据构成的文章在我们的杂志上有60-70%的成功概率,尤其是那些通过我手的文章。中国现在很少有微观数据。现在我们通常有两个可用的微观研究数据,即中国家庭收入调查(CHIPs)和中国健康与营养调查(CHNS),由北卡罗来纳大学中国研究中心主办。其他数据没有披露。统计局和农业部的统计数据需要付费,而且非常昂贵。

我想在这里做广告。我们在北京大学有两个数据。一个是由赵领导的CHARLS,主要处理退休和健康数据。现在我们已经完成了两轮。一个来自甘肃,另一个来自浙江。这些数据可以在CCER的网站上找到,并免费下载。每个人都可以使用它。它可以在网上免费下载,这些数据对从事应用微观研究的学者有很大帮助。另一个是中国家庭动态调查(CFPS)。由于该数据库由北京大学资助,北京大学首先使用它,然后向公众公布。如果你有北京大学的朋友,你可以合作。我认为这两个数字将在几年后成为金矿。我现在看到的是芯片和CHNS已经被每个人用光了。许多微观文章使用这两个数据。

还有一种新的测量方法。如果你这样做,这也是一个巨大的贡献。对我们来说,制定新的方法论并不容易,但解决最简单的内生问题是可能的。

下一类是应用微观经济学来解释现象,并用数据来证明它们。这通常需要你写一个小的理论模型,因为你在应用微观经济学来解释现象。一个简单的例子是,新型农村合作医疗制度是否降低了农村地区的宗教信仰概率。我们知道人们信仰宗教是为了减少不确定性。宗教信仰最重要的不确定性是你不知道死后你在哪里。事实上,宗教是利用未来的不确定性,所以所有的宗教都关心来世。我们知道近年来中国农村地区的宗教信徒越来越多。原因是什么?一个可能的原因是有太多的不确定性,所以人们不得不相信宗教。这篇文章是中国人民大学的郑风田老师写的。事实上,他们使用的数据不是特别好,这是河南开封地区的一个地方数据,但是当我看到这篇文章时,我的眼睛亮了。这是一个非常好且明显的问题,尤其是这种外国宗教,基督教和天主教在中国农村传播得非常非常快,这对中国农村产生了影响。他还结合了新型农村合作医疗制度。新型农村合作医疗制度能降低宗教信仰的可能性吗?这个问题很好,事实上,它不是很好,因为数据,只有几百个农民的数据,但我还是愿意把它送给他,我认为他提出了一个非常有意义的问题;当然,他没有写模型。事实上,在这种情况下,最好简单地写一个模型,并有一些简单的预测,这样会更可信。

不好的选题

第一个假设是我刚才提到要改变别人的模式。这种情况必须停止。当我得到这篇文章时,我认为这是浪费时间和精力,因为解决这样的模型通常很累人,最后我发现它是错误的。第二是机械地照搬别人的理论模型,而不搞清楚经验事实。首先,澄清你想讨论的事实,然后用现有的理论来解释你的问题和事实。关于中国过去土地制度的变化,从秦始皇到现在的土地制度,我们经常收到讨论这些问题的文章,经常机械地运用科斯的产权理论等。做这样一篇文章,对你来说没有意义的是不去读一些历史书或数据,而是去应用别人的理论。所谓研究,我们必须自己做东西。当格拉夫研究马格里布犹太商人的合同执行时,他挖掘了许多中世纪的合同进行研究,并做了一些历史研究,而不是机械地应用现有的理论。第三个是关于稻草理论。为什么称之为斯特劳理论?20世纪初,对欧洲著名知识分子进行了一项调查。在过去的1000年里,什么样的发明在人类进步中发挥了关键作用。一个人给出了稻草的答案,为什么是稻草?他说如果没有稻草,你就不能养马。如果你不能养马,你就不能去打仗。因此,欧洲文明不会扩张。所以今天没有稻草就没有欧洲,所以稻草是最重要的发明。你认为他有意义吗?真相有一点点,但它被无限放大了。这样的理论可以说是稻草理论,这不是那么明显,而是夸大其词。另一个常见的问题是研究决定性因素。我最害怕读这样的文章。花了很大的努力,终于写了一篇文章,比如什么决定了工资。这种文章最好不要做,你在回归方程中放十个变量,我可以说你的变量不够,你应该放二十个,这二十个可能不够,你必须放一百个变量。这是由许多因素决定的。你能穷尽所有的因素吗?有些人说我做了一个实验,起初是20个,但后来发现一些因素不显著,所以我把它去掉了。然后它又被释放了,发现有一些不显眼的又被移走了。最后,这些因素是最重要的,所以我留下了。这不是一种研究方法。我们必须研究一种机制并控制其他变量来阐明一种机制。例如,你可以问工会是否对工资有任何影响。你只需要澄清这个因素,而不是研究什么因素决定工资。这种问题不是一个好问题,不容易在好杂志上发表。2.论文写作技巧现在我想谈谈这篇论文的写作技巧。我想从两个方面来谈这个问题,一是理论研究,二是实证研究。 如何做一个理论?很多人说我做理论,也就是说,我写一个模型,模型推断出什么结果就是什么结果。这种情况不了解经济学。要写一篇经济学文章,你必须有一个直观的故事。首先,用自然语言表达你的故事。如果你的故事不能用自然语言来表达,那么你一定有问题。首先,用自然语言讲述这个故事,一定是你已经知道了你想要的结论,然后编一个故事,而不是你写一堆假设,然后演绎一个模型,我会接受任何演绎出来的结论,这是完全错误的。就连数学家也做得不好。

你认为当阿罗在写阿罗的不可能性定理时,他没有事先考虑过这个结论吗?他最终从他的四个假设中推断出他不可能的结论了吗?事实绝对不是这样。他必须有一种直觉告诉他这是不可能的,然后返回去寻找最小的一组假设。结果表明,这四个假设对于得出所需的结论是必要的。事实上,其中一些假设基本上很难符合事实。例如,你有一个不相关的原则。

我刚到美国时,美国总统选举有三名候选人,老布什、希拉里和罗斯·佩罗。根据不相关原则,这意味着布什和克林顿的排名不受布什和佩罗的排名影响,也不受克林顿和佩罗的影响。这在现实中是错误的,但他必须有这个假设才能得出结论。他的想法正好相反。事实上,数学家也是这么想的。例如,数学中有许多猜想,如哥德巴赫猜想,它首先被提出,然后被证明。我以前不知道。我用我的第一个导师做了研究,但不能写理论模型。后来,当我遇到一位学数学的同学时,我问他我如何才能得出结论。这个数学系学生的话让我感到非常轻松。他说,根据你的假设,你可以在数学中得到任何你想要的结论。数学中有许多数学公理。你不能超越这些数学公理的假设。经济学好一点。经济现象太复杂了。你可以做一些假设。然而,你必须在写一个模型之前得出一个结论来全面地讲述这个故事,并且这个故事应该更详细。然后你必须找到一个合适的经济模型,并使用严谨的数学语言来表达这个故事。这里有两个关键词。首先是使用合适的经济模型。最好使用现有的经济模式,然后你就可以畅所欲言了。这个模型更精致,然后你可以用数学语言说出来。什么是合适的经济模式?如果你在研究制度经济学或新政治经济学,你应该知道,最近几年有一个非常热门的人,他的名字是达伦·亚齐·奥卢(Daron Acemgolu),他的几乎所有文章都很精致。他有一篇文章“西方为什么要扩张法国?”换句话说,西方的民主化进程是如何产生的?西方的民主化进程不是在短时间内完成的。英国花了大约220年的时间,直到1928年,女性才享有与男性同等的投票权。他讲了什么故事?他谈到了穷人和富人之间的斗争。穷人奋力抗争。如果他们想要自己的利益,富人会放手。我们可以用马克思的阶级斗争来完全解释它,但是如果你想用马克思的阶级斗争来解释它,别人就不会承认它。至少从现代经济学的角度来看,这不是一个理论或不可接受的理论。所以他编了一个故事。他编造了一个承诺的故事。当穷人向富人要福利时,富人说我会给你,但决定权仍在我手中。但是当穷人想起来的时候,你答应给我,但是最后你没有给我。我该怎么办?这实际上是一个承诺的问题。如何实现这一承诺?富人说让你们穷人来决定。这不是民主吗?我不在乎你是否决定做什么。这个故事是一个经济模型和爱德华·普雷斯科特的诺贝尔奖模型。但我认为这种模式根本没有必要。马克思的阶级斗争理论可以得到充分的解释,而且可能得到更充分的解释。但是你最好写一个经济模型,讲一个别人可能更容易相信的经济故事。 每个人都会问这样的问题。既然你能用自然语言表达,为什么要用数学模型来表达呢?我认为唯一的原因是自然语言中存在漏洞。自然语言无法表达清楚,尤其是汉语。例如,我坐在这里说语法有很多错误。汉语决定了你不能说非常严格的语法,但是如果你不说英语语法,别人就不会理解。英语比汉语更严谨,但我认为汉语写诗比英语好得多。据说法语更严谨,但无论自然语言有多严谨,它都有漏洞。有时候你听一个人用自然语言说话,但是如果你真的想在模型上写,你可能写不出来,而且会有很多绊脚石。举个最简单的例子,我刚才说中国的资本回报率很高,但我们出口资本。你如何解释这个问题?你可以用自然语言讲述一个相对简单的故事,并给出解释。我们的一些企业不能从银行获得贷款,而另一些企业可以从银行获得大量贷款,所以这里总有一些企业不能获得贷款,所以一些贷款会流向其他地方。这听起来很合理,但是对你来说写一个模型并尝试它并不容易。对于这样的模型,您通常需要使用组织模型(组织生成),并且您必须加入银行。它有一些问题。只有当你用经济理论模型思考时,你才能找到你想不到的东西,这是非常重要的。

经济模型的作用是检验理论的逻辑和发现新事物。但如果这不是一个模型,那一定是事实。尤其是在做应用研究时,不要把模型当成真理,它只是一种被自然语言所取代的描述。我总是告诉学生数学是另一种语言。数学家可以非常简单地使用英语和法语。他写的所有数学论文都可以不用多写就理解。所以数学是一门严谨的语言。谈到经济学,我个人认为解释是主要因素,而不是预测。我们只是在讲一个故事,就像历史学家在讲许多故事一样。经济学家用数据和模型来讲述这个故事,这些都是对历史的描述。我们描述短期历史,历史学家描述长期历史。

你怎么知道一个理论模型是好是坏?首先要看的是这个假设是否合理。我刚才说过,经济学家可以卖一些狗皮膏药来做一些假设,但是如果你的假设太僵硬,尤其是理论性的文章,它们会立即被切断。我总是说,这是一个短路。你做了一个假设,然后做了很多复杂的推论,却发现这个假设是有效的,当然这个模型肯定是无效的。第二件事取决于你的模型是否被正确应用,也就是说,你是否使用了正确的经济模型,逻辑是否清晰。有些模型写起来非常复杂。我想我没有完全理解他们。我必须把它们写清楚,并且有血有肉。不管这个模型是否精致,你都不能用简单的英语来写。正如我之前说过的,当阿西莫格鲁加入公司时,它更精致。无论结论是否直观,如果结论不直观,你的模型显然是有问题的。你的结果与我们的直觉不同,要么你的假设是错误的,要么你的逻辑是错误的。能否从现实中得出一般性结论也是检验理论的一个重要标志。最后一个标准是结论是否经得起数据的检验。当然,这个要求有点高。事实上,许多经济模型表达了一个想法。没有必要用数据来测试它。此外,这一组数据测试经常是站不住脚的。我使用另一组数据。有很多数据,世界是多样化的。经验研究 实证研究表明,好的数据是第一要务。我刚才提到的数据库都是开放数据。省级数据现在基本上被每个人用光了,除非你有好主意,我建议你少用省级数据。花些时间收集县市数据,这些数据实际上是可以收集的。我认识一个人,他在北京图书馆呆了一个夏天,整理了所有的县资料。我现在有一个博士生。他正在收集城市数据。他想研究官员的晋升。为了收集这些官员的底细并每天在网上查看数据,人们必须花费一些时间和精力去做一些意想不到的事情。作为一个像我这样的学生,在经历了这么多城市和这么多官员升迁的统计之后,我估计吃十年饭是没问题的。

经验研究也应该讲述一个故事。有人说,当我把数据放入模型中时,只要我一回到模型中,结果就会是一样的。这就是垃圾进出的方式。一定有故事,最好是理论模型。当然,理论模型并不意味着你应该建立一个理论,而是你应该提出一个分析框架,哪些变量是解释变量,哪些变量应该作为控制变量,而没有理论模型。这些事情你真的不清楚。在你写完理论模型之后,在你知道要放入什么变量之前,你会仔细考虑一下。

另外,你应该从多方面验证你的结论。很多人做实证研究,两个回报都结束了,然后就有了结论。我们测试理论预测,我们经常测试理论预测,但是数据支持理论并不一定意味着理论是正确的。因为你不能排除,其他的理论也可以得到你观察到的数据,这叫做选择性解释。所以你必须不断问自己是否有其他理论来解释你的经历。你只是想象有一个评论家在挑你的错误。目前,国内一些杂志正在实施审稿制度。我通常不得不为一些杂志写评论报告。当我收到一篇文章时,我的第一反应就是把它删掉。杀死它后,会非常方便。《经济研究》每年贡献数万篇文章。他一年能发表几篇文章。奇怪的是,他不会打断你。因此,这肯定是一个很好的问题,并且该方法能够经受住审查。你可能还想检查相反的结论。我们的理论模型通常是一个积极的结论。还有别的结论吗?我们已经做了一个例子。村级选举提高了村干部为村工作的积极性。这是一个积极的结论,但他不能解决孩子上中学的问题。然后你有数据显示村干部确实为村民建造了更多的桥梁和灌溉设施,但理论上他不应该对上中学的孩子有任何影响。因此,你应该再做一次回归,看看它是否对上中学的孩子有帮助。如果不是最好的,如果是,估计有问题。因为他不应该有所帮助,但你所做的结果是有帮助的。这种情况可能是由于您的数据有问题。在进行实证研究时,我们必须注意内生问题。现在要求越来越高,国内形势也是如此。如果你不能解决内生性问题,你很难在好杂志上发表文章。一个是伪相关。这两个变量之间的相关性完全是由偶然因素造成的。一个典型的例子是街头红裙股的上涨。这两者无关。时间趋势,其中一些完全是时间趋势,尤其是当你做省级数据时,最好控制时间趋势,不仅是所谓的年度虚拟变量,还有你自己在每个省的时间趋势。每个省的虚拟变量乘以时间,这样时间可以得到控制。我在这里谈论的时间是日历时间。还有变量缺失的问题。缺少变量意味着一些变量不受控制。最简单的情况是,如果你不控制收入,需求可能是价格的增长函数。控制收入后,你会发现需求是价格的函数。 一位朋友谈到了他的一项研究。他说,农民之间的土地租赁合同持续的时间越长,租户对土地的投资就越多。理论上,根本没有问题。产权的稳定性对投资有影响。产权越稳定,各方就越愿意投资这块土地。但是如果你用数据来测试,就会有问题。例如,我是一个房客。我为什么要费心签一份长期合同呢?可能是因为我只是想在这块土地上做长期投资,所以我才找了一个地主说我们会签一份长期合同来保证我的权益,我想签十年。在这种情况下,如果你把长期合同作为投资的解释变量,那你就错了。事实上,我签了一份长期合同,因为我想投资很长时间。这是一种反向因果关系。所以当我们做实证研究时,我们应该考虑这些问题。

简而言之,在做实证研究的时候,要记住有一个评价者坐在你的对面,问各种各样的问题,然后你应该尽力用你的测量结果来回答他,也就是说,评价者可能会问,我有办法解决他的问题吗?你不应该是一只鸵鸟,认为评论者在一个小地方看不到它,所以你错了。评论家正在研究这些细节。如果他是一个有经验的研究员,他会看着你可能忽略的问题,然后开枪打你。

3.优秀论文的写作

最后,我想谈谈写作。我第一次回国时,林先生告诉我,他1987年回国时,当时没有人和他讨论,在国际刊物上发表文章也是闻所未闻的。于是他找到了一篇范文,接着是八篇散文和葫芦画。这也非常重要。里面确实有一些老一套的文字。

有几个关键点需要弄清楚。首先是澄清文章在文献中的地位。首先是在开始时说。我刚才说李·本汉姆,他让这个年轻人说,读出你总结的前20个字。英语单词的前20个单词可以说很多。如果你完成了前20个单词,而其他人不知道你的文章要说什么,那么你就失败了。因此,在写总结时,一定要开门见山,清楚地写下你想写的,不要罗嗦。前言很重要。裁判通常先读文章的序言,然后是结论。如果他认为你无聊,他会打断你。所以一定要在序言中清楚地写下这篇文章在文学中的位置以及你的贡献。

第二个想在序言中清楚地解释他的故事。许多人经常不写它。当他遇到一个不耐烦的裁判时,他会停止比赛。你必须记得在序言中讲述你的故事。如果你在做定量研究,你应该主要说你的方法,然后再说一遍结论。有些人会说它会重复,重复并不重要。不要逃避,面对你的假设和数据限制,承认它们,但认真地为自己辩护。没有一个数据是干净的,你不认为审查者期望你有非常干净的数据。另一个是清楚地说明你在前言中使用了什么数据。我们有些人写文章时甚至没有提到数据的来源。这样的文章肯定会被枪毙。如果您不指定数据来自哪里,您如何证明数据的可靠性?在序言中,应该说,不要等到以后。意识到自己的局限性,并认真保护自己。清晰的组织,不仅仅是为你自己。尤其是对于理论文章,如果你跳下去,别人不会理解。即使你后来删除了它,你的初稿也需要一步一步地阅读。你是为读者写的。你应该想象读者可能不理解你的东西。如果你的深奥的东西可以写给不在你的领域的人,并且他们能够理解,那么你是令人惊奇的。这是一个大师级的课程,当然很难实现。因此,总是想象你是为读者写作,而不是为你自己。

最后一点是要尊重规范,写作应该符合语法。这是最基本的要求,但我们许多人无法达到。中文容易写乱七八糟的东西。汉语语法本身非常松散。有时句子无限长。读完之后,你甚至不知道他在说什么。写作应该精炼,句子应该简短。所以我让我的博士生用英语写作。我认为如果你的英语写作提高了,你的中文也会提高。我们不能写复杂的英语,老梅他写了他听不懂的复杂英语。因此,张炳森说他与外国人合作。外国人说他们不明白他们写了什么,并要求他写出来。学会用精炼的语言表达复杂的意思并不容易。不要犯打字错误。有许多人没有照看它就把它送出去了。如果摘要中有错误的字符,这篇文章将被删掉。我写了这篇文章,并在最后通读了至少两遍。目前,所有的电脑都是打字的,过去充满了打字错误,所以这仍然很重要。引文也是一样的。出现在文章中的文档必须出现在参考文献中,反之亦然。这也应该检查几次。

引文和参考文献的风格应符合出版物的要求。当我编辑这份出版物时,最头痛的是这些作者最终不会为你修改它。这是一个态度的问题,它可能决定你的成败。我读过《裁判报告》,很多人说这篇文章不标准,因为引用的文章在参考文献中是看不到的。这是一个污点,可能是拍摄你的文章的重要依据。如果你连这个都做不到,你怎么能相信你的结论呢?图表也是如此。它们是根据出版物的标准制作的。不要使用颜色。我们还没有办法打印彩色图表。一点一点地说似乎很累,但如果你一开始就注意完成,你就不会感到累。相反,写作是乱七八糟的,当你回头再修改时,你会觉得很累。

第二部分,三个经济学研究的实例

举三个例子。第一个例子是我和何大兴在《经济研究》发表的一篇文章。我不打算谈论这个模型,我将简要解释我们是如何产生这个想法的。一个观察是,与其他国家相比,中国的经济增长非常成功。追赶和超越的国家有一个特点,那就是它们的社会非常平等。事实上,赶超的国家都分布在东亚。东亚的社会非常平等。土地改革是在经济层面上进行的。在社会层面没有种姓制度等社会禁忌。社会流动性非常大。此外,迎头赶上的国家有强大的政府。这两点是我们观察到的。社会平等能否解释中国的经济成功并不是唯一的解释,而是我能否从平等的角度给出一个解释。如果你想给出一个新的理论,你只需要解释一下。我们将前面的观察联系起来,即平等如何通过政府行为促进经济增长,平等是否影响政府行为,以及政府行为是否会促进经济增长。不平等的社会如何阻止政府采取好的政策?在一个不平等的社会中,存在着强大的利益集团,它有能力推翻政府。因此,政府应该善待它。政府应该与它结盟,给它大量的资源。这样,就会出现资源不匹配的情况。你给了一些人资源,他们不一定是最有生产力的,最终你的经济无法发展。另一方面,在一个平等的社会里,没有一个群体拥有可以威胁政府统治的独立权利。在这样的社会里,政府更容易将资源分配给生产率更高的人。政府的优势在于它赚得更多。你可以想象政府是一个坐在地上收集赃物并更慷慨地喂饱猎物的强盗。在这种情况下,它更有可能带来经济增长。

对文献的贡献在于对中国经济增长从平等到经济增长给出了新的解释。在文学方面,他们与琼·埃斯特万和黛博拉·雷一起,发表了一篇关于人工智能的文章。在民主研究中,民主主要通过游说来影响政府。他们的模型实际上是一个信号游戏。政府决定给哪些人提供资源,但他们不知道哪个群体更有生产力。这是一个私人信息,这些小组将发送信号。谁更容易发送信号?往往是那些财力雄厚的人,因为他财大气粗,有财力游说政府,政府就会给他们更多的资源,这样就会出现资源不匹配的情况。我们在不民主的制度下给出了一个解释。另一方面,本文在一定程度上解释了中国经济快速增长与高收入差距并存的原因。如果你给能力更强的人提供资源,可能会出现收入差异。我们的模型选择了重复博弈和马尔可夫均衡。出版后,我们仍在改进。我希望我们不会重蹈覆辙,降低经济增长。当前的模式没有经济增长。这主要是横向比较。如果包括经济增长,就需要资本积累。一旦有了资本积累,就更难建立模型了。

第二篇文章是陈斌开和我写的。陈斌·凯原是林毅夫的医生,现在中央财经大学工作。我们提出的问题是,基础设施投资有利于经济增长,但中国政府的基础设施投资可能会超过社会的最优需求,这可能会降低居民的消费。我们想解释的是为什么中国有这么多储蓄,为什么它有经常账户盈余。这篇文章只是想看看政府有多重要。

我们知道中国政府起的作用非常大,投资很多,对经济是不是扭曲作用,问题的提出是基于这样的背景。当然最简单的想法就是一个直接效应,政府收税,将税收用于投资,就会挤出居民消费,居民消费自然就会下降。我们想看到的是一个间接效应,政府的投资会不会有扭曲。第一,政府可以得到便宜的银行贷款,政府用大量土地获得大量便宜的贷款,由于资金比较便宜,有可能投资过度。第二,政府之间的竞争可能导致超额投资,政府为了吸引企业投资,将基础设施建设的非常好。比如天津的滨海新区,为了打造良好的投资环境,要建一座世界上一流的歌剧院,邀请的咨询团队都是美国纽约林肯中心的人。我估计这个项目一下子十几亿就下去了,那短期内能不能见效呢?我想大概短期内是不会见效的,滨海新区本来没人住,你还期望北京人开车去滨海新区看演出。这是一类典型的竞争导致的过度投资。政府投资往往对工业企业有补贴,因为他吸引的都是制造业。我们看一下政府之间竞争主要是在竞争制造业,为什么竞争制造业呢?制造业迁移起来较方便,你不竞争,他就跑到其他地方去了,另外制造业的市场大。它不像服务业,服务业只能服务一个地区,市场容量有限,制造业的产品可以卖到本地,可以卖到全国,甚至可以卖到全世界去。但是制造业的劳动回报率要低,它比服务业和农业的劳动回报都要低,资本利润就会上升,但是资本所有者的边际消费倾向低。这些原因都可能导致居民消费比例下降。这里给大家看一副图,我们可以看到政府的储蓄率要超过居民的储蓄率。居民的储蓄率 37.5%,最近这些年政府的储蓄率都超过45%,所以政府的投资非常大。我们这里的数据,是用的省份的数据,但我们有一个新的角度来看这个问题。基本建设投资里头有三项,一类是道路之类的真正的 Infrastructural 投资,第二类是资本性投资,最后一类是其他的投资(包括水库等),这样看的话它的投资主要是第一项,所以我们大概把它看作基础设施投资。我们首先做了一个简化式的回归(Reduced-form estimation),什么是简化式的回归呢?简化式的就是把你的解释变量放在右手边,被解释变量放在左手边,直接做回归。被解释变量就是居民消费占省的 GDP 的比重,右手边放基础设施投资占省的政府支出的比例,还有一些控制变量。 vi 是省的固定效应, vt 是时间固定效应。我们控制了什么呢?第一个是政府收入占 GDP 的比例,这就是第一个直接效应(挤出效应),我们还控制了人均 GDP 和它的平方来控制结构转型,然后控制国有企业的劳动力就业份额,还有控制了国际贸易,这些都是可能影响居民消费的变量。我们这里并没有把所有的变量都放进去,你可以说变量还不够的,但我们这里主要关注的是基础设施建设投资比例,我们这里只控制主要的变量,并不需要控制所有的变量。所以我说做经验研究,也是要讲一个故事,而不是说要找出影响居民消费的因素,这是毫无意义的。我们得出的结论是,如果基础设施建设投资占 GDP 的比重上升一个百分点,居民消费占 GDP 的比重会下降二点八个百分点,这是一个很大的效应。

我们还要想象别人会问什么问题,一个是主要的解释变量的内生性问题,那我们滞后一年、三年来看,发现结果还是非常显著。考虑到里面会有一些发现经济周期作用,所以我们用 5 年平均的办法来做,发现结果也是很显著。还有一个就是是不是省的时间趋势,所以我们又考虑了省的时间趋势,就我刚才说的用省的哑变量,既省的哑变量乘以日历时间,通过这个把时间趋势给去掉。然后我们又换了政府的支出(而不是收入)来做,也是很显著的。为什么要换呢?按理说,基础设施投资占政府支出的比例,应该控制政府的支出,但是从省的层面上,政府的支出可能跟当地经济发展没有多大关系,因为中央的补贴很多,所以后来我们主要用政府的收入,结果都很显著。反过来,如果我们的故事是对的,我们说政府的基础设施建设投资会超出社会最优水平,但是如果由私人来投资就不应该有影响。于是我们把私人投资占 GDP 的比重给放进去,发现没有影响。从反面我们也要证明自己的结论。我们这里的这些控制变量,还有一个作用就是控制省如果用私人来投资他的最优投资水平应该是多少。

我们为了解释内生性问题,又做了一个动态模型。用动态模型就是要把伪相关给去掉,在右手边加上了因变量的滞后一期,这里是用 GMM(Generalized Method of Moments)估计的结果。我们还做了消费的量,有人会说,既然基础设施建设投资有利于经济增长,那它可 能会刺激居民的消费,所以我们就看了一下居民消费倾向是不是受基础设施投资比例的影响,估计的结果显示对人均消费几乎没有影响。我们又看了一下对全国的影响,把左手边的 变量换成一个省的居民消费占全国 GDP 的比重,发现也是一个负的数据,所以它对全国也没有影响。

我们又做了结构式的回归,结构式的回归有两个故事,首先第二产业比例会上升,另外利润率会上升。先看第二产业的变化,所谓结构式的回归就是一步一步的来做。从最后一个方程看起,基础设施投资比例会影响到第二产业的比例,上面一个式子是说第二产业的比例会影响到劳动收入占比,第一个方程说劳动收入占比会影响到消费占比,实际上这是一个递归的方程。下面的资本回报也是一样的,基础设施投资影响企业利润率,企业利润率又影响劳动报酬比例,劳动报酬比例影响到居民消费比例。

我们先看一看 SUR Model(似无相关回归),然后又做了一个三阶段最小二乘回归(3SLS)。两个相对照,三阶段的更为有效,但结果是差不多的,资本回报也是一样的。这类文章,我想说的是做经验研究,一定要很仔细很小心。我们这篇文章还不是达到了最严格的标准,还是有内生性的问题。为什么我鼓励大家使用微观数据呢?微观数据内生性的问题就会小得多。省级的数据,所有的因素都是互相影响的,你想找一个干净的变量是很困难的。我们这里也没有试图去找所谓的干净变量,更没有找工具变量,因为找不到,你只能靠 argue,所以我还是鼓励大家多用微观数据做计量研究。

最后一个例子,我想讲的是市场化与党的精英化,这个问题其实是一个很重要的问题。我们观察到在过去三十年中国共产党的党员人数增长了一倍。在 1989 年,一位华人社会学家倪志伟(Victor Nee),在 《美国社会学评论》 上发表了一篇非常有影响的文章。他提出来,随着市场化的进展,共产党对老百姓的吸引力将会越来越小。所以他就预测,共产党在所有的转型国家,影响会越来越小,党员人数也会越来越少。但显然中国和越南,所发生的都不是这么回事,那是什么因素导致在过去三十年间,党员人数增长了一倍?

现有的解释分别从需求方和供给方分别来分析。需求方就是说入党有回报,党员的回报其实是非常高的,有很多人做过研究。清华大学的李宏彬用双胞胎来做,按理说双胞胎生下来能力都差不多,一个入党了,一个没有入党,最后发现入党的收入要高一些。其实这里还是有问题,我想问一下为什么一个入党了,另外一个不入党呢?之所以入党可能是因为他能力比较强。双胞胎的能力也可能不一样,在家里可能差不多,但是到了外面就不一样。另外在家里可能也不一样,晚生一分钟的那个孩子,就可能没有他哥哥能力强。所以基本还是没有解决“鸡生蛋、蛋生鸡”的问题。但是需求方面的研究,基本上还是可以肯定,入党是有回报的。供给方面的分析是说党加强了一些方面的门槛,比如党更加的倾向于精英化,我们看到的结果也是这样的,高校里面发展党员非常迅速,特别是 985 高校,想入党的基本都可以入党。供给方面的分析认为党需要精英人才来管理社会,所以它越来越趋向于精英化。我们的工作就是想在一个统一的框架中讨论党在市场化进程中精英化的倾向。我们的故事是这样的:给定市场化程度,党会把更多的资源放在哪里呢?它会把更多的资源投放到高租金行业中,也就是这些带有垄断性质的行业,提高这些行业的党员回报。为什么它会这么做?因为在高租金行业中提高党员的回报相对容易一点,因为有更多的租金去挖掘,或者说高租金行业提高党员回报的成本更低。如果一个行业非常竞争,你要提高党员收入是非常难。随着市场化程度的加深,这个倾向会更加明显,因为你要吸引有能力的人入党,就更要在高租金行业中提高党员的回报。我们想用数据来证明我们的结论,胡赟之,是我的一个硕士生,他秋天要去芝加哥大学学习,他已经做了一些,我不准备去讲。我们现在有一个简单的理论模型,这个理论模型不是要给出一个解释,而是为我们的经验研究铺路。但实际中,我自己在写这个模型的时候也感觉到,之前可能有一些没有想清楚的东西。只有真正写理论模型的时候才知道,问题的关键在哪里。我非常简单的讲一下我们的模型。首先说一下我们的结论和猜想:第一,党的组织资源向高租金行业集中;第二,高租金行业的党员回报要高于低租金行业的党员回报,党员人数也高于低租金行业,市场化导致党的组织资源向高租金行业进一步集中。

在这个模型中,考虑个人的能力是一个[0,1]的连续分布,高租金行业 H,低租金行业 L,非党员的工资是 Aδ,A 就是教育回报,党员的回报是一个 CES 的生产函数,它有两个投入,一个是你自己能力 δ,另外一个是党的组织资源的投入 S,i 表示高租金或者低租金行业。我做了一个假设就是 Ai,可以看做是高租金或者低租金行业的一个标志,AHAL。入党对你的能力是有一些损失的,你要投入一些精力到党的事务里面,这个假设主要是为了后面的结论。纯粹从物质利益的角度考虑,一个人要入党肯定回报要高于不入党的回报,不然是没有动机去入党的。我们就可以得到一个 δ,小于 δ*的人他就会选择入党,能力高的人他自己奋斗就可以了,不需要入党。但是是否决定入党,还取决于个人的意识形态,有些人他就不喜欢党的诉求。我们这里假设意识形态与个人的能力没有关系,所以实际入党人数和满足入党条件的人数成一个固定比例关系。 党组织面临一个最大化党员的收入之和的问题,H 行业的党员收入加上 L 行业的党员收入,组织资源有一个约束条件,这样我们可以得到一阶条件,然后我们也看了它的二阶条件。从一阶条件很容易看出来,党在高租金行业投入的组织资源高于低租金行业投入的组织资源,相应的高租金行业的就业者更容易入党,直觉就是党在高租金行业的组织资源投入相对比较便宜。第二个命题就是第一个命题的简单外推,高租金行业比低租金行业的党员更加精英化,当更多的组织资源投入到高租金行业的时候,更多的高能力的人就会入党,它的精英化程度就会提高。第三个命题是高租金行业的党员回报高于低租金行业的党员回报。命题四就是个简单的推论,党员更倾向于到高租金行业中去。市场化导致个人能力回报增加,就是A 会增加,以此代表市场化。

市场化有两个效果,党对个人的吸引力就会下降,因为市场回报增加了;但是党的组织资源变得相对稀缺了,因为竞争对手更强大了,这种情况下强化了当向高租金行业组织资源投入的倾向,这就是命题五。我们的数据,一个是 CHIPs 的数据,它的 2002 年的数据有很详细的党员数据;另外一个数据来自于 CGSS(China general social survey),这个数据中还问到了你有没有提出申请;我们也用到了一个党内的统计,内部资料统计了从 1921 年建党开始到 2000 年的党员统计。

第三部分,总结经济学理论的目标是解释世界,不是预测和改造世界,这一点上我们要抵制教育部的要求。教育部老喜欢让我们搞预测,给领导写报告,领导要是有一个批示,那就是非常重大的成果。经济学还是解释世界,我们其实没有预测能力,像经济危机那么大的事件,根本没有人预测到。如果我们的目标是解释世界,那么就应该有的放矢,坚持问题导向的研究。做经验研究要有理论贡献,不是说拿一堆数据做回归,一定要问我的文章对理论有什么贡献,有没有一个新的发现,描述完一遍世界,要给人一个惊喜。在方法论方面,要有联想,经济学研究还是个高门槛,为什么门槛高呢?建立起不同理论之间的联系是不容易的,要建立起理论跟经验观察之间的联系就更为困难了。你有一个很好的经验观察,你用什么理论来解释,这并不一定容易,很多人就是卡在这里过不了关。所以要建立各种理论,经验事实,以及经验与理论之间的联想,我想这是发现一些别人没发现的东西的一个关键性的地方。最后要坚持片面而深刻,拒绝广博而肤浅,我们一定要承认我们的片面。你只要说一个小故事,解释一个机制就可以了,不要想着把所有的因素都一下子做出来。

有一次一个学数学的转过来学经济学,他说你们这些经济学家做的都不叫经济学,做的都太简单。我要做的是写一个模型,把世界复制一遍。我说你肯定是没把经济学给搞懂,如果你一个理论模型可以把我们生活的这个世界描述一遍,那你那个世界就是机械的世界。经济学没办法把世界描述一遍,做不到这一点,即便是物理学也没办法把自然描述一遍。物理世界机械的东西毕竟更多一些,但是这个世界中的经济活动,它不是机械的,它是人组成的,我们经济学家的任务不是去复制这个世界,而是去解释这个世界。各种不同的解释连在一起,我们才能反映一个真实的世界,在才是我们的世界。