Categories
事儿关经济

统计学和计量经济学的神奇?

我又要从方法论上说事儿了。关于计量经济学的应用,着实有一种“泛滥”的感觉。尤其是在前段时间和一些同学争论“格林兰因果检验”的时候,对那种“把统计检验结果奉若至宝”的态度实在是感到心痛。这种检验也就是摊上了一个好名字,最多可以否定一下因果关系(这还有待商榷),哪能作为肯定的依据?

这两天和Taiyun WeiYihui两位同学交流甚多,他们都是统计学专业科班出身的,可谓对于统计学的认识颇深。让我这么一个连本专业经济学都还没出师的对于统计、计量的看法和认识深入了很多。确实,计量只是一个工具,不能替代真实的世界中的因果关系(causal-relationship),虽然很多计量经济学家都在热衷于这件事儿。

到底,统计学和计量经济学应该在经济学分析中扮演什么角色?

下面是Taiyun Wei同学不辞辛苦整理贴给我的东西:

-------------------------------------以下引用其原文-------------------------------------

只是统计上的因果,能否定因果关系,却不能反过来支持因果关系。

我之前也这么认为,但是我目前的看法是:统计上的因果,即不能否定因果关系,也不能支持因果关系。之所以说不能否定因果关系,是因为实际条件可能错 综复杂,相互影响、噪声影响可能很严重。还有即便是统计方法,可能不同的方法得到的结果都是不一样的,有的支持有的不支持,这时候应该怎么选择呢?

下面是 我和朋友们的一些讨论,不当之处尽管批评:

  • 我觉得现实生活中的因果关系不可能从数学或者统计分析中得到,因果关系是一种很强的关系,只能通过对具体问题机理的分析、 验证才能确定,单纯从数据来看,很不安全。计量经济学中有个著名的granger因果检验,我觉得它的局限性很大,但也算是没有办法的办法了。我的基本统 计观是:实体科学为主,统计分析为客。统计永远是为实体科学服务的,固然十分重要,但不能反客为主。——魏太云
  • 目前学界的结论是,部分因果关系是可以推导出来的,当某些条件符合的时候
    有本非常经典的书,叫 《caustion,prediction and search 》,这里第一章就讨论到这个问题。你有兴趣的话可以去看看。当然,这些条件很容易就被人攻击。比如,有一个条件是,所有的variables of the system should be included or measured。这就是说,如果某一个变量的数据无法取得的话,那么从这个相关矩阵中找到的因果关系可能就是错的。——黄兄
  • 真正的因果关系,应该是排除宇宙中(或者一个更大的未知全集)所有其它变量的影响,看剩下的两个变量是否有时间上的先后必然关系。这样一来,太阳黑子、宇 宙射线、外星人、植物释放的氧气、到COS论坛注册的人数、蝴蝶是否扇动了翅膀等都应该纳入回归方程……计量经济学家如何解决这个问题呢?(很不幸,格兰 杰因果检验的横行似乎把原始问题掩盖了
  • 我对计量经济学的意见很大,以至于后来彻底放弃了这方面的学习,以上因果关系的问题便是原因之一。
    当然我不否认他们很认真,他们付出了很多努力,但如果是我的话,我不会钻进这个角落,我会用脑子(用心理学、经济学、社会学等)去验证因果关系,而不是用数学推导。有时候我觉得统计和量化就有点“过犹不及”的意思,导致我们训练出一批“有知识、没常识”的数学家。——谢兄
  • 本科时候读Wooldridge中级计量的书,觉得比Weisberg的应用线性回归写的好。当时只是觉得他对于 ceteris paribus(Rubin曾讨论过这个假定与其理论的关系)得解释很深入。最近在听Chen S.X老师计量专题的同时细细的看了Wooldridge高级计量书的某些细节,才恍然大悟:原来计量经济学家一直都在做causal inference。

    翻译错误:不是“房间”,是“月亮”!感谢Yihui
  • 这种说法不是没有根据的!Wooldridge在Econometric Analysis of Cross Section and Panel Data开篇就是“因果关系与其他条件不变分析”,阐释了计量经济学对于因果关系的关注。在书的Chaper 18, 专门介绍了Rubin的虚拟事实模型,这在统计学的教科书中几乎是找不到的!不过糟糕的是,中文翻译者根本不懂因果推断,把ignorability翻译 成“不可知性”,差之毫厘,谬以千里!在章,Wooldridge还介绍了Propensity Score以及Principal Stratification(Wooldridge写书的时候Frangakis和Rubin的文章还没有发表,所以后者没有被明确的提出),这些都是 因果的核心概念。
    老板认为,计量经济学讨论的endogeneity和exogeneity,就是流行病学讨论的有无confounding的问题。知道了两者的关系,则茅塞顿开。
    至此,我除了佩服老板的统计直觉以外,还不得不对这些关注因果的计量经济学家表示充分的敬意,因为要想从observational data推断因果,真是难于上青天!据说,Hume认为,这是不可能的。——丁兄

说这些话不是说统计无用,相反,统计很有用,但要具体问题具体分析,用得合适、恰当,而不要盲目套模型。但怎么用得恰当,可是很大的一个问题。正如号称经济学家的人那么多,但真正会用的有几个?

------------------------------------引用结束-----------------------------------------

看完之后,我的心里颇为一沉,印证了很多我在现实中隐隐约约体会到的对于计量经济学应用(尤其是初学者滥用)的疑惑。虽然其中某些观点稍显偏激,但是在现实中的事实是,太多的急功近利的行为导致了计量经济学、统计学的滥用。经济学专业的学生不去关注经济规律本身和客观的物质世界,只知道一头埋在统计数据里面企图挖掘出来什么鲜为人知的关系。这说明了人们的思考角度已经不是事物本身,而实证检验的英文原文empirical指的是"经验主义",而不是中文那般美化的仿佛就是现实中的必然规律似的。太多人忽视了统计应用的前提假设,胡乱把一堆例如结构方程模型(SEM)和数据包络(DEA)的东西随便应用到自己的分析中去,而不去严格的证明为什么可以这么用,为什么不会导致结果失真(或许他们也根本证明不了、没有意识去证明)。到这里,我不得不悲哀的说,这已经不是一个方法论的问题,而是彻底的世界观出问题了——认知世界怎么能全部依赖统计

然后看了Yihui写的一系列文章(三篇,针对低年级统计学专业学生的),外加一两篇分析。网址分别列出,只挑选其中部分内容转载。

----------------------------------------引用开始------------------------------------------

我们先看最简单的一个例子:t检验。我想只要是个学统计的必然都知道这个检验,它是用来检验位置参数的,比如单个样本的 均值是否为0,两样本的均值是否无差异,等等。我们也都知道这个线索:t检验需要t统计量,而t统计量的来历是独立的正态随机变量与卡方随机变量平方根之商(卡方要除以自己的自由度),实际应用中,这里的分母往往就是样本标准差。在t分布被Gosset发表之前,人们往往只能用总体标准差作为分布构造标准 正态随机变量来做检验和估计,Gosset的t分布伟大贡献在于,我们可以用可知的样本标准差替换不可知的总体标准差而且构造t统计量,这下就让人放心多 了,因为我们总是畏惧未知的总体(或者未知的参数),而且在小样本情况下更为畏惧——样本量太少我们就更不敢对总体标准差作出估计。

Gosset的确帮助我们解决了个大麻烦,然而t检验仍然要假设总体服从正态分布,这个麻烦可不好解决。可能马上就会有人说,分布也是可以检验的啊。没 错,是可以检验,比如著名的KS检验;问题就在于,统计分布检验的备择假设太大,我们做假设检验只能有把握得出“样本不服从某种分布”,而不能说“根据检验,样本服从某种分布”:因为犯第一类错误的概率可以控制,而第二类错误的概率只有鬼才知道(不干鬼的事,鬼也许也不知道)。

第二个例子我想稍微说一点关于抽样调查中的统计推断,这里面的统计推断往往比较简单,大致原理就是用样本均值估计总体均 值,样本方差估计总体方差,为什么能这样呢?因为这些估计量往往都是无偏估计,不妨仔细想想“无偏”的意思:期望等于真值;注意不是估计量等于真值,那期 望是什么意思呢?通俗来讲,期望就是一个随机变量按照它的分布不停地变变变,变了无数次之后我们看它在“平均”意义下取值为多少,当然抽样工作不可能一遍 一遍无穷做下去,我们一般仅有一次抽样,得到的估计量也就只有一个值,这一个孤零零的估计值,到底离真实值有多远?只能再去问问鬼。此时可能又有人会说, 我们不是还有方差吗?不是可以做置信区间的估计吗?没错,书上都是这么写的。方差有什么用呢?书上说了,方差是度量离散程度的,试着想一下,告诉你一个随 机变量均值为100,方差为1000,你能想出所谓的“离散程度”是怎样的吗?恐怕也难以想象,所以除非方差为零,否则我一向觉得它在描述统计中并没多大 实际意义(它的确是刻画离散程度的,但怎样叫大怎样叫小?没有标准)。再看置信区间,要谈置信区间一般也就不可避免要用到分布,于是假设条件又来了,一方 面是总体独立同分布,另一方面样本量足够大,这样才能根据中心极限定理构造正态分布随机变量。显然,两个问题来了:抽样能保证独立同分布吗?怎样的样本量 才算作大?又是不好回答的问题。例如分层和整群抽样,很能让人怀疑样本的独立性;而大样本的问题,从数理统计角度(中心极限定理)来看,必须是样本量趋于无穷,显然这是不可能的,若样本量趋于无穷了,那我们还抽什么样?

-我们的下一代必是男孩!-但是他们是选择样本!

其实,关于统计模型的这种质疑,也不是机器学习出现后才开始有的,以前看Gujarati的"Basic Econometrics"一书,曾经读到一段很有意思的话:

Economists' search for "truth" has over the years given rise to the view that economists are people searching in a dark room for a non-existent black cat; econometricians are regularly accused of finding one.
-- Peter Kennedy, A Guide to Econometrics, 3d ed., The MIT Press, Cambridge, Mass., 1992, p.82

经济学家们“在一间黑屋子里找一只本不存在的黑色的猫”,而计量经济学家往往会宣称他们找到了一只这样的猫。听起来很可笑,但从某种意义上来讲,我们何尝不是在做这样的事情?

----------------------------------------引用结束------------------------------------------

原文:谢益辉:关于统计推断的一些惴惴不安

这一篇可谓是最通俗的说明了他的所有观点的,此外还有几篇文章:

个人认为都是非常值得一看的。不再直接粘贴过来原文,敬请直接移步。

注,漫画英文来自:http://myhome.iolfree.ie/%7Elightbulb/Research.html 由我翻译为中文并直接修改图片。

Categories
读书有感

真实的大数定理[2nd week, May]

记得几周前上课的时候乔老师说过,股市上唯一能帮你挣钱的就是大数定理。其实感觉现在的经济学研究越来越像统计学应用,到处都是大量的数据加上统计计量。可能从哲学的观点上这样是有点麻木的,但是可能对于现在的学者来说似乎没有更好的办法。

最近我对大数定理也是感触颇深,一直在写一篇关于FDI的论文[Manuscript NO.5],其中对组员唯一的要求就是“数据尽可能全面、统计口径保持一致”。记得前段时间国家统计局也强调说“统计数据必须保持真实,否则会影响宏观经济决策和预测”。由此可见一斑。It's better later than never.

然后就是下周四要做一个英文的presentation,可能会持续15-25分钟,PDF是中英对照的,但是我会全部用英语陈述——因为主要是给一位瑞典老师讲的,不用英语他也听不懂啊!

附上一张赠书给他的照片:

内容是关于寒假的那篇论文:济南市柳埠国家森林公园生态经济价值评估(Evaluation of Ecological Economic Functions of Jinan Liubu National Forest Park)。好象是第一次讲自己写的东西,虽然PDF做的比较简单,但是也不怕他们提出什么问题来,毕竟对这篇文章我现在几乎就是烂熟于胸到不愿意去看了。这比讲拼凑起来的其他人的东西容易多了!听取一些意见看看吧。

PDF下载/PDF available Here:http://www.loyhome.cn/Evaluation_of_Ecological_Economic_Functions.pdf

在线版:
Evaluation of Ecological Economic Functions of Jinan Liubu National Forest Park

Publish at Scribd or explore others: Business & Economics Research forest park ecological economics

另外打算暑假的时候写一篇关于劳动力的论文[Manuscript NO.6],可能会用到CHNS和DHS的一些数据。这样罗列起来手里已经积压着6个题目了,去掉FDI还有5个。大概暑假的时候只会挑着其中的两三个写写吧。估计也足够了。

最后例行的说一下这周看的东西:

  • 《经济研究》4月份的一篇:《公共部门与非公共部门工资差异》,昨天被薛欣欣老师批的一塌糊涂的一篇破文章,我们都叫嚣着要整理批判意见投给经济研究杂志社。
  • 《经济学动态》2009.4 一些最新的动态

可以看出来我越来越懒了,除了查找一些文献外都不怎么看书了。讲座也一场都没听,只是看看照片过瘾就算了

Categories
互联网产业观察

博客的话语权

题记

我写博客可以称得上随意,基本都是自己再用什么才会去关注什么,然后顺带的去写点东西。因而,前段时间一直在忙活的学业,博客上大量充斥的就是此类的东西。不知道读者们怎么看,我是觉得博客的可读性降低了,毕竟我的立意是“专注经济视角下的互联网”,而不是一个经济学知识普及网站或者观点交流的地方。

昨天一位朋友提及我以前写的一篇文章,我自己回头好好看了看,才发现自己现在写的东西和原来几乎迥异——才半年多的时间啊!所以,沉淀的应该更多才是。对于互联网产业,无论是并购案还是google苹果相互持股案,我都没有太多的感触了——不知道是看透本质的麻木还是对于网路上新闻的沉静。Cnbeta已经只是扫扫标题了,不至于成为火星来客就可以了。但是今天要说的,关于“话语权”,则是离开济南那段没有网络的时间发生的一些事儿的感触。

中文博客的窘境

不知道多少人了解中国国内博客的现状,我想新浪搜狐QQ空间之流还是应该暂时从下文中所说的博客中去除,因为很多人在那里并不是为了发出自己的声音,而更多的只是一种记录生活的方式——类似于电子日记?所以,话语权对他们来说可能并没有太多的意义。然而大洋彼岸的美国,则是博客占据舆论半边天空的时代。相比而言,国内的这些独立博客的作者就更显得楚楚可怜了。虽然有Wordpress这种便利的武器可以很快地搭建一个舆论平台,但是坚持原创的实在是少之又少,很多网站只是随便的采集一些东西然后期待点击广告的流量。 或许大家都公认的一个事实是,独立博客是赔钱的,纯属个人爱好。

因而,在这样的情景下,大众对于博客的舆论功效认识不足是显而易见的。在这样一个混乱的市场上,对于普通读者来说“选择成本”实在是太高,鉴别信息价值的难度更是让人望而生畏(没有一两年的浸淫,没有长久的关注,实在是难以分辨)。况且,国内的言论管制也不是一天两天的事儿了,包括我在内的很多博客作者也因此懒的去触动警戒线,在这种共同的作用下大家自愿或者被迫无奈的放弃了博客的话语权。或许从经济学角度,我们可以简单的看作一个“劣币驱逐良币”的过程,但是实际上的悲苦辛酸,又岂是一个高度抽象冷冰冰的经济模型所能一言以蔽之的?博客作者的众多无奈,到最后大家都只是一种出于理想化的坚持。在这个copy+paste的时代,简单的ctrl+c/v就可以毫不留情的复制所有的东西,实在是让坚持原创的人们心寒。这是技术进步的福音(从某种程度上,这是正外部性——一个东西对于周围环境有益的影响——最大发挥的途径),还是对于凸现了对私有产权脆弱保护的不堪一击。

坚持的意义

回到最初的题目。起因就是我的一位朋友,很著名的中文博客作者Jason Ng,由于不满淘宝卖家的服务态度,给了差评之后的一番风波。可以说,很幸运的是,有象我这位朋友一般的人会去在乎、会去站出来维权。而且,他有一个读众广泛颇具影响力的博客——这就足够了。在原文被Cnbeta全文转载之后,网上掀起了好一阵子讨论——这也印证了淘宝存在问题已久、民愤已经不是一天两天的事儿了。虽然我并不是特别赞同他文中一些有点武断和偏激的说法,但是就自身的经验来说,在淘宝确实也是吃了好几次亏到现在才能从容不迫的去买到质优价廉的东西——但是不得不承认,选择和鉴别的成本实在是太高。

这位朋友这么一个简单的动作——打一些文字,发到自己的博客上,让人真真切切的体会到独立博客的力量。这不是在新浪那种媒体编辑手中炒作起来的,也一不是某些所谓“草根”的噱头。很平实的力量,却让众多的博客作者感到振奋。一件很小的事情,却足以彰显独立博客的力量。很喜欢那个朋友写在结尾的那句话:要知道,得罪一个拥有博客的人是有代价的。

因而,我想很多写博客的人,尤其是在博客有着很大的访问量和影响力的时候,都深深地感到了自己的责任感。我现在写博客已经不如以往那般随意,除了读书笔记这种东西有很强的主观想法和随意性,其他的文章大都是经历了一番沉思之后才会动笔写成的。毕竟要考虑到的东西太多太多,已经不是简简单单的博客可以承载的。

漫漫长路上的话语权

前面的文字在话语权这个问题上显得有些过于悲观了,其实也并不是这般严重的。毕竟随着时间的进步,我们会找到更好的方式去捍卫自己的版权和话语权。相信这只是一个时间问题,毕竟社会还是在不断进步的——不仅仅是经济的增长,还有道德等等一系列足以约束人们行为思想的东西。故而,这并不是一个过于遥远的梦想。

一路走过来,从校刊到电视台到网络媒体,从编辑到记者到策划,我有时戏称自己把所有的舆论平台都做过了。诚然,有很多东西还是我浅薄的经历中所没有接触到的,毕竟在学校这棵大树下还是好乘凉的。或许,只能说是直觉,博客必然是网络发展多元化的舆论产物。在这个追求自由的时代,我想越来越多的人会不甘于某些机械的控制。

政治学上常说,国家是暴力机器。可是,毕竟它暴力的权利正是我们每个人赋予的,并不是与生俱来的。或许在公众的选择中,有些东西始终是不可或缺的。话说,谁会为自由呐喊?

Categories
读书有感

缺乏读书的时间?[1st week, May]

记得前阵子也写过一篇关于时间管理的文章。感慨之余,却真的不知道自己的时间怎么安排才够用。从北京回来,每天12个小时的GRE复习时间,真的不知道如何保证。时间……

上周,AW完毕之后难得的短暂休息调整。去找了曹廷求老师,他给我列了几篇文章,让我看完后去找他。下了下来,却始终没有时间去看。还有关于FDI的那堆数据,在往返北京的火车上匆匆的整了整,也不甚满意。

在北京买了很多书,前几天也简单的列过。大概想近期读的就是:

  • 《尤利西斯的自缚》,冯克利。
  • 《中国哲学史》,冯友兰。

都是一些和哲学有关的书,也是时候补补这些课了。

不说什么了。这大概也是第一次把每周的备忘拖到了下一周。日后再说吧。

P.S. 刚刚看到了东北财大招生试题,颇为自卑了一番。网址附上:http://wang-dingding.blog.sohu.com/115580005.html

Categories
读书有感

本周学习感言[4th week, April]

总是感觉这阵子的生活过于慌乱,很多事情都是匆匆忙忙的去做,然后也不知道该如何收场。

譬如总算考完了GRE AW部分,但是出来之后却没有任何感觉,好的感觉也没有,坏的感觉也没有,就好像只是去测了个无关痛痒的普通话而已。我也不知道自己这是怎么了,生活的这么颓废。或者,有点怀疑自己想要的究竟是什么了。

周三下午的时候应付完那个有点无奈的发飙的老师,跑到经管楼和陈老师聊了一会,突然间不知道自己想做的究竟是什么了。昨天春游的时候和王洋也讨论了这个问题,出国有点不知道到底是为了什么。不想拿到PHD之后进高校或者科研机构,实在是厌倦了科研制度的黑暗,不知道这是公共品还是私有品了,反正是一团混乱。不想进某些“血汗工厂”,拿着自己的青春精力去换所谓的高薪。

这一周,匆匆忙忙的,为了赶一些事情,读了这些东西:

  • The market for" lemons": quality uncertainty and the market mechanism
    GA Akerlof - The quarterly journal of economics, 1970
    一篇关于“柠檬市场(二手车市场)”的经典文章,叙述了不对称信息下旧货市场崩溃的可能性及事实情况。显然,这个是信息经济学课后的参考文献
  • FDI and Infrastructure 的一些文献。感觉中文的文章很少,只有一篇社科院的2005年的专门写过这个问题。更多的则是综合考虑FDI的情况。看了很多文献,发现我们不得不去做实证,理论上没什么好分析和创新的。我也对这个coursework很无奈,但是又不得不去做。所以这周大好的时间都浪费在搜集数据上了,目前选定的是昆山和东莞,想做一个两地的对比研究——因为产业结构等等实在是太像了。
  • 同时,为了应付实证要用的面板数据,我们不得不开始学习panel data那些什么固定效应模型,随机效应模型之类的东西。翻了翻伍德里奇那本书,开始稍稍明白一些了。最终还得仰仗欣欣姐的指点~
  • 《高级微观经济学--产业组织理论、拍卖和激励理论(Topics in Microeconomics:Industrial Organization,Auctions,and Incentives)》这本书,作为初步从中级微观走向高级微观的尝试(虽然以前也读过范里安的microeconomic analysis),主要关注的是“产业组织理论(基于博弈论)”和“拍卖理论”、“契约理论”以及牵扯到激励理论的“锦标赛模型”。用了一下午草草的看了看,总不能对不起花掉的近50大洋。有一些直观的感受和印象了,但是还是没有办法沉下心来好好的耗费时间去一个个的推导。或许这就是没有老师去讲,不是课本的书的悲哀。也许,只有用到的时候才会想起来去好好的看一看吧。懒惰啊!
  • 然后就是business week这种充满新闻的尖锐和独特的杂志,当时是为了找点GRE写作的感觉的,看完之后倒是收获不少。颇为欣慰的就是自己的英文阅读能力在这半年的强制锻炼中增加了不少,从英文文献到各种杂志书籍,以及大片的英文网站充斥在浏览器之中,感觉自己的阅读能力和写作能力直接不是一个档次的了——写作时候的贫乏感!什么适合我的英文表述能力和中文能相提并论,我就大大的满足了。
  • 最后就是关于public choice的一些东西。很悲哀的发现作为经济学专业,“公共经济学”这门课居然不开,更过分的是财政学专业虽然开这门课,但是讲的完全不是那么一回事儿。山大经济学院没有研究“公共经济学”的吗?或许我只能这样宽慰自己——就像去年感慨为什么不开“制度经济学”一样(好在这学期的徐超丽老师的法经济学几乎就是串着制度经济学讲的)。没有这门课,我所能做得就是感兴趣的公共选择理论的“投票制度”。记得第一次对这个问题感兴趣还是学习中级微观和阅读科斯的论文、张五常《卖桔者言》和一堆散文集的时候(大概也就是那个时候才正儿八经的开始学习经济学,开始关注新制度经济学)。而后就因为课程的缘故中断了对于这一块儿的学习。直到前几天给导师发邮件,他建议我去看看“公共选择理论”,我才开始突然间又拾起这些东西,却一时找不到适合的书(布坎南 or Arrow?阿罗的东西我都几乎没看懂过哎)。或者现在,已经不应该依赖教材了?而是应该wiki一下找几篇经典论文读读了?
  • 要读的还有那些关于西方哲学史的东西,从《理想国》到《思想录》,还有很多很多……突然间觉得自己从未学过这些东西,大有悲哀之感~

好了,啰嗦完了这么多,我也不再哀叹了。昨天做了一件很费心的事儿,就是把自己的简历草草的写了一下,然后开始在招聘网站上四处投了。希望暑假能有个地方去实习,目前倾向的有:零售业、物流业和银行。证券保险我就不去了,那点儿金融投资学的知识还不够丢人的。

还有,昨天的春游很开心,虽然水濂峡那个破地方……还有没碰到辛辛苦苦帮我送吃的来的小C……真是对不住他!还在回来的路上买了两个黄金灿灿的瓜(貌似品种叫”伊丽莎白“?,图片附下),好甜啊!生活真是幸福!
2008325101025