Categories
事儿关经济

经济危机和经济衰退对于个体的一些影响

学宏观经济学的时候,就算是入门的课程,多多少少大家都会学过一些经济周期模型,最有名的可能是“熊彼特经济周期”?经济周期其实是个很泛泛的定义,但至少周期两个字说明了这是一个有起有落的过程,而不是一味地单调上升或者下降。那么,既然有周期,就有相应的经济危机,比如08年的次贷危机,比如97年的亚洲金融风暴。经济危机造成的后果自然就是经济衰退了。

那么这一次新冠病毒算不算经济危机呢?至今,或许还没有一个明确的答案。它来势汹汹,搞得我们措手不及,却不是直接在经济系统本身爆发。它导致大家停业歇工,所以生产和消费双双下降,GDP的数字自然下降。但可能大家感觉起来,这个冲击是对不同人群不同力度的。多亏互联网发展,能远程办公的行业,是不是收到的冲击就会小很多、个别甚至受益于此呢?美国股票在三月份一泻千里的时候,大家确实感慨经济危机到来了,然而现在一飞冲天又怎么说呢?

从美国GDP和失业率的数字来看,美国现在已经是处于经济衰退了。NBER早些时间正式宣布了2020年2月是上一个增长阶段的顶峰,现在开始进入衰退。他们网站上这张表还是蛮有意思的,摘抄过来,顺便标注一下我有记忆的一些事件:

(如果表格不能正常显示,请点进全文。我的网站css可能有些问题,暂时没时间修...)

Turning Point DatePeak or TroughAnnouncement Date with Link
February 2020
新冠病毒
PeakJune 8, 2020
June 2009TroughSeptember 20, 2010
December 2007
次贷危机
PeakDecember 1, 2008
November 2001TroughJuly 17, 2003
March 2001
互联网泡沫
PeakNovember 26, 2001
March 1991TroughDecember 22, 1992
July 1990PeakApril 25, 1991
November 1982TroughJuly 8, 1983
July 1981PeakJanuary 6, 1982
July 1980TroughJuly 8, 1981
January 1980PeakJune 3, 1980

既然经济衰退已经是事实,那么我们会有一些什么样的预期呢?很多人一说到经济危机,条件反射就是那张大衰退时期牛奶被白白倒掉的照片。时至今日,显然倒牛奶给我们的视觉冲击依旧,而个人却可能有更切身的体会。比如,今年毕业找工作的,或者原计划来美国留学的。随着一波又一波的裁员和招聘收紧,面临人生重大“跳跃”的人群突然不知道能不能顺利地到达彼岸了。

关于这群人的命运,Oreopoulos, P., Von Wachter, T., & Heisz, A. (2006)的这篇论文可以给出一些答案。总体而言,应届生被迫一开始接受不甚理想的工作(更低一些的工资 -9%、加入规模小一些的企业等),虽然这些差别会在十年之后慢慢消退。而且可以预见的,能力更强的学生(即拥更高人力资本)受到的冲击会小于相对能力较弱的学生。JG Altonji, LB Kahn, JD Speer (2016)也佐证了-10%这个冲击幅度。Liu, KG Salvanes, EØ Sørensen (2016)也观察到失业率每上升一个百分点,初始收入则下降6个百分点(挪威的数据)。

此外,如果我们针对特定的行业(比如学术界,一般来说学术界的职业发展路径相对直接),长期的影响可能会更明显。P Oyer (2006)研究了经济学界的大小年现象,在这个初始教职很大程度上决定了整个发展路径的行业。他发现若是初始工作的机构排名高,那么3-15年后工作的机构排名也会高0.6。如果一开始在前50的机构工作,那么他们会有60%更高的概率依旧在前50工作。而经济危机会冲击到教职市场的供需平衡,导致应届毕业生找到的教职更差。P Oyer (2008) 的另一篇文章则在华尔街找到了类似的答案:股票市场好的时候,MBA应届生更可能直接去华尔街工作,而后续更可能呆在华尔街并赚更多的钱(差别有1.5-5百万美金这样)。

P Oyer (2006) 里面提出了一个很有意思的观点:如果一个经济学家足够聪明,那么他应该试图规划每次换工作的时间,争取在大年内找到更好的工作。可能对于学术圈来说,推迟毕业时间等等都可以达到如此的效果。这样的策略是不是也能应用到其他行业呢?Marginal Revolution在2009年有一篇很有意思的讨论——人们在经济衰退的时候是不是应该重返校园?每个人的观点都不同,不过听起来重新读书并不一定可以帮助人们完全跳过经济衰退的负面影响。人生有时逃不过一命二运三风水,想改变环境的约束并不是那么容易。

说完了找工作,那再说一下收入不均的问题。最近很多人在贴美国收入不均等的数据。确实,从二战结束之后到现在,美国的财富分布不是更均衡了,而是更集中在少数人群手里了。这背后有很多制度的原因,而经济危机成为了推波助澜的帮凶。每一次经济危机之后,最先恢复的都是富裕阶层,而中产阶级则更有可能跌入贫困阶层。Saez (2016) 的数据显示,最富有的1%群体在次贷危机之后的财富增长速度是剩余99%的人的两倍。此外,NTY也有报道,直到2016年,只有最富裕的10%恢复到了次贷危机前的财富水平,其他90%尚有所缩水。各种原因其实也不难解释。财富越多,就越有可能依赖资本性收入而不是劳动收入(即工资)。而一旦进入贫富状况需要借钱生存,那资金流动性的约束就越可能更强。比如在美国,很多人住房租日付的酒店而不是月付的公寓,就是因为无法一次性拿出一个月的租金,而其收入本身可能就是日结的(例如uber司机)。这样一来,其住宿成本无法降低,反而更加剧了流动性约束的陷阱。这只是一个例子,流动性的约束无所不在,只是不同程度罢了。经济危机对流动性的冲击,可能对于个人是毁灭性的。

暂时就想到这两个主要的关于经济衰退的议题。后面若是想到更多,会再加以补充吧。最近不知不觉看了这么多Saez的文章,感觉是不是可以溜过去旁听一些他的课呢...

Categories
读书有感

有断点:Bunching还是断点回归?

最近看到微博上有人提到了Bunching,因其和RDD (regression discontinuity design, 中文一般译作断点回归,也有人缩写为RD)很形似,所以好奇心起,找了相关的论文读了一下。其实很久不看方法论的东西了,满脑子想的其实都是一些实践应用的问题。Bunching却是我孤陋寡闻了,可能其主要应用的领域(公共财政)我不是特别关心吧。

计量经济学里面有很多好玩的“术”,很多都是一张图讲清楚,比如断点回归,比如synthetic control(中文有时译作合成控制法),Bunching大概也可以算作此类。昨晚通读了一下Kleven (2016)的综述,觉得还是有些有意思的地方,就和RDD一起拿出来看看吧。搜了一下,相关中文文献寥寥几篇,可能跟国内做这个方向的学者还不是特别多有关。我没有去进一步阅读中文已经翻译好的内容,可能有所重复。本篇将将作为一篇入门谈谈直觉吧。

先来一段字意和翻译的理解。Bunching这个词上来就把我打蒙了。Bunch我知道,一“束”嘛,但是在这里到底是什么集成了一束?搜了一下,中文目前翻译成聚束效应或者群聚分析法。我其实感觉这个翻译失去了英文本身的直观味道。理解了方法之后,Bunching在这里的原意更像是一个“次优陷阱”导致的集中点,即因为现实的约束,人们的选择不得不集中于一点(有点像封顶工资),从而去看密度分布的时候,形成了一个有点像离散分布的才有的mass point(在这个点对应的概率大于0)。后面会细细分解。还有两个重要的名词也在这里说说,Kink points和 Notch points。我看到这里的时候感觉我是没学过英文,完全无法代入Kink和Notch的形象化原意是什么。后面看了一下,Kink其实和数学里面的尖尖的转折点很像,比如一条直线突然折了一下,那就形成了一个突兀的Kink point,在这点肯定是连续而不可导的了。Notch则取了其缺口的意思,在这里直接断掉了,不但不可导了,直接不连续了。咦,这不就和断点回归听起来很类似吗?简单用R画两张图意思一下。后文直接用英文原词不再翻译了。

图1:Kink point v.s. Notch point示意

在谈论方法论之前,不妨看看问题的来源。既然是经济学家搞出来的方法,那肯定是有现实问题作为背景的(上一个经济学家先于统计学家发扬光大的模型,大概要数工具变量 (Instrumental variable) 了吧?)。其实bunching这个问题来源于税收相关的研究。比如个人所得税实行的一般是梯级税率。以中国的为例,收入高出某一个阶段的部分,一般会征收更多的税率。值得注意的是,这里所说的是边际税率,而不是平均税率。超出36000但不到144000的部分征收10%的税率,但前36000只征收3%的税率,跟总收入无关。

图2:个人所得税的梯级税率(左:税率表;右:边际税率示意)

如此的梯级税率会引起什么有趣的后果呢?最早,经济学家关心的是收入税对于劳动供给的影响。理论上,劳动者实际关心的是税后的可支配收入。如果在下一个阶梯税率过高,那么劳动者可能就会减少劳动的付出,因为边际收益(实际的税后所得)在递减,而劳动者付出劳动本身的成本可能在上升(比如加班劳动的痛苦感)。Saez(1999)年开始研究这个问题,结果这篇文章直到2010年才发表,个中故事无从探知。(题外话,Saez 2009年就拿到了“小诺贝尔奖”克拉克奖,而同一批的法国经济学家,还有去年拿到诺贝尔奖的Duflo...外加新生代的Stantcheva,法国经济学家真的是对税收研究不浅。)

Saez发现了什么有趣的现象呢?图3基本可以描述这个机制。原理大致是,对于效率更高本可以赚更多钱的劳动者来说,由于下一梯级的税率上升导致他们税后收入的减少,使得他们对于劳动投入的积极性降低。对于刚刚高于临界点的某个区间的人们来说,他们的最优选择反而是封顶在临界点(比如梯级税率改变发生在临界点1000块,那么原本可以多赚10块的人,可能就只会赚1000块而不会为了多出来的10块付出额外的努力。直觉来说,有点小富即安的意思——劳动者心想,我已经赚了1000块了,够花了,干嘛还拼死拼活多赚10块钱,大部分还要交税!)。对于那些远远高于梯级点的人,他们也会依次减少劳动产出,只获取新税率下对应的最优收入(比如上例中,原本能赚1500块的人,可能只会去赚1400块)。这样Bunching现象的产生显然是由于税率的突然变化,而劳动者等效用曲线本身却是平滑的,一小部分区间内的人便因此被挤压到一个点上故而出现Bunching了。(啰嗦一句,等效用曲线是一个经济学的概念,大致可以理解为等高线,即在这个曲线上每个点带来的效用相等,而曲线的移动代表了更高的效用水平。故而,等效用曲线和外在约束直线的切点便成为了最优选择。)

图3:一张图讲清楚 Bunching
(左:边际税率变高使得更高效的劳动者选择减少劳动投入,封顶在kink point而不是原本最优。曲线代表等效用曲线,直线代表税收形成的预算约束;右:由于高效劳动者减少劳动投入,他们的收入在kink point聚集,直到更高效的劳动者收入下压到kink point附近,形成新的分布尾部)(图截取于 Kleven (2016),Saez (2010) 也有类似的图)

图3的右图形象地描述了Bunching带来的密度函数形状的变化,也成为了学者们热衷用实证数据来量化的政策的影响。在个人所得税这个例子中,Bunching反映的是劳动者劳动积极性的降低,从而降低了全社会劳动供给量。劳动供给减少了,最终社会的生产量(比如GDP)便会降低。对于政府而言,如何设计税收梯级税率以不至于太过于伤害劳动供给,便成为了一个有实际意义的优化问题。Notch针对的问题不是边际税率会改变,而是平均税率直接改变,那么就会形成一个“洞”。在洞左边,是Bunching现象,而洞的右边,会形成一条新的曲线,所以密度函数的形状会和kink有所区别,中间会有一段“空洞”。我好奇的主要是Bunching这类方法和RDD的对比,故而在此不多赘述Notch了。

那么Bunching和RDD之间又有什么联系呢?RDD其实研究的也是政策的断点:比如去年收入低于某个临界点,才可以被选中参加某些项目。摘一张经典的Mostly Harmless Econometrics书中的配图。图4可以看出,在x=0.5这里形成了一个能否获得干预的断点:高于0.5的人获得了treatment,而低于0.5的人没有获得。在这里,我们可以认为,0.49和0.51的人原本是很像的,就是因为这个treatment的效果,才导致了他们后面结果的不同。在这个局部,我们可以将其近似于一个随机对照试验 (randomized control trial, RCT)。如果结果是跟x高度(线性)相关的(或者可以用一个函数来拟合的),那么这样的treatment effect就还可以扩展到临界点稍微远一些的地方,从而实现了一个优雅的断点回归。

图4:断点回归设计
(Mostly Harmless Econometrics figure 6.1.1)

值得注意的是,RDD有一个非常强的要求,就是这个用于区分的变量的本身,不能因为处理(treatment)而改变,也不能被参与的个体而选择,即外生性的要求。有了这么一个外生性的约束,我们才可以进一步做因果推断。比如身高我们一般认为是天生的,而不是后天改变,那么如果以身高作为要求来事实某些侠项目,那么就是一个外生的改变。比如最近美国因为新冠疫情而发放的经济激励补助(2019年收入在10万美金以下的可以获得一些现金),其标准是过去的收入,已经不可能因为发放激励本身而改变了,除非人们去年就能预测到今年的变化并调整收入。而Bunching恰恰相反——政策本身是事先给定的,然后观察的正是人们对这些政策反馈而表现出来的个人选择。也就是说,在Bunching这里,政策不仅不是外生的,而恰恰我们就是要观察政策作为一个内生变量对于人们选择的影响。实证层面,Bunching只是基于理论假设,直接估计密度函数本身来计算对应参数。

看到这里,对比内生性和外生约束的迥异假设,Bunching若是和RDD混淆了,那么结果可能是灾难性的。比如有些网站的会员制度是跟活跃度等相关的,高级会员会有相应特权。这时要是上RDD,那岂不是疯了?这明明是一个激励制度的设计问题啊...就是需要设计这样的制度来激励人们变得更活跃。

此外,Bunching本身在实践中也是有着很多挑战的。最重要的,Bunching现象的出现也取决于决策个体到底有多少自由来改变他们的选择。比如领工资的人相较于自由职业者,他们对于自己收入的调节能力(合理避税)就要差一些。有趣的是,类似的政策在人们更有能力控制自己选择的情况,比如股票和投资收入税方面,Bunching现象显现地便更为明显——大量的人们聚集在某几个临界点附近。

Kleven (2016) 这篇综述里面提到了其他当前应用中的局限性,比如数据本身一般是政府管理数据(例如税收),而很难用于调查数据(受限于测量误差和样本量等)。此外,理性经济人自然是另外一个因人而异的假设。第四章还提到了一些量化本身的挑战,比如kink一般比notch可能更容易肉眼看出,效果也更明显;实际数据还有一些数据本身四舍五入带来的问题。

总而言之,Bunching是一个强烈依赖于经济理论模型本身的估计方法。事先通过理论模型推导出可能导致Bunching的点,才可以进一步去量化模型中的参数。相比而言,RDD其实对于经济理论模型的要求并没有如此之高,只要外生性满足,局部的推断还是相对简单直接的。

非要一句话总结的话,不是有断点就一定可以上RDD的。如果政策或者处理有可能不是外生的,那么请一定慎用RDD。

文末附代码。

Categories
读书有感

审美的变化

读完了李娟的《我的阿勒泰》,静静回味着她的文字平淡中的缠绵美丽。一种来源于诗意的舒展,不需要过多华丽的词藻。就像一团一团颜色一样,绽放在平铺的白纸上,灵动跃现,满满的生命力。

记得上中学的时候,有人问我,你最讨厌读什么。我说,无聊的散文。我一度看书是更注重剧情的——那些对于风景和环境的描写,大都属于我一目十行的范围,极快地就可以翻完一本又一本小说。这样的习惯读读动不动百万字的武侠小说是没问题的,但是读《红楼梦》一类的著作就不适用了。四大名著,无怪乎我最喜欢《三国演义》,而最读不下去《红楼梦》,虽然最后也读完了。

十几年过去了,我却可以静下心来读李娟的散文,让我的思绪跟着她的文字飞行。这些年,我对于阅读的饥渴,远远超过了其他获取信息的方式。比如我很少看电影,和一位挚交坐下分析很久(他试图给我看各种稀奇古怪的电影),最终的结论是,我对于动态的美感的反应远远不及静态。这结论让我深以为然。我大概运动细胞比较慢,考验反应速度的游戏一律玩得很差,而坐在那里不限时间的脑力运动则更适合我(但这并不代表我会下棋。恰恰相反,围棋是我至今没搞明白趣味在何处的运动)。我会背着相机出门,对光线和色彩的感知或许比一般人更敏感一些,但是我却无法录制跳动的视频。一旦世界不是静态了,我就慌了。

相比于静态的图片,其实静态的文字更合我意。我曾经和上面提到的那位挚交解释,我喜欢文字是因为文字给予了我的大脑无限的想象空间。一旦文字落实在画面,这想象空间便少了几分。若是静态画面进一步落实到动态,那对我简直是毁灭性的打击。一切都是实际的、具体的,而想象力则烟消云散。故而,我是见不得任何小说改编成电影的,除非我没有读过原著。雾里看花是有趣,看得太清楚了就素然无味了,往往还和预期背道而驰。

感觉年纪越大,我对于美的感知就越来越抽象了。每当站在高点眺望,我就开始脑补无限的故事。如果时间轴可以前后拨动,那么我就开始创作过去与未来发生的人和事。如果色彩可以变化,那么我就会在大片大片的单一色中补上一滴对比。或许不自然,但仿佛昭示了新故事的开始。

每一个人都是有趣的灵魂,倾听过的每一段故事都是岁月的馈赠。

Categories
网络新发现

90后

我不知道现在应该感慨的是别人的生活充满乐趣,还是应该感慨自己的不思进取。今天看了花总记录的一位《口罩猎人》(https://youtu.be/N6DMviPqNEI),90年的在腥风血雨中冲锋陷阵。我自问没有这种勇气,否则人生也不会是现在这样偏居一隅。

人类的本性中大概总是在敬畏英雄的。看很多电影和文学作品会觉得那样的人生过于戏剧化,而看到花总这部短短一个小时的记录却更像是真实的冲击。不否认花总这些年摸爬滚打,对舆论的套路更驾轻就熟。然而每当意识到我不过是在自己的世界中埋头入沙,甘做井底之蛙,就觉得人生还是太虚度了。是的,人各有志,不过我不觉得自己有多少志气。活得如此安逸,还有什么资格说这个世界是无尽可能的。

若是冒险才是人生,那么一时的安稳并不是一世的和平。

Categories
互联网产业观察

NeurIPS 2019的一些观感

前几天有提到,十二月份的时候去NeurIPS 2019晃了一圈。除了开篇那个演讲之外,那周我还去围观了不少其他的东西。NeurIPS开到如今,万人大会,熙熙攘攘地其实挺难甄别信息的。第一次去这种顶级的计算机会议,经验不足,只能按图索骥般地一点点拾遗。

好在,我目标相对明确,并不是一味的去凑热闹的。那些火到爆的GAN之类的,我就只能远远地围观一眼,然后不明觉厉,去找自己相对更能看懂的东西去了。于是,我就很无聊的,去看了两个主题:因果推断相关的,以及隐私相关的。

因果推断这块儿,能到NeurIPS自然是被选择过的,不会是太纯理论的这种。跟机器学习相关的自然是要跳出简单的线性回归了,否则大家写什么呢?其次呢,就是跳出随机试验的框架,否则哪里用得到那么多高深的预测模型呢?七七八八看了不少poster论文,大部分都是各种花样繁杂的算法。努力地去理解他们的做法,然而却哀叹一声,浮沙筑高台,又有多少可以大浪淘沙始见金。(插曲:后面那个causal inference workshop,直接就是Susan-fest...哎,她也算是扛起来一面大旗了。)

隐私相关的,其实是加密+分布式的结合,基本要实现的是在客户端进行计算而不是需要把原始的隐私数据传递到服务器端。于是乎,我们看到了各种基于分布式算法的演化,加一些随机的因素在里面,就得到了一些隐私友好的算法。也挺好玩的,有助于想清楚一些分布式算法的设计。

笔记本身是用英文整理的,直接在这里贴一份好了。