Categories
读书有感

博物馆里的埃及和埃及古城的埃及

可能我的艺术细胞不是天生特别敏感吧,小时候逛博物馆一直会感到无趣。后面长大了,人文知识多一些了,逛起博物馆来多少有点意思了。但长久以来,我觉得在博物馆最无奈的就是,很多时候很难建立我跟玻璃对面的文物的联系。不知道对方的故事的话,其实挺难引起情感的共鸣的。

在诸多艺术形式中,或许画作比古董物件理解起来稍微容易一些。毕竟画作就一小块儿二维平面,创作者必须绞尽脑汁来研究如何表达自己的所思所想,张力一般还是很突出的。物件就难了,创作者纵有无数心思,他首先要满足物件本身的功效,艺术展现往往不是第一位的。这就是我在参观很多知名博物馆的埃及展厅的感觉。木乃伊,雕梁画柱,象箸玉杯,无一列外都毫无生气地摆在冰冷冷的展厅里。我有限的艺术想象力完全不足以在脑中浮现他们原本的样子。

后来终于找到机会去了埃及,流连在卢克索古城,才真正看到了有生气的古迹。一棵棵巨型石柱,原来是组团支撑起入门长廊的宏伟。一幅幅精美绝伦的壁画,原来只是忠实地记录着宗教的传说。他们不再被分割成一块块毫无生气的死物,而仿佛只是睡个午觉,任游人们来往不息。

类似的体验其实不仅限于文物。小时候会去动物园看动物,然而猛兽们丧失了野性的气势,旁观者也不会感到造物主的多元和奇妙。一个个展馆走下来,大同小异,动物们都不怎么有灵性。后面有幸在一些动物的原生栖息地看待他们自由奔腾、飞翔、游泳的样子,才感受到到野性本身的张力。生物才真正是生的,生生不息的。

啰嗦了这么多,除了描述一下这些年四处游荡的一些感受之外,更多的是发现读书也有这般道理。小时候只喜欢读小说,因为情节是跌宕起伏的。读不进哲学,因为完全不能消化个中精妙。现在,多谢时间赋予我的阅历,越来越可以在哲学书籍中得到一些共鸣。后面发现,我深有所感的哲学,其实是借助哲学本身产生的历史背景去理解的。柏拉图的理想国离不开希腊当时的政治体制和社会氛围,洛克的社会契约理论亦反映了当时社会的大众思潮和诉求,并由美国建国发扬光大。单纯去读道理本身,其实多少有点浮沙筑高台,仿佛领悟了什么却找不到根基的联系。嵌入历史背景去读,哲学也便拥有了时代的生命力,生机勃勃。

最近在一点点试图理解最晦涩的康德。不求甚解,但求寻得一丝联系。

Categories
读书有感

Cluster Robust Standard Error到底调整的是什么?

Cluster Robust Standard Error(中文译作“聚类调整标准误”,但我觉得这个翻译过于拗口,没有英文本身接地气,所以本文中就沿用英文了)一度让我觉得很神奇。从我在学习计量经济学的时候开始,这就是已经写入教科书的标准操作,默认大家都是要汇报的。然而有意思的是,统计学家们对其并不感冒,基本没见过哪个统计学家做的研究里面一定要搞一个Cluster Robust Standard Error的。这和另外一个著名的经济学发明的东西异曲同工——工具变量法。好像都是只有经济学家关心而统计学家颇为冷漠。

我一直觉得Cluster Robust Standard Error怪怪的,虽然我理解它的数学表达和对应的直觉——属于同一个Cluster里面的样本若是相关怎么办?那么假设它们的协方差为0就属于刻意低估了。但是残差项的协方差矩阵到底涵盖的是什么信息呢?我们知道残差项基本就是捕捉两种信息:一种是纯粹的白噪音,另外一种是被遗漏的变量。对于Cluster Robust Standard Error的一个常见的解释是,在同一个Cluster(比如同一学校里面的学生)更容易受到同样的因素影响,而不同Cluster之间的这些影响因素则不尽相同,所以Cluster Robust Standard Error调整的是这些没有被模型捕捉到的因素。这里就更有意思了。 如果我们担心的残差的来源是这些每个cluster可能包含的外界因素,那么直接去进行固定效应(fixed effect)调整难道不是更好吗?最简单的,我们直接对应每个cluster加一个虚拟变量就完了,这样每个样本就相当于减去了cluster的均值,不就排除了这种怀疑吗?那么是不是在如果已经控制了固定效应之后,我们就不需要再进行Cluster Robust Standard Error的调整了呢?有意思的是,虽然众说纷纭,但是领域内的标准操作还是去继续调整Cluster Robust Standard Error。这一点让我奇怪了很久。

还有一个其实有点自我矛盾的是,如果数据本身来源于一个随机对照试验,那么好像标准操作就是无需再调整Cluster Robust Standard Error。这是说,随机对照试验不仅仅可以保证实验组和对照组可比,还可以保证样本之间不相关?听起来好像并不是那么直接。最后一个让我困惑不解的是,Cluster Robust Standard Error表现好的时候是Cluster的数量趋近于无穷,但普遍的业界标准操作是选择最高的加总层次(aggregation level),比如一个区域有若干学校,数据涵盖若干区域,那么标准操作居然是按照区域聚类而不是学校聚类。这不是跟Cluster Robust Standard Error本身的性质相反吗?

在很长的一段时间里,我就这么半知半解地应对着它。反正有人要看的时候,跑一下也不麻烦,但是我自己是基本上不会主动去看的。相比于针对异方差的Eicker–Huber–White调整,我始终不愿意使用一个自己并不是很理解它背后到底在调整什么的方法。

最近和同事又遇到了这个问题,再也不能浑水摸鱼,于是想去看看这些年有没有人更好地解释了这个问题。不搜则已,一搜则有巨大的惊喜,因为不是别人、正是几位大家出手,把这个问题讲清楚了。这篇文章真的是给我一种“拨开云雾见天明”的清爽感。Abadie, A., Athey, S., Imbens, G. W., & Wooldridge, J. (2017). When should you adjust standard errors for clustering? (No. w24003). National Bureau of Economic Research. 虽然还是一篇工作论文,但是已经有接近900的引用了, 可见这个问题折磨了大家多少年。

这篇文章开门见山,直接指出了Cluster Robust Standard Error存在的意义:要么是样本设计(这里指的是研究设计中数据样本搜集的范围和方式)的问题,要么是实验设计的问题。这一下子就讲明白Cluster Robust Standard Error到底想解决的是什么本质问题了:说到底还是,样本是不是有足够的代表性?

先说第一种原因,样本设计。这里基本就是一个多层次抽样的情况。假设数据搜集过程是这样的:先从整体里面随机选择一些cluster(比如从一个国家里面抽取若干城市),然后再在每个cluster里面随机抽取个体样本。在这种情况下,我们无法从样本数据中本身得知数据搜集的办法,所以分析者为了保险起见,可以计算Cluster Robust Standard Error来避免抽样过程的影响。但其实更好的办法是,直接去了解样本数据是怎么来的。论文中给出了一个极其简洁的例子,两个cluster,然后数据产生过程只取决于cluster+白噪音。大致如下:

  1. 有m个cluster,然后每个cluster里面分别各有一半的样本的D变量为1,其他为0(D可以是实验或对照组的标签,或者性别,等等,反正是我们关心的自变量)。
    cluster = 1:100 # cluster的数量
    n = 1000*length(cluster) #总共的样本量
  2. 结果变量y在每个cluster里面受到D的不一样,比如在一半的cluster里面,D的影响是1,而另一半则是-1,这个系数标记为tau,那么 y_i = tau_cluster * D_i+noise。
    D = rbinom(n = n, size =1, prob = 0.5) #每个个体有50%的概率接受处理D=1
    tau = rep(sample(c(-1,1),length(cluster), replace = T), each = 1000) #每个cluster有着不同的处理效应幅度
    y = D * tau + white_noise
  3. 这时候,可以直接用 y ~D 去做回归估计,或者y ~ D+cluster来做固定效应模型。

通过这个数据产生过程的模拟,然后比较普通标准误和Cluster Robust Standard Error,我们可以知道,Cluster Robust Standard Error调整的其实是每个tau_cluster的变化。因为我们在回归模型里面,假设的是tau对于各个cluster是一样的,所以tau_cluster本身的变化就被归到误差项里面去了。这个时候,Cluster Robust Standard Error是有意义的,可以捕捉这一部分的方差。

但是在这个设定下,如果直接用了固定效应模型,Cluster Robust Standard Error的调整就没有意义了,因为我们已经通过引入cluster这个变量捕捉到了tau_cluster的变化(对于每个cluster来讲,tau_cluster是常数,所以固定效应模型可以直接捕捉),那么残差项里面仅存的是白噪音,不需要额外的调整。

其实到这里,我们大概已经理解Cluster Robust Standard Error的来源了,就是数据生成过程中,异质效应(heterogenous treatment effects)是不是存在、我们的模型是不是已经将其纳入考量。如果异质效应仅仅取决于某些变量(比如上例中的cluster,给定cluster之后效应为常数),那么固定效应模型是最直接的调整方式。如果异质效应取决的因素足以被回归模型捕捉到,那么Cluster Robust Standard Error还是有意义的。但话说回来,如果是因为变量本身不可观测而导致模型不能捕捉异质效应,那么Cluster Robust Standard Error的cluster怎么选?直接保守起见把能观测的上一级cluster直接认为协方差矩阵每一项都存在?

文章中提到的第二种情况,实验设计可能导致需要Cluster Robust Standard Error,其实就是异质效应的另一种来源:异质效应存在于个体上,所以我们无法直接建模控制。

总之,这篇论文至少把这个调整的来源讲清楚了。结论简单说来,就是没事不要去调整Cluster Robust Standard Error,除非你知道在数据收集过程中有显著的缺陷会导致异质效应。此外,如果回归建模的时候能直接把这些变量控制住,就不要把它们用于Cluster Robust Standard Error里面。尤其是在cluster数量比较少的时候——你想啊,Cluster Robust Standard Error基本就是假设协方差矩阵对角线上是一个个的方块,方块里面每个数字不为0,但是方块之外都是0。如果cluster很少,那么这个调整就基本上容纳了很多很多方块内部非对角线的数字,显然是过于保守了。

Categories
读书有感

高阶的曼妙

最近业余看了一点抽象代数,本以为会根本看不下去,结果没想到抽象代数居然如此好玩。看过了抽象代数,再去看很多东西,仿佛就是降维打击,轻巧曼妙。

环(ring),域(field),群(group),三个相辅相成的抽象概念,笼络了常见的各种代数运算(加减乘除和矩阵运算)和代数定义域(整数,有理数,实数,复数),居然就这么轻轻巧巧地被串起来了。最有意思的是,这一系列对于代数结构的理解,使得“一元高阶多项式有没有一般解”这个问题得到了彻底的解决,让人拍案叫绝。

有意思的是,我最近发觉自己对于英文的理解能力比中文略强,尤其是在数学这块儿,所以我就先去看的英文课程(也有可能是教学风格不同,西方的老师有一种绞尽脑汁深入浅出地倾向)。写这篇日志的时候,翻了翻中文资料,发现豆瓣的一篇帖子讲得非常好,但是豆瓣不显示公式,于是有人很贴心地提供了latex排版并放在GitHub上。我看的英文课程是从环,域,群这三个概念开始讲的,到最后才提供了“五次及以上多项式没有根式解”作为一个实例,让人看得特别有满足感。

抄一下最核心的证明思路:

这样伽罗华(Galois)证明了:一元n次多项式方程能用根式求解的一个充分必要条件是该方程的伽罗华群为可解群。

由于高于四次的一般方程的伽罗华群不是可解群,也就直接推论出高于四次的一般方程的不可解性。

也即伽罗华发现本质就是:域的无数种扩张方式其实就是有限阶的群。n阶对称群对应着n次一元方程,而5阶和5阶以上的对称群不是可解群,也就是五次和五次以上的代数方程没有求根公式。

如果回顾历史,会发现在Galois之前的数学大家,如拉格朗日,解决问题的思路都是降维:试图把高阶方程变化为更低阶的问题。如果每个n阶都可以简化为n-1阶的问题,那么所有n阶方程的解不久解决了吗?结果拉格朗日就被卡在这样的归纳法思路了。

Galois另辟蹊径的地方在于他没有沿用这种简单的归纳法的思路,而是回到了代数的本质。这么想,

  • 人们为了得到一次方程的一般解,需要拓展整数数域,引入有理数。即 的通用解 并不是在整数域之内,而是要引入有理数。
  • 人们为了解决二次方程,又不得不拓展有理数,引入了根式,从而引入了无理数和复数。二次方程的通用解里面必须包括根式,而当 的时候,就不得不引入复数了。
  • 三次方程简化后的辅助方程为二次,四次方程的辅助方程为三次,所以暂时不需要引入新的数域。
  • 五次及以上方程就没这么幸运了, 由于其对应的伽罗华群不是可解群,所以在复数范围内是没有一般解的。

这里有一个很有意思的问题,为什么到五次方程,事情就产生了质变呢?Galois给出了事情的本质:五次及以上的多项式方程不存在在根式定义下的可解群。

可解群本身的定义依赖于正规子群、极大正规子群列及确定极大正规子群列的一系列合成因子。Galois定义了,如果一个群所生成的全部合成因子都是素数,则称这个群为可解的。所以,如果不拓展根式数域,五次及以上方程就没办法变成可解群了。换言之,不是五次及以上方程无一般解,而是加减乘除和根式运算限制了我们对一般解的表达能力。

这里可以看出为什么抽象代数为称之为抽象代数了,因为到这里,对于代数的理解就不仅仅是满足计算目的了, 而是去理解代数本身的结构。素数作为整数域里面的基本元素,不仅仅影响着因式分解,还可以拓展到整个代数结构里面去。某种意义上,我们需要在抽象代数里面重新定义“素数”或者基本元素,然后便有了各种优美的结论。

我在可见的未来之内,估计是不会亲自用到抽象代数了。只是这种思维的曼妙和在(更)抽象层面上洞悉事物本质的爽快感,让人着实欲罢不能。


最后补一句最近的人生感慨。很多时候,我们觉得一个(局部)问题很棘手无法解决,很可能是我们手上的工具限制了我们解决问题的能力。这个时候需要做的不是死磕,而是重新定义问题,从一个更高的层面来看待这个问题,或许就会看到自己曾经的局限性。定义问题永远比解决问题更重要。

Categories
读书有感

从社会公平角度看社会极化

在过去的一年中,我给自己定了一个不怎么正式的研究课题:理解美国社会为什么在今天如此分裂和极化。说它不怎么正式,是因为我并不想把它当成一个学术课题来研究。但我还用了研究这个词,可能是更遵循广义的定义——探究和钻研。从我的兴趣点出发,美国当今社会的极化问题可以和另一个著名的历史问题有异曲同工之处——大分流(Great Divergence)。大分流是加州历史学派对中国和欧洲在工业化过程中选择了两条路的描述。美国社会的极化,某种程度上也是一种分流。虽然这两个一个是经济历史问题、一个是政治和意识形态问题,却有一种冥冥之中的缘分,提出了很多思考上的挑战。

试图理解美国社会极化,自然离不开先去复习美国的历史。好在,200多年不是那么漫长,沿着美国宪法这么好的历史脉络按图索骥方便许多。不在此赘述美国的历史了,不过有意思的是,最近的总统大选原来越呈现胶着状态——很多所谓的“摇摆州”,胜负都是1%以内,然后最终决定了美国大选的赢家。其实在以前,美国大选并不一直是如此针锋对麦芒。很多选举的差距其实还挺大的。

选举只是一种民意的体现,反映的是背后的意识形态的分化愈演愈烈。PBS有一部很有意思的纪录片:America's Great Divide: From Obama to Trump(YouTube上可以直接看到完整版),简单回顾了过去十几年的历史。与此同时,无数的经济数据来佐证这种分裂不仅仅是意识形态的分裂,而其背后有着确凿的经济基础的崩裂。比如,美国中产阶级实际收入不升反降(按实际购买力计算)、社会财富分布越来越不均等(近期的例子有2008年次贷危机后,富人的财富反而增加了;此外还可以把时间轴拉得更远来看)、代际间的流动性越来越差(intergenerational mobility,子女超过父母,或者简单地可以叫做“美国梦”,Chetty有很多相当有力的数据)。虽然看数字和证据让人对极化这种现象越来越确信,但是背后的根源到底是什么?说到底,这些都只是显现出来的表象,原因是什么呢?

和“大分流”一样,社会极化的原因显然不是一句两句话就可以讲清的,也不是一个两个学科领域就可以充分解释的。看了很多经济学的观点之后,我开始从其他学科的学者中寻找启发。最近在看Michael Sandel的《The Tyranny of Merit》一书,给出了一些从社会公平和政治哲学角度的解释。

在叙述Sandel的观点之前,我想先说明,我并没有很赞同Sandel给出的处方:比如在藤校等大学录取采用抽签制度。在我看来,这些还是治标不治本,甚至是为了达成某种特定的目的而忽略了可能存在的其他偏颇。不过他这本书值得一读,一是里面涵盖了很多历史渊源,可以帮忙理解很多事情是怎么一步一步演化的。再者,Sandel是个很好的作家,正如他可以把“公正”这么课讲得如此发人深省一样,他这本书写得也是层次递进,诱发思考。一本好书并不是直接说服读者来认同他总结出来的观点,而是精炼出相关的信息素材来帮助读者形成自己的判断。

Sandel一开始就提到了Meritocracy这个看似公平实则事与愿违的制度,可能是造成社会分化的根本原因之一。Meritocracy就是merit-based cracy,而cracy本身是rule或者govern的意思,比如demo-cracy是民主治理,所以meritocracy就是基于人们能力的治理系统。中文翻译大致有“精英政治”或者“贤能政治”,但我感觉不够确切,因为还有elitism等。英文的定义有点繁琐,如下:

Meritocracy is a political system in which economic goods and/or political power are vested in individual people on the basis of talent, effort, and achievement, rather than wealth or social class.

Meritocracy直白的翻译就是“美国梦”(也可以叫英国梦等等),人们只要有能力,就能实现最好的自己。我其实花了很久去理解Meritocracy这个词,主要是一开始不知道Meritocracy相对的是什么。“rather than wealth or social class”其实是一种很模糊的说法,更直接的另一个极端则是,出生决定论(determined by birth)。出生决定其实贯穿了很长的历史,尤其是在中国几千年的封建社会中,君王一定是世袭的,除了科举制度外,其实并没有太多上升通道,农民从一出生就被绑定于土地,人口的地域流动性很低。这里我沿用约定俗成的封建社会定义,即“中国古代战国时代中期开始,到清朝后期(鸦片战争前)”,主要是指历史时段而并不会去跟西方社会的封建制度定义相对比,后者其实是有不少争议的。

西方历史也差不多。最早是君主独裁(Monarchy),然后到了亚里士多德时期的元老院制度(Aristo-cracy),从一个人变成了一小群极其聪明的人。从名字可以看出,Aristocracy和亚里士多德(Aristotle)有着相同的词根Aristo,意为excellent。希腊的先贤们认为Aristocracy的制度优越性来源于少数人拥有的超出常人的治理方面的天赋,而大多数人并没有足够的信息甚至于获取信息的能力。再往后,这种“人尽其才、任人唯贤”的理念就延续到了Meritocracy,而且不仅仅限于政治,可以应用于社会的方方面面,尤其是在这个社会分工高度专业化的时代。

Meritocracy之所以被歌颂,很大程度是是因为它否定了“出身决定论”。一个人只要有能力、肯努力,就能获得某种意义上的功成名就。这样的制度是看似公平的,至少是机会公平的,给予了人民希望。然而最早造出Meritocracy这个词的英国哲学和社会学家Michael Young却有着相当悲观的预测,在其1958年的著作《The Rise of the Meritocracy》里,他预言2034年英国会有一场发育根源的社会起义,因为Meritocracy会造成人们追求智商或者其他优异属性(比如优生学),一旦这些能力变成了可以人为制造的,就会进一步造成社会的分化,回到出生决定的困境。Sandel在书里给出了现实的答案:美国在过去一个世纪中,一直歌颂着美国梦。然而,这种美国梦掩饰了社会分化的残酷,使得成功者过于自负地相信自己的成功是自己的努力所得,而失败者则将失败归咎于能力不足而意志消沉,而忽略了外界因素如制度上的不平等。然而事实呢?Sandel以大学录取举例。美国初高中生需要通过一系列的成就来向大学证明他们的能力,比如sat分数,比如ap课程,比如志愿服务,比如体育,然而这一切其实很大程度上是有家庭背景决定的。高中生很累,因为他们要付出很多努力来获取这些优质的标签,所以他们会觉得这一切都是自己的能力和努力的结果,而忽略或者低估了运气或者家庭的成分。Sandel举的例子是他所任教的哈佛大学,越来越多的本科生认为自己能进入哈佛完全是天赋异禀,而不是其他什么因素。可是残酷的事实是,越来越多的数据表明,这些标签其实反映的并不是学生本人的能力,而是家庭背景,比如SAT分数最相关的因素就是家庭收入,甚至超过了家庭受教育程度的影响。

美国大学录取日趋白热化,反映的其实是美国整个社会制度对于学历的过度依赖。美国只有30%-40%的人拥有大学学位,而在如今的社会分工中,大学学历已经成为了不可逾越的一个门槛,造成了收入的巨大分化,以及相应的社会地位和自我认知的分化。Trump虽然代表的是被全球化抛弃的美国工人阶级,但是他无时不刻不在提醒大家,他是沃顿毕业的高材生、他很聪明、他有能力带领美国。这些Meritocracy最关键的标签被他紧紧地贴在身上,可见Meritocracy已经在美国深入人心。大学不再是单纯的教育机构,而变成了社会分化的筛选器。中文的那句“鲤鱼跃龙门”,成为了最贴切的形容。只不过这里的鲤鱼门不仅仅是靠自己的能力飞跃龙门,而是要靠着家庭等等。

然而Meritocracy这里其实有很多假设。首先,成功与否、尤其是以收入来衡量的成功,代表的真的是人们的能力和自我努力吗?其次,Meritocracy就一定是公平的吗?Sandel又进一步探讨了这两个假设。

对于第一个,收入=个人价值=能力体现(moral deserts),在很多哲学家的讨论中,其实是不成立的。最典型的如哈耶克,他认为人们的收入财富是由市场供给和稀缺性决定的,而不是自我的能力或者对社会的贡献。比如一个对冲基金经理和一个人民教师,后者虽然对社会的道德意义上的贡献可能更高,但是收入远远无法与金融业匹敌。从哲学层面上,哈耶克就否定了收入与merit之间的必然联系。

第二个则是更发人深省的。最初我们认为独裁不公平,是因为世袭,完全由出生决定。我们无法决定自己的出生,这对于个人来说完全是运气因素,所以不公平。那么Meritocracy依赖的merit就完全不依赖运气了吗?我们擅长或者不擅长学习书本知识、运动员擅长或者不擅长体育,如果是基因决定的,那么不也是出生就确定了吗?虽然基因不是家庭财富,但从运气的角度,又有什么本质区别呢?再然后,Meritocracy演化起来,各种筛选制度或者merit可以被人为控制,比如大学录取和优生,被扭曲成一个变相的基于家庭背景的竞争,那么和以前的直接由出生决定又有什么区别呢?即使在最好的情况下,Meritocracy也只是体现了社会分工的最大化,因为从哲学原则上讲,物尽其用人尽其才是实现生产效率最大化的社会资源最优配置(包括人力资源),是一种结果,而其本身并不能意味着可以保证过程的公平。

读到这里的时候,那晚我其实是很悲观的。除了对于Meritocracy背后哲学逻辑的悲观,还有另外一个书中没有提起却让我无法说服自己的问题:公平应当如何对抗人们对于血亲的自私的天性?比如你去问一个人应不应该取消高考而改成自主招生,TA可能会说不行,这样对农村的孩子不公平。然而你去问TA是不是该取消自己孩子的课外辅导班,TA肯定会反对,因为TA还是会在意自己孩子的成绩。这种父母希望自己孩子更能够成功的天性,和人们希望这个社会公平的愿望,在我看来其实是有着内生的矛盾的。假如一个社会真正做到了机会均等,那么就意味着,孩子的成就跟父母是完全独立的,就一定会有孩子跌落社会阶层。但对于父母来说,他们的天性是希望孩子成功的,自然会极尽所能增加孩子成功的概率(北上广中产阶级的教育内卷就是最好的体现),即使他们自己之所以能从农村到城市中产阶级正是受益于高考制度带来的机会公平。在这里,每个人希望社会尽可能的公平的愿景,和希望自己的孩子有更多成功机会的自私自利,是对立的。如果同时看社会中的个体与群体,这就形成了某种意义上的社会层面的“囚徒困境”。每个人都知道社会公平是最好的结果,但没有人希望社会公平的代价是自己的小孩阶层沦落。

或许正因如此,我们看到了美国社会二百多年来代际演化的结果——阶层流动性越来越差,社会财富越来越集中,Meritocracy这种社会制度也不自觉地为社会分化服务着,而并不如人们最初理想化地认为它可以保证机会公平并约束社会分化。如果制度反应的只是人们的天性,而不是制度造成社会分化,那么我对于社会的悲观也就成为一种不可能被改变的注定性事件了。中国古语有云,天下大事,分久必合,合久必分,无非就是说,社会的分化导致财富集中,然后阶级之间失去平衡,对立加剧,最后只能通过暴力手段来重新分配财富和资源,进入下一轮的演化。这好像看来是注定的轮回。

然而过了几日之后,我觉得自己的悲观忽视了几千年来社会的进步。一则,社会分化并不一定是一个零和游戏,即使相对层面的流动不充分,绝对层面我们还是可以实现所有阶级一起进步的,并不一定就意味着两极分化越来越严重。二是,制度并不总是为了服务统治阶级而被创造出来的。人们一直在学习制度,意识到制度的缺陷,然后试图用群体的理智来克服个人的囚徒困境,而不是利用制度的缺陷来最大化个人的利益。人们可以创造一个公共机构来调节机会分布的不均衡。正如政府用税收来实现社会收入的重新分配,机会某种程度上也可以被人为调节,尤其是在整体蛋糕可以被做大的情况下。高等教育的普及、引入其他非学历标签来帮助人们寻找到人尽其才的工作,调节某些行业过高的收入,这些都是帮助在整体增长的同时个体不至于分化加剧的。虽然听起来还是很理想主义,但是人类既然能够从奴隶制自我修正到民主制度,那么进一步的修正也就是时间问题。虽然在我们短短的一生中,只能见证一些边际的改变而已。

当然,Sandel这本书里还有其他很值得阅读和思考的内容。我只是有着自己一个强烈的问题,然后试图去寻找一种政治哲学方面的解释而已。换做不同的问题和思考模式,或许对此书会有不同的感触和解读。对于萦绕我的那个社会极化的问题,我也并没有找寻到所有的答案, 还是会一直探索下去。

Categories
读书有感

积极心理学

继续昨天的公开课话题。除了数学,最近还在看的就是心理学。也是哈佛的一门非常受欢迎的公开课,名字翻译得有点哗众取宠,Tal Ben-Shahar讲授的《幸福课》,其实更贴切的翻译应该是积极心理学(positive psychology)。youtube等都有视频,很好找到。这门学科基本就是在说,人们如何会觉得更加幸福快乐,而我们如何更好地认识自我感受。

说实话,这门课有点长。不知道是这门课面向本科生的缘故、教师本身演讲固有的煽动性,还是心理学作为一门学科的普遍问题,我觉得从逻辑体系来讲,它还欠缺一些严密。很多理论仿佛都是来源于直觉的,然后做一个似乎有道理的实验,就可以证实或者证伪了。最近若干年有不少心理学实验(尤其是在实验室里面的小型实验)事后翻车的例子,让人对这套逻辑难以完全信服。不过基于人类认知事物的本性——尤其是对自己并没有那么熟悉的领域——我们是倾向于轻信符合自己固有直觉,而对挑战我们直觉的理论会百般苛刻。鉴于无数次数学可以用严密的推导打脸我们的直觉,任何学科其实都不应该失去基本的批判性思维。

基于上述原因,我是抱着一种将信将疑的态度来看这么课的,否则这就跟宗教传道没什么区别了。里面多少还是有一些有意思的东西可以拿出来讲一下。

  1. 人们对快乐的感受。基本上的道理就是,我们本身有一个长期的快乐基准线(baseline),然后短期的快乐水平围绕着这个基准线波动。课中的例子是获得终身教职(tenure)前后的调查。对于美国学术界的助理教授们来说,能拿到终身教职是一件非常重要的事情,也是整个激励机制设计的最终目标。调查显示,在拿到tenure以前去调查马上要经过评审的人,如果他们拿到或者没拿到会有什么感受。很一致的答案就是拿到会在接下来的人生中一直开心上天,没拿到则会伤心欲绝。在评审结果刚出来的时候,再去调查这些人,果然拿到的很开心没拿到的很伤心。可是过了几个月到半年的时间,这种短期冲击几乎消失了——事前快乐水平比较高的人无论拿没拿到还是很快乐,事前就不快乐的人就算拿到了tenure也没有一直快乐下去。这个例子让我印象深刻是因为,确实无论是从自身的经验还是听到的故事,天大的事情,在刚发生的时候总会深深的影响个体。时过境迁,人们最终还是会回到日常。
  2. 自我暗示很重要。人其实是个很奇怪的动物,有的时候活在信念之中。这种信念有可能是基于宗教信仰的,也有可能是基于价值观之类的。总之,人需要依靠环境给予的反馈来调整自己的行为,而最终实现一件事情还是依赖于自身坚持不懈地去做这件事情,这里就有了自我暗示的角色。
  3. 亲密关系。和我看到的其他心理学或者社会学的发现类似,主要是1)认清感情和事业一样,是一个锻造(cultivate)而不是发现(finding)的过程。没有天造地设的工作,自然也不会有浑然天成的爱情。2)无论是爱情还是亲情友情,人和人相处不可能没有矛盾冲突。学会积极面对矛盾和处理冲突,才能经营有益的感情。3)感情、尤其是爱情的确立,并不是一个盖章确认(validate)的事情,而只是一段相互了解的开始。一个你很欣赏的人愿意和你相处,只是更了解彼此的开始,而不是即刻证明你本身有多优秀。一段健康的感情意味着彼此的坦诚以待和相互关心,这才会真正增加人们的安全感。4)积极的互动模式。被自己爱着的人否定是极其痛苦的,而被自己所爱之人鼓励则是非同凡响的。好的感情需要彼此鼓励的互动模式,而不是善意的敷衍(nice but passive reaction)。
  4. 自尊(self-esteem)。感觉中文的自尊和这里英文并没有对应的特别确切。Self-esteem更多的有一些自信的成分在里面,大意是自己对自己的认同。自尊在这里被分为三类:依赖型,独立型和无条件型。依赖型就是对自己的认同强烈来源于他人的评价、习惯性地去把自己跟其他人比较,这也是我们最普遍看到的。比如考试分数,比如亲友的评价,比如各种奖章荣誉之类。有趣的是,依赖型Self-esteem可能会展现出不同的样子,比如极度的自傲和自恋。正因为自我认同不足,所以披上一些看似坚硬的外壳来伪装自己,而且很可能是一种在非常自信与非常不自信之间不停摇摆的状态(即稳定性很低、方差很大)。独立型则更进一步,可以开始进行自我评价和自我比较,不那么依赖于他人。无条件型则是进入了一种更高的境界,做事情只在于动机本身,过程便是自我实现,结果和评价完全不重要。这三种境界的划分还挺好玩的,虽然是渐进的,但是更有可能是每个人同时在各个层次有不同比重,并不是非黑即白的。
  5. 心理咨询和写日记等等对话的方式,其实和一段坦诚布公的感情一样,是一种基于真实的对话。谎言的心理成本是巨大的,人终归还是希望活得真实。

我对于这门课最大的疑虑可能就是过于处方化(prescription-ized)的针对各种问题的解决方式,大致包括锻炼、养成习惯、冥想等等。心理学能划分、解释这些东西已经很不容易了,还可以开出具体的处方,实在是有点自负了。很多假设不过是有几个相关的实验来佐证,而他并没有批判性地引用那些负面的例子,多少我是觉得信息上有所偏颇的。当然回到人的认知本性,去年nips的时候,Celeste Kidd说他们研究发现人是很容易建立信念的,所以我还是保持这种将信将疑的态度吧。能有一种框架来分析自己固然是好的,却也不见得是真理那样。