Categories
读书有感

职场治愈系——Rework

这本案头书书已经前后说过很多次了,我不知道大家读这本书是为了什么,或许是寻找一些创业的启迪吧。我只是当作职场的治愈系,工作烦闷之时拿出来读读,抚慰一下烦躁的心。

其实说它治愈系,是让人觉得有时候枯燥的工作也是有着自己的意义的,大家都是这样,没有人可以特殊。只是这样的苦闷其实也是有意义的,当你不断的磨砺之后就可以开始有所升华,然后看到别人可能无暇关注的风景。对于耐心极差的时刻,可以拿出来勉励一下前进的动力。

53d5aaeajw1e0miie2f4ej

其实这本书英文写的很简单,都是短句子,是很好的练习撰写具有说服力的英文短句的参考材料。语言嘛,本来就不是需要多么的雍容华贵——太过阳春白雪的那只是文学作品,不适合下里巴人通读。这本书也是如此,简单的词汇,简单的句式,简明的语言。就像在一堆繁杂的乱纸团里面看到一丝清晰的脉络,多少眼前一亮吧。

这类的着重于讲道理和传输文化理念的书其实很多(Amazon上直接很露骨的放在“成功学”一栏),大多的时候也是味同嚼蜡,速度之后毫无感触的就扔到一边去了。Rework倒是还好,会穿插一些实际的例子,让经历过类似折磨的人很容易有所共鸣,感同身受怕就是这样的意思吧。反正每一节也很短,前后也不见得有多少关联,随便拿出来翻翻也是挺好的。尤其是心情烦闷的时候。

也不知道应不应该摘抄一些东西,怕写的太简单了就成了我最讨厌的那种罗列短句式道理,读起来貌似不错但实际没有任何执行力。不过确实它的outline还是一个比较好的索引,当你遇到类似的情况、当局者迷、无暇站出来清晰地想一想事情的来龙去脉的时候,翻翻他的case,多少能有所启发。至少说明,你所经历的事情不是最糟糕的,别人曾经做的更糟更烂。就像一个曾经广为流传的帖子(由于版本众多,感兴趣者请自行搜索)——

理工科的学生生来就是毁灭世界的

这种错误都被犯过了,我那一点人畜无害的错又算得了什么?

本来是想粘一下他的content的,后来发现有人已经做好mind map了,就直接截屏之~我是把node都展开了,原始的可以见http://www.mindmeister.com/49405294/rework-table-of-contents

rework_content

点击看大图

Categories
事儿关经济 读书有感

一些实验设计的小聪明

主要是最近看到了一系列相似的文章,就忍不住说说这一系列文章的好玩之处。这一系列的文章主要是用假的CV来投简历,然后根据HR的电面反馈来探究CV中不同因素对于求职者的影响。当然一开始最关注的就是是不是就业市场中间有性别歧视——即给定两个能力一模一样工作经历也类似的,一男一女,难道女生会因为性别原因而遭受歧视么?

鼓捣出来这种折磨我们亲爱的各大企业HR的方法的就是芝加哥大学的Bertrand, Marianne和Mullainathan, Sendhil (其中后者已经转战到哈佛去了),以及他们那篇著名的AER论文:

Bertrand, Marianne and Mullainathan, Sendhil (2002). "Are Emily and Jane More Employable than Lakisha and Jamal? A Field Experiment on Labor Market Discrimination,". American Economic Review94 (4): 991. doi:10.1257/0002828042002561.

哎,可能开始接触计量经济学或者劳动经济学的,这都是逃不掉的一篇paper吧。idea 真的是很简单:搞一堆相似的简历,只是姓名和性别有所不同,然后投到各大公司,追踪反馈。这样就回答了那个本来看起来无法回答的问题:我们观察到的女性平均工资低于男性,是因为性别歧视还是因为女性的能力较男性差一些?在这里相似的简历代表求职者有着相似的能力,所以能力那个因素就变得可控了,只需要探究性别上的差别就可以了。这样就把一个本来没法做随机试验的内生性问题,巧妙的用另外一种实验设计来稍稍回答了(毕竟只是电面通知,而不是最终的录取。CV容易fake,面试就没办法了)。

结果这篇文章一出,因其idea简单、可行性好、成本低(找几个学生发发邮件就可以了),一下子受到很多被折磨经久的经济学研究者的青睐,然后类似的paper便如雨后春笋般的爆发——不仅仅是美国公司的HR开始遭殃,瞬间各国有着发paper需求的劳动经济学家们开始纷纷效仿、一拥而上,先是席卷欧洲大陆,然后亚洲自然也难以逃掉。嗯,于是就看到下面这些paper:

  • 西班牙:Albert, Rocío, Lorenzo Escot Mangas, and José Andrés Fernández Cornejo. "A field experiment to study sex and age discrimination in selection processes for staff recruitment in the Spanish labor market." Papeles de trabajo del Instituto de Estudios Fiscales. Serie economía 20 (2008): 3-46.
  • 澳大利亚:Booth, Alison, and Andrew Leigh. "Do employers discriminate by gender? A field experiment in female-dominated occupations." Economics Letters 107, no. 2 (2010): 236-238.
  • 英国:Riach, Peter A., and Judith Rich. "An experimental investigation of sexual discrimination in hiring in the English labor market." Advances in Economic Analysis & Policy 6, no. 2 (2006): 1-20.
  • 中国:Zhou, Xiangyi, Jie Zhang, and Xuetao Song. "Gender Discrimination in Hiring*: Evidence from 19,130 Resumes in China."
  • 意大利:Patacchini, Eleonora, CEPR Giuseppe Ragusa, and LUISS Guido Carli. Unexplored Dimensions of Discrimination in Europe: Homosexuality and Physical Appearance. No. 9179. CEPR Discussion Papers, 2012.
  • Duration Dependence and Labor Market Conditions: Theory and Evidence from a Field Experiment” (with Fabian Lange and Matthew J. Notowidigdo). Quarterly Journal of Economics, Forthcoming.

其他的我暂时没有搜了,已然觉得足够了。最后上一张中国劳动力市场的结果——怪不得现在研究劳动力市场都要把中国作为一个outlier呢,华夏女性实在是太强了!

gender_preference
Categories
些许欢笑

神作呀!Oh My God!

无意中在豆瓣上看到了一部号称神片的电影《偶滴神啊》,原名好像正是 Oh My God。赶紧找到看了看,真的是神片呀!

最近一直很心水印度元素,跟印度裔的partner聊天的时候都会对他们各种敬仰羡慕。信仰缺失是个问题,但是如果把信仰全部寄托在一些有形无心的事物上,那才是更严重的问题。

这部片子以喜剧的形式,欢笑的探讨了信仰问题。豆瓣确实是神评论的出没地,摘录一段故事:

释迦牟尼佛晚年涅磐时,魔王波旬对他说:“到你末法时期,我叫我的徒子徒孙混入你的僧宝内,穿你的袈裟,破坏你的佛法。他们曲解你的经典,破坏你的戒律,以达到我今天武力不能达到的目的……”佛祖听了魔王的话,久久无语,不一会,两行热泪缓缓流了下来。魔王见此,率众狂笑而去。

联想到在巴塞罗那读书的时候,很多朋友跟我展示他们心中的宗教,跟我传达他们对于宗教和信仰的理解,才发觉原来在国内周围那些临时抱佛脚的根本算不上所谓信仰。某种程度上,我可以算是一个无神论者。我不信奉任何神袛,却也不信奉所谓的“科学教”。在中国,由于几十年教育的摧残,很多人把课本上学到的科学作为了一种信仰。而所谓科学,无非就是人们对于世界运行规律的一些认识而已。相信真理的人,某种程度上便也是一种信仰了。就像对于很多经济学家,“均衡”便是一种信仰一般。不能证有,不能证无。

世事嘛,或许从来都不是非黑即白。不同的情景下,就怕是神也会展现不同的形式吧。那些用神的名义来禁锢自己的,和用科学的名义禁锢自己的,都是自寻的烦恼。临渊羡鱼,不如退而结网。

Categories
些许欢笑

真实的穿透,孤夜的狂欢

hawana

度过了格外忙碌的几周,忙碌着痛苦着,充实着并快乐着。终于决定休憩一下,好好看看一位朋友推荐了好久的电影「乐满哈瓦那」,顺便复习一下好久没碰的西语~

其实影片原名是 Buena Vista Social Club,直译的话便是美景俱乐部。从名字多少可以寻得一丝向往自由的味道。其实我不是很经常看记录片,总觉得真实有的时候难免残忍,难免血淋淋的把一切都摊开。不过这部片子还好,只是真实地记录着一群人的生活,在音乐的人生中快乐或者痛苦的生活。

当时朋友一直在说,这部片子的音乐是多么的曼妙,果不其然。从不觉得突兀,那种强烈而欢快的节奏是一种多么有展现力和穿透性的诉说。情不自禁,在这样的音乐下面仿佛心和文字都随着飘动起来。与其费心用言语来描述,不如循着节奏的起伏,任心情跌宕。这一刻,只消把所有感觉付诸听力,在安静而寒冷的深夜享受伴着音乐孤单的狂欢。

稍稍庆幸自己还能听懂若干西班牙语,西语天生的婉转韵律让音乐变得生加灵动。加之古巴的神秘、想象中的热情与奔放,一切色彩就那么自然的叠加起来,走入真实。看着一群年近古稀的音乐家,在生命的最后时刻还可以这么灿烂的、再无忌惮地绽放,不禁感叹。从寻常的钢琴,到那些不寻常的「诗琴」,还有出神入化的打击乐...乐器只是他们手中的玩物,驾轻就熟,随着情感的波动而动。相比于小时候费尽心力练好一首钢琴曲子就是为了通过考试,这境界显然不一样..

他们打破陈规,走入美国。看着镜头里的老音乐家漫步在纽约的街头,惊叹着这繁华的都市,突然感觉这样的文化冲撞那么的真实,却不突兀。以音乐为生的人,从心底怕就是自由的吧。无论外面是什么样的风景,都不会失去分寸,都只是美丽的别样展示。

看到这样的故事,看到这样真实的激情,真好。此夜,足以狂欢。

Categories
读书有感

≪统计学习精要(The Elements of Statistical Learning)≫课堂笔记(十三)

本学期最后一堂课的笔记...就这样,每周上班的时候都没有惦念的了,我是有多么喜欢教室和课堂呀。或者说,真的是太习惯学校的生活方式了吧...

这一节主要是在上一节的基础上,介绍一些可加模型或者树模型的相关(改进)方法。

MARS

MARS全称为Multivarible Adaptive Regression Splines,看名字就能猜出来大致他是做啥的。MARS这家伙与CART一脉相承(话说CART的竞争对手就是大名鼎鼎的C4.5)。不过,还是先说一下MARS到底是怎么玩的吧。

数据集依旧记作,然后就是splines的思想:我们定义,其中,画出图形来就是:

mars1

这样就可以定义I函数了:,以及,越来越有spines味道了是不是?

之后就是定义f函数:,然后有意思的就来了:中函数或者几个函数的乘积,选定了之后我们就可以用最小二乘法来求解相应的了。然后在接下来的每一步,我们都添加这样,一步步的,就开始增长。当我们用完了之后,显然有

over-fit的嫌疑,所以开始逐步的减少一些——考虑移除那些对减少残差平方和贡献比较小的项目。沿着cross-validation的思路,就可以定义函数

PRIM

PRIM的全称为Patient Rule Induction Method,呃看名字貌似是一种比较耐心的一步步递归的方法。果不其然,最开始就是我们要先定义“削皮”:选取区间内任意的,比如0.1,然后开始削皮~削皮的策略大概就是,选定一个维度,去掉这个维度比如最大10\%或者最小10\%的样本,然后看剩余部分的y均值有没有增长。总共有p个维度,所以我们有中削皮法。选择其中上升最高的方法,削皮。然后继续来一遍,直到不能再增长的时候,停止,最终得到一块“精华”(贪心的算法)。之后,我们又要开始粘贴,即再贴上去一块儿,看看是否能涨。这样我们得到一个区,区域均值为

从总体中扔掉这区中的样本,然后继续做下去,比如一共J次,得到J个区域(这些区域的空间可能是有交集的),这样的策略称为Bump-Hunting(肿块寻找),最终得到若干个区域,各区域中的样本均值作为(以第一次出现的空间为准)。

HME

HME的全称为Hierarchical Mixture of Experts,听起来像是一个智囊团的感觉。画出来呢,就是一个树的形状。

hme

大致的思想就是,以概率分配到各个枝条(软分类器),这样有。对于最下面一层的expert

net,可以用分类树或者其他任何的分类器。对于HME,可用EM算法来解。两类的情形,就有,有点像logit的变形有没有?

一句话的总结呢,就是这些方法看上去合理,比较容易follow the intuition,但是树类的结构弄得很难用现有的方法证明原理和一些相关性质(完全非线性呀)。

模型的总结:广义线性模型和基函数模型

从第一章到第九章,我们探索了很多个模型。说到底,模型就是,然后我们有参数模型,其中

最简单的来说,就是线性模型,形式为,其中。显然,线性模型便是参数模型。

然后就是广义线性模型(GLM),我们可以先扩张x,就有。说到底,就是已知的把数据从空间映射到一个新的空间。然后还可以把y再广义化,用一个可逆的已知函数变成。这样,就有,最终说来这两个空间实现了一种线性的映射关系。

接下来我们就会看到一种形状很类似的树模型,但不是GLM:。显然这里远非线性的,而且是变量。

接着参数化,我们就有,若未知,即可变,则非GLM。这类的模型更适合的名字是:自适应基函数模型,即我们试图构造一些可以自适应的基函数,然后通过其线性组合构造最终的模型。这类模型经典如:树模型、GMM(高斯混合模型)、神经网络等。