Categories
读书有感

最近读paper的一些领悟

读paper易,做model不易,且读且珍惜。下面仅为个人半夜胡言乱语,轻拍~

最近扫paper的数量没什么下降,但是深入读全文的paper越来越少。一个原因大概是很多working paper 研究的问题我不怎么关心?毕竟不是读书的时候需要读很多paper来应对coursework presentation和literature review...

说说一些感受这样。看paper首先是看标题,有没有特定的关键字;有的话再去看下一步摘要,有没有有意思的地方,无论是建模方面还是结论。摘要有意思的话就标记出来,待扫完目录后去打印个别全文细细咀嚼。感觉现在扫working paper的功力越来越纯熟了,一个小时完成上述工序扫个十篇左右这样。

但是比较哀伤的是我发现大部分选出来的paper还都能读懂,尤其是实证的paper,清一水的不是DID就是RE或者RDD,最多来个IV。读起来更有意思的地方怕是背景描述这块,有很多历史人文地域常识可以了解。我想说那个ATE不是不重要啦,但这货真的不稳定(随时间迁移),做一个时间节点上的估计有多大的概率会历史重演呢?而且很多时候是需要多个因素共同作用的,就跟个化学实验似的,控制的除了原材料还有温度湿度气压等等,实验室里面这些客观条件可控,但经济发展中不可控的甚至不可观测的客观因素实在是太多了。计量更多的框架还停留于单因素分析上(当然单因素已然分析不易),是不是有点落后于时代的诉求呢?唉可能还是要期待数学工具、统计理念对于关系数据处理的更深理解吧。现在的network model还是孱弱了一点。

默默的再补充一个实践中在大数据(big volumn big dimensions)客户数据建模中的体会。很多的时候我们会倾向于找客户的原始特征,所谓的demographical variables,性别啊年龄啊收入啊。但是除了facebook这样真人社交网站,谁会告诉网站自己是男是女年方几何呢?然后为了找这些”珍贵的”数据,要不就是通过现有的数据来猜,比如买女士用品的八成是女性;要么就是通过调查来获取一部分人的真实社会属性。然后呢?扔到模型里面回归去...

我想说,若是前一种,何必绕着弯子从可观测的数据生生的去猜不可观测的数据,然后再用猜出来的数据去预测其他东西?直接用可观测的数据好了。本来就是社会属性->特定可观测行为->预测未来行为这样的路径(比如我知道啊买尿布啤酒组合的八成是新晋爸爸,但是我只要知道你买了尿布啤酒日后就也需要婴儿车日后消费潜力巨大就足够了嘛,我干嘛一定要去知道你是男性已婚已育?看看你买的尿布牌子我大概也知道你家的消费层次和接下来的品牌层次偏好了,何必去苦苦的猜你的收入?),有点像经济学里的“显示偏好原理”,或者有向的贝叶斯网络这样(给定上层节点信息,上上层节点信息无用),何必这么折腾...若是后一种,还需要去费时费力不讨好的调查?又不是以前数据尤其是观察维度稀缺的时代了。每次见到刚被象牙塔教育好的遵循123456黄金律步骤出来的建模者,我都忍不住先深深的吸一口气冷气然后苦口婆心的讲一下为什么这些东西其实不那么重要...

都是被现有的实证paper毒害的,动不动就是入户调查数据。哎,人家是做田野实验的需要手工搜集数据各种来之不易,和你们玩大数据的到处都是蛛丝马迹不一样啊!干嘛只会比着葫芦画瓢,明显使劲的方向不怎么对嘛。学界没数据啊所以没办法,业界一堆数据还愁数据搜集?随随便便做个随机试验前后数据爱取多少取多少...喵,尤其是做预测模型的,其实可以不用那么折腾呀。读paper易,却也是取其精华弃其糟粕,玩的灵活才开心嘛。

再啰嗦一句好了,学计算机和数据挖掘出身的只学怎么在现有数据基础上建模,不学基本的数据搜集实验设计这些统计理念,所以不会往这边想;学统计的又被一群没玩过大数据的长江前浪所禁锢,框架就在那里,你见或不见。估计等现在这一辈成熟了下一辈人就真的是站在巨人的肩膀上了。

Categories
我的生活状态

单一的色调

或许单调这个词儿就是“单一的色调”或者“单一的音调”的简称吧,不知道英文中的monotone到底是怎么个来源的。总之,单调说明了生活模式的不变,或者说没有什么波澜或者惊喜,只是按部就班的,每日如一。

连续三天,每天泡在学校敞亮的计算机室里面,不知疲倦的写和改paper。记得刚开始的时候觉得mac机真的是很惊艳啊,后来发现也就是这么回事儿,长得漂亮不是就可以靠长相一辈子卖饭吃的。哎!

文章写到最后,真的是越写越恶心,恶心到每天早晨都是被一场关于paper的噩梦惊醒,然后强迫自己继续打开电脑写paper。真的是很无聊哎!人生啊,难道不是应该更加丰富多彩一些的么?这样说来我也有点庆幸不是在读phd了,要不每天都是看论文写论文的,这日子真的,怎么过啊!不知道为什么,开始怀念上学期那种忙忙碌碌奔波于不同的课堂之间的感觉,看来上课还是相对而言轻松的很多啊。这学期,课少了,又经历了一些打击,弄得我现在真的是只想早点毕业早点完事,然后好好的狂欢一些时日。说实话,真的挺怀念大学的时候开始初识经济学那段日子,可以不知疲倦的从图书馆里面一本又一本的把书搬回来,然后一副向往的神情好好敬仰。现在则多多少少有点审美疲劳了?越来越找不到激情了,希望不是我老了。

记得考试的时候总觉得上课的日子是幸福的,然后后来申请出国的时候觉得能用考试解决的东西真的是最简单的(比如gre托福之流),后来出来了发现当年申请的日子还是蛮幸福的。总之,一层一层的,抽丝剥茧似的,体味着生活变得越来越艰难的滋味。了解的越多,就越不知所措了。有的时候真的是,井底之蛙也不是一件坏事——有些事如果从来不曾意识到,就不会去比较, 也就不会有各种比较带来的烦恼了。从这个意义上而言,站的高看得远也不尽然是一件好事情,毕竟人难免是贪心的,看到了就想要,哎。

最近看了很多很多书,主动的或者是被动的,但是缺乏与人交流的畅快感,经常只能半夜在自己屋子里面瞎兴奋一气,感慨这个作者这么这么有才华,或者这个故事居然可以是这样的。当然我不是指纯文学层面的东西,只是发现现在自己越来越能忍受文字本身的无聊,静下心来看故事了。记得小时候,从来都只是看情节的,最爱的自然是武侠小说之流。然后就是诗词,另一个极端,简短抽象,不过可能更多的是一种心灵的抒发和喜欢沉浸在想象中的那种美好吧。终于发现人还是一种群居的动物,总得有人经常说说话才行,要不也不会很多人总是在忍不住的泡校内之流了——孤单啊孤单啊。从这个意义上来说,现在的我也可谓是孤单的, 要不怎么会有心情在这里码字?

不知到周五晚上大多数人都在干什么?大概是各种各样的狂欢吧。其实狂欢只不过是一群人的孤单——聊以自慰。

不过无论如何,都会有个结果的。六月,嗯,流光溢彩吧。