落园 – Page 58 – 来者皆客

颇具Geek精神的impress.js

好吧，感谢@乐天诗人童鞋的推荐，让我见识到了这么震撼的presentation template。面对这种东西，完全没有抵抗力5555。什么powerpoint，什么beamer...什么pandoc自带的那几个破烂HTML5...一切都定格在impress.js。不要问我这是什么，如果你连自己搜都不会，就太不符合geek精神了。作者超级霸气，比如在帮助文档里面...

HOW TO USE IT

Use the source, Luke 😉

If you have no idea what I mean by that, or you just clicked that link above and got very confused by all these strange characters that got displayed on your screen, it's a sign, that impress.js is not for you.

Sorry.

然后乖乖的看源代码，好不容易看完几百行废话连篇自恋不已的说明，悍然发现：

Oh, you've already cloned the code from GitHub?

You have it open in text editor?

Stop right there!

That's not how you create awesome presentations. This is only a code. Implementation of the idea that first needs to grow in your mind.

So if you want to build great presentation take a pencil and piece of paper. And turn off the computer.

Sketch, draw and write. Brainstorm your ideas on a paper. Try to build a mind-map of what you'd like to present. It will get you closer and closer to the layout you'll build later with impress.js.

Get back to the code only when you have your presentation ready on a paper. It doesn't make sense to do it earlier, because you'll only waste your time fighting with positioning of useless points.

If you think I'm crazy, please put your hands on a book called "Presentation Zen". It's all about creating awesome and engaging presentations.

伤不起啊...还是乖乖的去找“Presentation Zen”这个东西吧。在书到手之前，乖乖的先弄一点东西应付一下接下来的presentation。可惜没搞定knitr，总是报错。只能手动拷代码进去了，sigh。

BTW，这里有个impress.js制作的稍稍潦草的slides，大家凑活着看一下，嘻嘻： http://loyhome.com/impress/ 注：中文默认用“冬青黑体”，没有的自己看着办吧....

Tags html5, impress.js, R, 幻灯片

互联网产业观察读书有感

互联网广告评估的“不可能定理”？

题外话若干。本来是打算老老实实呆在家里，吃饱了睡，睡饱了吃，吃饱睡饱看奥运的。结果想起来有个电影还没看，搜了一下居然已经上映了，果断下手抢票。可怜唯一的一个场次还是晚上十点半，索性先写点东西再出门看电影嗯嗯。这么晚了，只能一个人去看了，真伤不起啊～

继续说Rao的paper。和昨天说到的那篇相关，这里还有一篇working paper也是在说在线广告的评估问题。

On the Near Impossibility of Measuring Advertising Effectiveness (joint with Randall Lewis)

先看paper中引用的几个数字：

1. 每天，美国人平均要看25-45分钟的电视广告，另加不计其数的户外广告和网络广告。
2. 一些商业报告指出，每年美国的广告业营业额大概在1730亿左右，等价于每人每年500刀。
3. 那么平均算下来，广告投放者每人每天得拿到净利润1.35刀才可以盈亏平衡。
4. 按照企业平均边际收益水平计算，这些大概会带来4-6刀的产品销售额。

嗯，也就是说，我们扪心自问——每天我所花费的钱中，至少有5刀是被广告影响的？而对于不同行业不同产品，比如快消品和汽车广告，前者可能在每个消费者上得到的收益差不多，而后者可能会相当极端——要么是数千数万的消费，要么就是0，波动蛮大的（即方差很大）。这样说来，广告投入到底花的值不值呢？这个评估命题显得有点错综复杂了。

Rao在Yahoo!的时候，他们做了25次在线广告的随机实验（对应广告费为近三百万刀），然后发现，就算是大样本实验，由于个体的差异性太大造成太多噪声，广告的效果可能被因此低估。很多广告主关心的问题，就算借助实验，可能也是无法完美回答的——平均的ROI可能达到50%，但是鉴于方差实在太大，95%的置信区间可能就异常之宽了。这样，显著性检验什么的就很难拒绝“0效果”的原假设了。

与此同时，不做随机实验，效果更加的不可信...总之就是，这东西确实太难评估了，不做实验完全不可信，做实验也没法特别完美精确的评估...呃，听起来就像一个互联网广告评估的“不可能定理”...在互联网这样可以很好的跟踪用户点击什么的平台都没法评估广告效果，那么传统媒介如户外广告什么的，是不是评估就成为了更加困难的任务了呢？哎，数据完全不给力啊...也难怪我们这些天天做事的人痛苦的挣扎在评估指标的各种纠结中...

不过这篇paper，看起来真没营养啊...果然还是econ出身的，marketing sense不是那么强烈...哎~以后还是看看marketing science的paper好了。

Tags 不可能定理, 互联网广告, 噪音, 市场营销, 显著性检验, 置信区间, 随机实验

互联网产业观察经济、IT观察与思考

那些埋伏在互联网公司的经济学家....

嗯啊，自从著名的微观经济学家Varian跑到google兼职之后（话说Varian这厮最著名的八卦，就是自己在买新彩电之前，各种搜集数据建立模型，然后经过各种最优化选择了最佳时点入手...不就是买个电视嘛，至于这么学以致用嘛~），经济学帝国主义展露出其雄心勃勃的志向——无底线的渗透到各个行业各个环节。有的披着数量分析的外衣，有的带着策略决策的高帽，总之就是各种高端各种名正言顺。然后看看他们发出的paper嘛，什么呀，还是economists这群人自己的逻辑规则。哎呀呀~

最近看AEA系列的文章，发现了两位埋伏在互联网公司的大神，Justin M.Rao和David H. Reiley，貌似原来都在Yahoo!后来一个跑到了google一个投奔了Microsoft。然后这俩人还到处在econ期刊上面灌水，嗯嗯，小小谴责一下~你们又不评tenure神马的，干嘛总抢有限的publication资源啊(好吧其实这俩明明是过着我羡慕而暂时不可得的生活...)。

本来先看到的是这俩人发在JEP上的，关于垃圾邮件的：

Rao, Justin M., and David H. Reiley. 2012. "The Economics of Spam." Journal of Economic Perspectives, 26(3): 87–110.

然后顺藤摸下去，找到了俩人的网站（作为具有geek气质的经济学家，这俩人果然都有独立网站~），然后就看到了更多的papers:

The Good News-Bad News Effect: Asymmetric Processing of Objective Information about Yourself (local copy) (joint with David Eil AEJ Microeconomics July 2011

Here, There and Everywhere: Correlated Online Behaviors Can Lead to Overestimates of the Effects of Advertising (local copy) (joint with Randall Lewis and David Reiley). Proceedings of World Wide Web Conference 2011 Research Papers

嗯嗯，这两篇看起来也很有意思（对他们研究NBA的那些文章表示~米有兴趣）。这三篇中，最符合我现在的迫切需求的就是最后一篇——在线行为中的相关性与互联网广告效果评估。米办法，现在整天对着各种评估，各种错综复杂让人经常抓狂。还是看看文章舒服一点。

现在开始说一下最后这篇文章。记得刚刚到eBay的时候，就有被问到，“怎么从correlation到casuality？”。当然，呃，计量注重的因果推断只是狭隘的统计意义上的因果，不过还是比correlation有着实质进步的。因果推断的方法，嗯，很多，只要解决了内生性问题，什么都好说。那么，好吧，最simple and elegant的就是随机分组实验了，因为是随机，所以分组变量一定是外生的，所以估计了一定是一致的。然后就是根植IV理念的一系列方法，然后就是对付无法观测变量的panel data方法...时序我实在是不了解，所以这里就不知道了（最悲哀的是为什么总被问到时序的问题啊，个体的数据是多么好的面板分析base啊，为什么一定要损失信息弄成一些时序指标呢？）。

回到文章。一开始作者就提到了互联网广告效果评估的一个经典“相关行为偏差”案例：

案例1：用户行为的相关性与估计偏差

Yahoo!在首页上为某大厂商展示了其品牌广告，之后评估由其带来的相关的关于该品牌的搜索行为。没有对照组的时候，他们使用用户在campaign开始前一个星期的各种浏览行为作为控制变量，然后发现campaign带来的提升效果约在871%到1198%之间，可谓 too good to believe。

然后大家就有疑虑了，作为一个经常访问Yahoo!的用户，自然相比于那些不怎么常来的人有更高的概率看到该广告（在线广告一般定义exposure，即被展现即作为treatment），而且他们作为资深用户更有可能去搜索一些关键词。这样，就出现了这两个变量的高度正相关——搜索却不是在线广告直接引起的，而是用户本身特性决定的。然后大家就会说了，那么干脆把campaign开始前用户的搜索行为也作为一个控制变量好了。但是这个东西实在是不稳定，每天之间波动实在是太大。

简单总结一下，就是被展现过广告的用户for sure会比那些没有展现的用户更活跃，所以本身就是一个selected sample，也没有很好的控制变量可以完全的消除这里的选择性样本问题。而在采用了随机对照试验之后，最终的估计量是5.4%，也就是说实际上直接由广告带来的相关搜索只有5.4%的提升量。

然后就有人说，哦，都是同一站点的行为嘛，自然可能相关性比较强。那么不同站点之间的行为，是不是行为之间的相关性就会比较弱一些呢？然后就不会这样干扰结果了？于是，作者进行了第二个实验。

案例2：网站之间交叉行为相关性

Yahoo!在Amazon上放了一段30秒的视频广告，以推销Yahoo的一项服务。然后他们发现，在接下来的一周之内，这些看到该广告用户的中，使用Yahoo!这项服务的用户大概提升到以前的3倍！可见这个广告是非常之有效啊！

然而有意思的是，在同样的时间段之内，另一组用户看到的是是一段政治广告。作为control group，这些用户对于该服务的使用量也差不多增加了2倍——也就是说，可能是其他的一些campaign或者用户的自然增长导致了活跃用户的增加，而不是直接的源于这段视频广告。对比之后，该广告的效果只能用“微乎其微”来形容了。

所以，不同网站之间的行为可能是高度交叉相关的，不能简单的忽略这种行为相关的可能性去采用一些简单的观测评估。否则，往往估计效果会大大的偏离实际。

案例3：广告会造福竞争对手？

一个在线服务商在Yahoo!上展示了2亿次广告，但是很可惜，Yahoo!无法追踪到该广告为服务商直接带来的用户转化量。不过“幸运”的是，在这段时间，他们追踪到了该服务商的一个竞争对手的新用户注册量。于是，“不幸”的结果发生了——看到广告的当天，用户更可能去注册竞争对手的网站用户。莫非，这段广告不仅仅让投放者收益，而且也造福了竞争对手？（比如促进了消费者对于一项新服务的认知度，我们习惯称之为正面的“溢出效应”）

还好，当时Yahoo!也设置了对照组，发现其实对照组的用户在这段时间之内也有很多人去竞争对手网站注册。所以其实这种溢出效应基本为零，不用担心啦~竞争对手用户数上升可能是与此同时其他促销或者广告行为的影响，与这段广告没什么关系的。

嗯，其实这篇paper本身米有什么technical的难度，稍稍学过一点本科计量经济学的应该都能顺利的看懂，不过几个案例还是蛮有说服力的。唯一稍稍遗憾的是，这篇文章的style还是太economist taste了，不是那么的符合业界人士的思维路径...

我想在此基础之上，稍稍多说几句关于“实验设计”的事儿。随机实验很简单的，解决了很多内生性相关性问题，是一个典型的“better data + simple method = better results"的例子。同样的，很多时候如果可能，提高数据的质量而不是寻求更复杂的模型，往往是解决问题最省力的办法。这里的数据质量不仅仅是说“除噪”这些基本功，而也包括数据是不是贴近分析目的设计和搜集的。去年写了一系列的“社会网络中的实验”，一直在说一个优雅的实验设计会带来多么优雅的分析。当然很多的时候，一些客观的现实问题导致实验也只能被优化到一个特定的层次。其实一直在想的是，连续的实验该怎么设计？

有的时候，因果关系不需要一次次的挖掘，实验也不需要每次都做，毕竟实验都是有成本的。如果能设计出来一系列优雅的实验，那么很多问题就可以一次性的干净利索的回答，不好么？不过既然在这里说到这些，说明日常的工作中还是存在很大改进余地的。嗯，有空间才有成长，挺好的~

p.s. 其他两篇papers也会稍后介绍~嗯嗯。

Tags 互联网广告, 内生性, 因果关系, 因果推断, 在线广告, 垃圾邮件, 实验设计, 微观经济学, 效果评估, 数据质量, 最优化, 溢出效应, 相关行为偏差, 经济学家, 经济学帝国主义, 计量经济学, 连续实验, 随机实验

日常应用

中心极限定理的Monte Carlo模拟

中心极限定理版本一堆，每一个都牵扯一堆数学公式什么的...而与我而言，其核心就是，样本足够大的时候，可以无视其本身分布（只要均值、方差存在），(独立同分布的)样本均值将服从正态分布。这样一来，就可以使用正态分布的一系列良好性质，比如两个正态分布之间的检验什么的...

按说中心极限定理(下简称CLT)整天都在用，可是后面渐渐的习惯了计量那些矩阵推导渐进性质之类的，往往就忘了一些基本的统计量或者区间估计是怎么计算出来的...呃，眼高手低，还是老老实实的不时回头复习一下基础知识比较靠谱。

记得Yihui曾经在animation包做过一个动画展现CLT...相比而言，我就比较懒了，简单的做个模拟看看最终结果就好了。本来这种模拟应该扔给Matlab去做的，可惜啊现在电脑上米有，只能用R了。R里面可以产生随机数的分布有很多，一个个试呗...在基础的stats包里面，有一堆以r开头的函数，对应不同的分布（wiki页面建议看英文，中文长度完全不在一个量级啊...）。

rbeta： The Beta Distribution (wiki link)
rbinom： The Binomial Distribution (wiki link) (二项分布)
rcauchy： The Cauchy Distribution (wiki link) (柯西分布，N阶矩都不存在的分布...)
rchisq： The (non-central) Chi-Squared Distribution (wiki link) (卡方分布，正态分布平方的分布)
rexp： The Exponential Distribution (wiki link) (指数分布，独立随机事件发生的时间间隔)
rf： The F Distribution (wiki link) (F分布，两个卡方分布除以各自自由度)
rgamma： The Gamma Distribution (wiki link) (伽玛分布)
rgeom： The Geometric Distribution (wiki link) (几何分布，在第n次伯努利试验中，试验k次才得到第一次成功的机率)
rhyper： The Hypergeometric Distribution (wiki link) (超几何分布)
rlnorm： The Log Normal Distribution (wiki link) (对数正态分布，正态分布的指数的分布)
rlogis： The Logistic Distribution (wiki link) (逻辑分布)
rmultinom： The Multinomial Distribution (wiki link) (多变量正态分布)
rnbinom： The Negative Binomial Distribution (wiki link) (负二项分布)
rnorm： The Normal Distribution (wiki link) (正态分布)
rpois： The Poisson Distribution (wiki link) (泊松分布，单位时间内随机事件发生的次数)

那就...一个个试呗。计算机就是会让人的生活变得简单...结果如下。

Tags Monte Carlo模拟, R, 中心极限定理, 正态分布, 统计分布, 蒙特卡罗模拟

读书有感

主观评价与薪酬设计

本来心情大好的，在这一期AEJ：micro中拎出来两篇papers，准备好好研读的。第一篇关于online marketing的还好，长长的日志已经发出来了。但是这第二篇...我怎么选了一篇TSE（Toulouse School of Economics）的文章呢？自讨苦吃。

题目蛮诱人的，尤其对我这种热衷于机制设计游戏的孩子来说。

Maestri, Lucas. 2012. "Bonus Payments versus Efficiency Wages in the Repeated Principal-Agent Model with Subjective Evaluations". American Economic Journal: Microeconomics, 4(3): 34–56.

什么主观评价体系啊（原来都是看客观评价的），奖金激励啊，有效工资啊，重复PA博弈啊，看起来多么实际的劳动市场机制设计问题啊。然后呢？看到1/2处，我已经忍无可忍了。假设，也太多了吧。各种陈述，各种规则，各种各种最后得出来一些不怎么强的结论。耐着性子推了1/3的公式之后，终于忍无可忍了，直接扫文字，最后跳到conclusion了。

米有意思，大大的米有意思。Too economics to enjoy. 还是喜欢直觉比较强的文章，虽然某种程度上公式是逃不掉的。只是感觉，不够elegent吧。

我不知道应不应该复制一下conclusion，还是复制一下abstract吧。

We study an infinitely repeated principal-agent model with subjective evaluations. We compare the surplus in efficiency-wage equilibria and in bonus-payments equilibria. The agent receives a constant wage and is motivated by the threat of dismissal in efficiency-wage equilibria. The agent receives a bonus and quits the relationship after disagreements between his self-evaluation and the principal's performance appraisal in bonus-payments equilibria. We construct a class of equilibria with bonus payments that approach efficiency as patience increases. In contrast, payoffs from efficiency-wage equilibria are bounded away from the Pareto-payoff frontier for any discount factor.

让我对这篇paper没那么大耐心的另外一个原因是，新一期的Journal of Economic Perspectives也出了，还有一两篇有意思的paper可以读（尤其是一篇两个在业界的研究者搞出来的paper）。只是在这里简单记录一下好了。对TSE的风格，真的是让人越来越不喜欢了（虽然曾几何时，Laffont的那本书几乎成为桌案圣经...）。希望不是我开始越来越浮躁了吧？

Tags AEJ, TSE, 主观评价, 博弈论, 有效工资, 机制设计, 薪酬体系, 薪酬激励, 重复博弈

HOW TO USE IT

案例1： 用户行为的相关性与估计偏差

案例2：网站之间交叉行为相关性

案例3：广告会造福竞争对手？

案例1：用户行为的相关性与估计偏差