linkedin – 落园

最近关注了一下SNS这边的研究，主要是Linkedin, Quota 和 Facebook。

先贴一下链接：

Linkedin: Network A/B Testing: From Sampling to Estimation
Facebook: Exposure to Diverse Information on Facebook
Quota: Upvote Dynamics on the Quora Network

简单提纲挈领一下这三篇都是干啥的。

linkedin那篇主要是说在一个社交网络中，设计一个随机实验是比较困难的，主要是有"溢出效应（spill-over effect）"或者其他network effect，所以就不满足独立同分布的a/b test 假设了。比如，linkedin改变了一个人首页的feed，然后他评论或者转发了一下，他的朋友（control）组里面的也就可能看到；或者说linkedin给一些用户首页展现"endorsement"，那这个显然是有溢出效应的（甲 endorse 乙，乙也很有可能反过来endorse 甲）。所以他们做的主要是三件事：分析简单纯随机a/b test的不足、建立数学模型并数值模拟基于已知网络结构的网络效应、采用聚类（clustering or particition)的办法随机实验各个小群体。
facebook那篇跟容易让人想起来他们以前那次在大选之前拿用户feed做实验。我总感觉facebook有一群潜伏的政治学研究者...这次这篇发在《科学》上的倒是没有做实验，只是分析了一下朋友们之间的政治观点异同。此外，他们还画了一下不同政治观点（保守、中立、自由）群体的网络样子。
quota那篇相对来讲就稍微没那么成熟。我跑到那个meetup去了所以大概说一下idea。quora关注的是如何让用户找到感性的问题、以及如何找到最合适的人来回答。所以他们很关心一个问题能在network里面传递多远、多久。他们有一些social channels、比如你关注的人的动态、你关注的话题的动态之类的；还有一些非social的channel，比如google，比如摘要邮件。所以他们就来分析，是不是follower越多的人的回答越容易得到更多的upvote（类似于点赞）呢？答案是肯定的，但是随着时间的衰减social channel的作用越来越弱，最终收敛到60%还是多少来着。其他的分析也大致跟此相关，描述性分析为主。

总结：sns现在做的越来越细致、更注重于问题本身而不是炫技。大致的问题主要有：信息是怎么在社交网络传递的？不同群体之间的差别与联系？人们是怎么被网络中的变化所影响的？这种影响如何量化？如果要做实验，怎么控制溢出效应？如果要做模拟，怎么有效的利用各种信息和已知的网络结构？

一点点在推进科学的进步的感觉？