Categories
读书有感

最近几篇社交网络分析 (SNS)

最近关注了一下SNS这边的研究,主要是Linkedin, Quota 和 Facebook。

先贴一下链接:

简单提纲挈领一下这三篇都是干啥的。

  • linkedin那篇主要是说在一个社交网络中,设计一个随机实验是比较困难的,主要是有"溢出效应(spill-over effect)"或者其他network effect,所以就不满足独立同分布的a/b test 假设了。比如,linkedin改变了一个人首页的feed,然后他评论或者转发了一下,他的朋友(control)组里面的也就可能看到;或者说linkedin给一些用户首页展现"endorsement",那这个显然是有溢出效应的(甲 endorse 乙,乙也很有可能反过来endorse 甲)。所以他们做的主要是三件事:分析简单纯随机a/b test的不足、建立数学模型并数值模拟基于已知网络结构的网络效应、采用聚类(clustering or particition)的办法随机实验各个小群体。
  • facebook那篇跟容易让人想起来他们以前那次在大选之前拿用户feed做实验。我总感觉facebook有一群潜伏的政治学研究者...这次这篇发在《科学》上的倒是没有做实验,只是分析了一下朋友们之间的政治观点异同。此外,他们还画了一下不同政治观点(保守、中立、自由)群体的网络样子。
  • quota那篇相对来讲就稍微没那么成熟。我跑到那个meetup去了所以大概说一下idea。quora关注的是如何让用户找到感性的问题、以及如何找到最合适的人来回答。所以他们很关心一个问题能在network里面传递多远、多久。他们有一些social channels、比如你关注的人的动态、你关注的话题的动态之类的;还有一些非social的channel,比如google,比如摘要邮件。所以他们就来分析,是不是follower越多的人的回答越容易得到更多的upvote(类似于点赞)呢?答案是肯定的,但是随着时间的衰减social channel的作用越来越弱,最终收敛到60%还是多少来着。其他的分析也大致跟此相关,描述性分析为主。

总结:sns现在做的越来越细致、更注重于问题本身而不是炫技。大致的问题主要有:信息是怎么在社交网络传递的?不同群体之间的差别与联系?人们是怎么被网络中的变化所影响的?这种影响如何量化?如果要做实验,怎么控制溢出效应?如果要做模拟,怎么有效的利用各种信息和已知的网络结构?

一点点在推进科学的进步的感觉?

Categories
互联网产业观察 经济、IT观察与思考

[RAAT]第二话:如果,定格初见~

有句很煽情很酸的文字,叫做“人生若只如初见”,然后再随意的填上几个星星点点的省略号就可以了。初见,嗯,那么多人事匆匆,初见也显得格外珍贵了。有的时候,是不是一别,就不知道何时才能再相见?

如果,如果,你是一个软件的开发者或者网店店主,那么,你和每一位顾客的初见,又是什么样子呢?这个时候第一印象——第一次使用体验或者第一次购买体验,往往是决定了这到底是个回头客还是一去不复返。顾客都是懒的,他不会那么主动的给你提供那么多反馈,那么,你可以怎么了解到他的更多信息呢?如果你自己开发一个软件,那么恭喜,每一次和用户数据交互的时候,你都可以记录一些信息。然后这些信息累加起来,就成为了你们之间的来往信息。可问题是,就算打电话我也不能把她说的每句话都记住啊,更何况来来往往那么多数据。应该保留哪些呢?

好吧,不效仿什么“甄嬛体”了,还是“说人话”吧。继RAAT第一话说了说微博数据与network effect玩法之后,现在的问题是:

如果你是一个app的开发者,你应该记录哪些用户反馈/交互的信息呢?

这个问题是一位创业青年过年的时候问我的,到现在我也只能理出来一个简单的回复,真的是有些抱歉。同样的类似的问题,或者更general一点用学术化的语言来表达,那就是,

设计一个社会实验/survey的时候,你会问哪些问题、记录那些反馈呢?

或者说,当你面对一个回归分析问题的时候,

你会把那些变量放入回归方程呢?你关心的是哪些纬度呢?

这个问题可能是一个非常ad hoc的,往往需要根据一个具体的产品、业务或者目标来因地制宜的选择。比如,我想提高落园用户的粘性——好不容易来一次,多看几个网页呗,那么除了版式设计什么好看一点之外,我还得多观察一下博文之间的关联性——读过XX的,还倾向于点击XXX。这样,“相关博文”那里就可以优化一下,而不仅仅是现在这样基于tags的关联了——嗯,根据已有用户的阅读行为,来建立collective intelligence记录,然后向新的访客推荐。挺好的不是么?那显而易见的,为了达到这个目标,我需要记录每个访客(比如ip或者cookie识别),landing的网页及其来源、停留的时间、接下来点击的动作等等,大多数指标都可以在google analytics里面看到。

那么对于一个app,用户识别首先不是大的问题——需要购买嘛。这样的话,就不用劳神记录cookie什么的了。然后,从用户体验的角度,往往需要经历一个新手->热衷体验->维持一个稳定的访问/使用频率。依旧以我的这位朋友的产品为例,他们的产品叫做“我有啦”,是一个在线分享自己所拥有的物品的社交平台,类似于一个“物品签到”的概念。现在有个很具体的问题,怎么充分调用network effect来增加新用户、减少流失用户呢?这个过程中,需要什么样的数据呢?

所有基于SNS的产品推广的时期最重要的怕就是利用社会网络自身的network effect扩散特性,最成功的例子大概就是开心网当年利用病毒营销异军突起,利用虚拟游戏当中的奖励刺激用户去邀请自己的亲朋好友加入。然后,开心网的社交游戏特性,又进一步加强了这种朋友联系对于用户使用粘性的正作用(network effect在社交游戏中成功的例子还可见于最近很火的猜词游戏Draw Something)。从直觉来说,用户最乐意向他的朋友们推广一个应用的时候,应该是他使用热度最高的时候--尤其是这种以“炫富”+“拼爹”为卖点的app,不赶紧向自己周围的朋友们炫耀怎么可以呢?

为了识别一个用户的成长轨迹、以便于在他热度很高的时候给予一些奖励(尤其是虚拟地位勋章等等),来刺激他拉自己的朋友进来攀比,必要的数据记录自然是用户每天登陆的时间、地点,然后一连串的点击行为来判断他到底是在摸索这个软件怎么使用还是已经成为了一个熟络的高手(包括错误操作的提示和记录),这样就可以完成初期对于用户成长周期阶段的识别(被用滥了的CRM-customer relation management-系统基本概念之一)。一种理想的情况是,如果根据已有用户的成长记录,发现用户的每日使用时长或者每日点击量呈现S型曲线增长,区别只是增长基数、斜率不同,那么一个简单的函数拟合预测便可以得知用户使用高峰时点的来临,然后采取相应的激励措施。另外一个需要强调的是,在采取了任何策略之后,务必须要关注的就是用户的反馈,这样会知道上一期时点的选择是不是最优的——一种事后的反馈和假设参数的更新。

除了激励用户推荐给自己的亲朋好友之外,network effect另外的应用便是在用户呈现流失倾向的时候,利用朋友的力量来提醒他回来看看。这里有意思的是,根据最近一个基于facebook的研究显示,并不是“来邀请加入的朋友的数量”而是“这些朋友分属的圈子”对邀请成功率有更决定性的影响,因此提醒的时候需要发送的内容也应该是该用户最感兴趣的商品类别以及他最关心的朋友。这样,需要记录的就是他每次访问、评论物品等展现出来的行为,以及他朋友们的互动记录。

到此,直接的一种利用社交圈子的营销机制已经建立,后面进一步利用"用户-物品"双重联系的网路模型还可以进一步优化。暂时直觉只到这里。于我看来,一切所谓的营销都是一个营销资源最优化的投放问题:在最优的时间、对最合适人、采取最优的策略。如是来看,其实什么基于网络与否也只是对资源投放效果的一个预估,和其他一般的营销总体思路并无二致(p.s. 有意思的是,最近还被问到诸如电商 coupon 券应该怎么发放…一样的道理嘛,为了最大化ROI自然是在已有数据的基础上,分析并预测式选择反馈最大的人群,促成其关键购买行为成长环节的转化)。

上述局限:只能知道使用自己开发的产品的用户信息,无法得到并利用其他业务的使用信息,从而偏好数据来源受到极大局限,进而影响全方位对用户的偏好识别、把握以及差异化新产品的推广。换言之,交叉推荐等不可行。

这一话更多的是一些具体的问题和可能的对策,暂时不涉及技术实现策略。在最后一话,针对前两话涉及到的数据搜集及分析,将会尽量给出相应的解决策略,还请稍待片刻。

Categories
互联网产业观察

商业模式的创新?

最近一直在思考一个问题,什么样子的算是创新的商业模式?自从被某人说道“现在的成功都是商业模式的成功而非产品的成功”。原来一直对商业上的事情比较懒,觉得自己并没有那么敏锐的商业嗅觉,就只是走马观花的看别人都鼓捣出来什么。从这个意义上说,商业更多的是一种经验,而不是一种科学。也就是说,我的理解中人们无法像推导数学公式那样推导出来一种商业模式,无论是营销还是融资,一定会在市场中大放异彩的。很多商业创新都是企业家的动物精神的体现,是在经历了风风雨雨后一种“灵感”似的昙花一现,而不是在若干数学公式中可以寻觅踪迹的。

不知道有多少人同意这种说法,我觉得Microsoft的成功不是产品的成功——当然我不排除window在当时是一款不错的产品,但还不足以不错到占据整个市场达到垄断。微软的捆绑销售战略等等达成了一个软件帝国。有的时候windows太高调以至于人们不易去观察office的光彩,我个人觉得office是集中体现微软野心和长远计划的。是不是觉得office比windows好破解的多?以至于现在在国内动辄干个啥都是doc和xls、ppt,你见过多少人用latex或者OpenOffice?至少99%的电脑上都会装上一套office,就算自己不想用但是要交个表格之类的还是得借助这东西。更有甚者,ppt的地位我觉得在可见的十年内是难以撼动的,beamer确实难以望其项背,从展示效果来说除了flash几乎很少见到比ppt更漂亮的商业展示。可是,有多少人会做flash?又有多少人离不开ppt(尤其是泛滥的各式炫目模板)?可见,Microsoft在office系列的市场拓展上必然是“醉翁之意不在酒”,因为个人用户虽然几乎不为自己的使用付费,但是你的老板是要付钱的。大公司里面有几个敢用盗版的?有这么广阔的群众基础,微软就每年等着花花的金钱进钱包就可以了。也难怪office系列每次的更新都是不痛不痒。以中国为例,多少学校尤其是中小学把office系列作为计算机教学的必备内容,多少人接触电脑的第一堂课都是学会操纵office系列三大战舰。你怎么指着大家工作后说学latex就学latex,说换成不习惯的OpenOffice或者wps就换?微软的这招实在是计谋深远。

说完了有点夕阳的微软,再说Google。Google的创新就更简单了,免费。2G(或7G)的邮箱,免费;视频,免费;阅览器,免费;音乐,免费(仅限中国);图书馆,免费……用户几乎没有任何抵抗力的喜欢上了Google。关键是Google免费的产品往往还比其他家收费的好用,比如Gmail,见过了太多太多人用过Gmail之后再也不想转到其他的邮箱(当然我必然属于其中)。于是各大厂商趋之若鹜,抢着给Google送钱打广告推销自己的产品,然后望着哗哗而来的关键字流量感动的泪流满面——平时到哪儿去找这么多目标顾客群啊!于是,双赢的大好局面产生了,Google也就发达了。

再说最近很热的Apple,市值一跃超过了Microsoft,成为了大新闻。说到Apple,它赚钱的自然是iPhone和iPod,但你可别天真的看着网上说什么“一个iPhone的制造成本仅为售价的1/2”就觉得苹果很暴利了。其实它大多数钱来自app store和iturns的售卖。这样的平台大大降低了人们买音乐和买软件的成本,而每款软件不高的售价却聚沙成塔,喂饱了Apple。多好啊,人们一边玩着iPhone还不时的觉得“我的是Apple,多fashion”,然后软件开发商满意地笑着“要不是放在app store我怎么能卖出这么多拷贝啊”,当然最后自然是乐的数钱的Apple,消费者和厂商两面赚钱,这生意做得多划算啊~

说完了这些IT圈子的,别以为其他圈子的都在墨守成规。GE(通用电气)的发家史就是一部把一个制造企业打造成一个金融企业的传奇历史。GE在每年赚取的租金和修理费就够这么庞大的一家子吃喝还有余,很难想象吧?别看GE看起来貌似比其他很多企业低调的多,他家的算盘打得很是精明呢!当然,金融企业的麻烦就是金融危机,这也是这么多制造业企业中它第一个轰然倒下的缘故(错把GE当GM,该罚!GE还活的好好的呢)

我现在一直在想,下一个商业模式的创新会是什么?是营销、融资还是新产品?

可预见的是,如果接下来不发生一次惊天动地的工业革命,像电力取代蒸汽机那么耀眼,新产品的产生也是很有限了。电脑每年在升级,电视从纯平到液晶,无论再怎么发展,总不会是那种“翻天覆地”的变化,最多只是让人眼前一亮。当然我无意于贬低富有创新精神的科技工作者,也希望他们的创新可以进一步带来人们生活的进步。但是单单从一个较短时期的商业模式看,大概是与新产品无关了,毕竟他还有一个模仿者问题。

然后就是营销模式。病毒营销、直销等等越来越多的取代传统的广告营销,但这些都是更容易激起一时波澜而不是长久的创造影响力。我看好的一种模式是基于social network的,但或许正如我前面说的这东西更多的是经历丰富之后的“灵感”而不是数学推导或者计算机模拟,如何利用social network还是一个各个厂商都在跃跃欲试却没有特别好的办法的问题。当然,你可以说Facebook就是借助social network成长起来的,但是Facebook怎么大规模赢利或许正是折磨着他的CEO每天寝食不安的问题。同样的还有twitter,它现在做成了一个渠道,但是谁都不知道怎么倒水才能肥水不流外人田。哗啦啦的一股脑灌下去,若是雨露均沾还好,变成了洪水怕是大家都要玉石俱焚了。我始终不认为那些充斥在各大顶级管理/市场学期刊当中的漂亮模型放到市场中一定“放之四海而皆准 ”,没经过市场检验的模型和几张废纸又有什么实质差别,一点价值都不创造。从这个角度上,我倒更欣赏做数据分析的那些人,至少鼓捣出来一个“男士逛超市买尿布的同时也会买啤酒”。只是现在的商战集中于红海而太过惨烈,没想出怎么可以开阔蓝海。看来对于我这种不曾在海上航行的人,估计进去之后连是蓝是红还分不清。营销需要天分,如果不是想做一个天天打电话骚扰陌生人的seller的话……期待看到这个领域更多的理论在现实中的应用,当然也期待不久的将来自己有机会不计成本的去实战一番,看看这到底应该怎么玩。

最后想说说融资。虽然我一直标榜“对金融不感冒”,但不代表不关注。金融,尤其是微观金融、企业层面的金融确实是可以决定一个企业生死的。打个比方,金融就是企业的血液,血液断流了大脑缺氧了你还活个啥?侥幸不死八成也成植物人了。但比较讨厌的是职业经理人,我一直觉得很多职业经理人太过短视,为了一时的业绩报表把企业的长远规划的毁灭了。百度、搜狐无一难逃此等厄运,一度沦为行尸走肉,不知道盛大接下来会走得如何。如果有一种金融模式的创新可以帮助企业跳出“上市融资”的怪圈,反而可能有助于企业按照自己的战略规划走下去,越走越远。但是对这一块着实是不了解,不知哪里可以创新亦不知现在运行在何种程度。

某种程度上,你可以把我看做一个商业的门外汉(连半个赵括或马谡都不如)。我不曾在任何一个公司担任一个正式的职位,也不曾做任何关于公司治理模式的研究。纸上谈兵都不算,多半是雾里看花,不知究竟看到的是几分。所以不要为一篇日志较真,更不要坚信什么。尽信书不如无书,更何况是一个人半夜痴人说梦?欢迎讨论,欢迎讨伐,也欢迎路过打酱油。

Categories
事儿关经济 互联网产业观察

复杂网络的几何模型?

有点时候觉得复杂网络之所以可爱,就是在一个特定的场合下或许可以几何化,变得很直观。当然,简单的几何化就是点与点之间的连线,不过那样我倒是觉得稍显纷杂,虽然有方程可以描述,但还是不够简洁。

前几天在校内无聊的看帖子,有个很恶俗的帖子中有句很经典的话,大意是:

想知道你的年收入是多少吗?把你周围的10个好朋友的年收入加起来,然后除以10得到的平均数就大概是你的年收入。

这句话的依据就是“物以类聚,人以群分”,所以你的社交圈往往也离自己的实际生活不会太远。姑且我们不去深挖那些细节上的陷阱,从一种很单纯的层面来看,假设每个人只与10个人有社会网络意义上的联系,而后整个社会(比如有1000人)以这种联系互相连接在一起,且满足每个结点(即每个人)上的数值等于周围结点平均值。那么这个模型会是什么样子呢?

当然这可能是个三维空间都承载不下的几何模型,我的第一反应是“球”。简而言之,这个“球”得是一个匀质的球。球有什么好的特性呢?下面细说。

不知道大家有没有一个比较奇怪的“习惯性动作”,反正我是经常会这样,那就是在看电视的时候没事干就折腾遥控器玩。我折腾遥控器的一大习惯就是在遥控器的所有键上找到一个键,可以用手指单点这个键的时候足以支撑整个遥控器的平衡。其实说白了,就是找一个近似的“重心”。

球最好的特性之一就是在球面任何一个点栓一根绳,然后垂直下落,那么通过该点的垂线一定通过球心。如果我们此时把球分层面来看,那该点也一定是这个层面上的“重心”。不知我这样的说法是不是有些难以理解,简而言之就是你用手指顶起球面上任意一个点,都可以举起球来,就像篮球运动员转球似的。这样的平衡,是不是可以视之为一个“不动点”?

在社会网络这个模型中,或许很难去定义一个“重力”或言之“外部物体的引力”,可能只有内部各个节点之间的“万有引力”。这样一来,是不是在某种意义下各个结点都可视为一个特定层面的“重心”,从而满足了“该点值等于周围结点的平均值”?当然这里对于每个点的赋值或许要稍稍复杂些,甚至不一定是静态赋值(即可能是某个其他值的函数),因为我们在转球的时候就重新切割了层面,所以原来的坐标轴实质上已经改变了。

当然,我喜欢球的另外一个因素,就是很容易从中分离出其他的简单模型,比如“正四面体”。正四面体的每个顶点都满足到其他三个点的距离相等,而且也可以视作重心在各个层面上的“投影”。这样一来,从逼近的角度,我感觉最后还是会成为一个近似的“球体”。

这样绕来绕去或许有些繁琐了,也离我们起初的议题有些远了。可惜我一时想不出来什么办法来检验一下上面那个“收入平均值”的命题,若是能有如此的数据或许真的可以建立起来一个比较好玩的社会网络模型,然后看看它到底长得什么样子。大家喜欢社会网络模型可能的原因是它可以很容易的嵌套入各个细微的领域,是研究从个人行为到群体行为聚集的一种模拟。或许这样一来,经济学和心理学关心的很多议题,比如储蓄行为、利他行为都可以找到一种新的解释。

最后推荐一篇报道吧,可能有点稍显陈旧,是Economist杂志一月底的一篇特别报道:A world of connections。大家自己去网上搜搜吧,反正我看的是Google缓存的PDF版,官网不知何故打不开。里面说了一些最近SNS社区网站发展的情况,有意思的一些部分包括Pro ting from friendship、A peach of an opportunity等等。Facebook等或许是信息时代最先实践着社会网络模型的代表,它很大程度上在从商业灵敏嗅觉的角度挖掘着、探究着社会网络的价值。感觉很快,各个学科都会给予进入这个领域来做一些研究,信息安全的需要研究新的加密和隐私对策,做硬件的或许需要定制一些新的架构。Twitter上现在的信息冗余已经略有泛滥的程度,所以是不是信息的筛选、甄别和评价机制也需要有相应的对策。有句很经典的话,“发明是为懒汉服务的”。从商业价值层面,这样的挖掘会有收益上的激励。而从经济学层面,是不是有着更多的探讨空间,来研究人类的行为?如果经济学的定位之一依旧是“研究人类行为的科学”。

或许每朵花恰可以代表一个人

我依旧秉承着这么一个观点,互联网是研究经济行为最好的实际中存在的模型和近似。因为信息的传递,对经济行为来说,实在是太重要了。