Categories
事儿关经济 互联网产业观察

复杂网络的几何模型?

有点时候觉得复杂网络之所以可爱,就是在一个特定的场合下或许可以几何化,变得很直观。当然,简单的几何化就是点与点之间的连线,不过那样我倒是觉得稍显纷杂,虽然有方程可以描述,但还是不够简洁。

前几天在校内无聊的看帖子,有个很恶俗的帖子中有句很经典的话,大意是:

想知道你的年收入是多少吗?把你周围的10个好朋友的年收入加起来,然后除以10得到的平均数就大概是你的年收入。

这句话的依据就是“物以类聚,人以群分”,所以你的社交圈往往也离自己的实际生活不会太远。姑且我们不去深挖那些细节上的陷阱,从一种很单纯的层面来看,假设每个人只与10个人有社会网络意义上的联系,而后整个社会(比如有1000人)以这种联系互相连接在一起,且满足每个结点(即每个人)上的数值等于周围结点平均值。那么这个模型会是什么样子呢?

当然这可能是个三维空间都承载不下的几何模型,我的第一反应是“球”。简而言之,这个“球”得是一个匀质的球。球有什么好的特性呢?下面细说。

不知道大家有没有一个比较奇怪的“习惯性动作”,反正我是经常会这样,那就是在看电视的时候没事干就折腾遥控器玩。我折腾遥控器的一大习惯就是在遥控器的所有键上找到一个键,可以用手指单点这个键的时候足以支撑整个遥控器的平衡。其实说白了,就是找一个近似的“重心”。

球最好的特性之一就是在球面任何一个点栓一根绳,然后垂直下落,那么通过该点的垂线一定通过球心。如果我们此时把球分层面来看,那该点也一定是这个层面上的“重心”。不知我这样的说法是不是有些难以理解,简而言之就是你用手指顶起球面上任意一个点,都可以举起球来,就像篮球运动员转球似的。这样的平衡,是不是可以视之为一个“不动点”?

在社会网络这个模型中,或许很难去定义一个“重力”或言之“外部物体的引力”,可能只有内部各个节点之间的“万有引力”。这样一来,是不是在某种意义下各个结点都可视为一个特定层面的“重心”,从而满足了“该点值等于周围结点的平均值”?当然这里对于每个点的赋值或许要稍稍复杂些,甚至不一定是静态赋值(即可能是某个其他值的函数),因为我们在转球的时候就重新切割了层面,所以原来的坐标轴实质上已经改变了。

当然,我喜欢球的另外一个因素,就是很容易从中分离出其他的简单模型,比如“正四面体”。正四面体的每个顶点都满足到其他三个点的距离相等,而且也可以视作重心在各个层面上的“投影”。这样一来,从逼近的角度,我感觉最后还是会成为一个近似的“球体”。

这样绕来绕去或许有些繁琐了,也离我们起初的议题有些远了。可惜我一时想不出来什么办法来检验一下上面那个“收入平均值”的命题,若是能有如此的数据或许真的可以建立起来一个比较好玩的社会网络模型,然后看看它到底长得什么样子。大家喜欢社会网络模型可能的原因是它可以很容易的嵌套入各个细微的领域,是研究从个人行为到群体行为聚集的一种模拟。或许这样一来,经济学和心理学关心的很多议题,比如储蓄行为、利他行为都可以找到一种新的解释。

最后推荐一篇报道吧,可能有点稍显陈旧,是Economist杂志一月底的一篇特别报道:A world of connections。大家自己去网上搜搜吧,反正我看的是Google缓存的PDF版,官网不知何故打不开。里面说了一些最近SNS社区网站发展的情况,有意思的一些部分包括Pro ting from friendship、A peach of an opportunity等等。Facebook等或许是信息时代最先实践着社会网络模型的代表,它很大程度上在从商业灵敏嗅觉的角度挖掘着、探究着社会网络的价值。感觉很快,各个学科都会给予进入这个领域来做一些研究,信息安全的需要研究新的加密和隐私对策,做硬件的或许需要定制一些新的架构。Twitter上现在的信息冗余已经略有泛滥的程度,所以是不是信息的筛选、甄别和评价机制也需要有相应的对策。有句很经典的话,“发明是为懒汉服务的”。从商业价值层面,这样的挖掘会有收益上的激励。而从经济学层面,是不是有着更多的探讨空间,来研究人类的行为?如果经济学的定位之一依旧是“研究人类行为的科学”。

或许每朵花恰可以代表一个人

我依旧秉承着这么一个观点,互联网是研究经济行为最好的实际中存在的模型和近似。因为信息的传递,对经济行为来说,实在是太重要了。

Categories
事儿关经济 经济、IT观察与思考

复杂网络和社会网络

在正式的写昨天列下的三个议题之前,我想先说一点关于复杂网络(complex network)和社会网络(social network)的东西。

第一次从学术意义上接触这两个词儿还是不久之前,也就是去年冬天的R会议上。已经记不得是谁的presentation里面有一幅很经典的复杂网络的图了(当时学到的东西太多了,很难一一拎清楚来源了。欢迎各位知情人士把图扒翻出来给我),而后大家的话题也多多少少牵扯到复杂网络。

先澄清一下这两个概念之间的区别:从我的理解来说,复杂网络更多的是一种数学工具,一种分析问题的方法。而社会网络则是一种概念和定义上的东西,是社会学研究的对象。现在社会学研究社会网络的时候会经常用到复杂网络的工具,这也是二者的结合点。简而言之,复杂网络>社会网络。

或许社会网络中最著名的就是“六度分割理论”:

美国著名社会心理学家米尔格伦(Stanley Milgram)于20世纪60年代最先提出。“你和任何一个陌生人之间所间隔的人不会超过六个,也就是说,最多通过六个人你就能够认识任何一个陌生 人。”

还有一个著名的“150法则”:

从欧洲发源的“赫特兄弟会”是一个自给自足的农民自发组织,这些组织在维持民风上发挥了重要作用。有趣的是,他 们有一个不成文的严格规定:每当聚居人数超过150人的规模,他们就把它变成两个,再各自发展。“把 人群控制在150人以下似乎是管理人群的一个最佳和最有效的方式。”——150成为我们普遍公认的“我们可以与之保持社交关系的人数的最大值”。

我第一次对复杂网络有个感性的认识大概是大一的时候,当时雅虎中国出来一个很有趣儿的名人搜索(当然现在很多网站都有了),然后我就泡在上面折腾了个把小时。

复杂网络从数学的角度看自然离不开“图与网络分析”(插曲:我觉得运筹学是我学的最得心应手的数学课,几乎不用证明多好啊,直观的很容易理解,算法上的东西比定义上的容易搞定得多)。不过这里我们撇开数学不谈,看看复杂网络的应用(原文在此):

研究所涉及的网络主要有:生命科学领域的各种网络(如细胞网络、蛋白质-蛋白质作用网络、蛋白质折叠网络、神经网络、生态网络)、 Internet/WWW网络、社会网络,包括流行性疾病的传播网络、科学家合作网络、人类性关系网络、语言学网络,等等;所使用的主要方法是数学上的图论、物理学中的统计物理学方法和社会网络分析方法。

钱学森给出了复杂网络的一个较严格的定义:具有自组织自相似吸引子网络的内聚倾向)、小世界相互关系的数目可以很小但却能够连接世界的事实)、无标度中部分或全部性质的网络称为复杂网络。

看来看去,社会网络无疑是复杂网络应用中最好观测、最易直观理解的例子。

之所以提起来这个话题,主要是前几天无聊的时候翻了翻去年10月的一期《大众软件》,虽然其中《复杂网络——网络的科学》一文更多的是一种科普的角度来阐述复杂网络的概念,但是也并非没有分析上的启迪意义。复杂网络或许从数学工具的角度已经有比较成熟的框架和脉络,但是真正应用到社会学中,又是另外一番天地。经济学的研究现在特别讨厌弄个假设然后找个数学家来解题,毕竟我们研究的是人类的行为。

记得R会议之后Mr Liu曾发给我一篇沃顿商学院俩教授写的论文,原文载于Marketing Science,标题为New product diffusion with influences and imitators(谢谢tryshy订正)。可能从商业的角度看这篇文章有着自己的市场营销层面的价值,但是我感兴趣的则是里面利用的社会网络的分析方法。当时我是出于我理解中的微观经济学缺少一些人类行为层面的分析(我总觉得贝克尔在《人类行为的经济分析》里面只是分析了经济因素而非把行为本身作为一个决定模型的因素),也想多了解一些behavior economics方面的东西。从某种程度上来说,群体的行为必然是个人行为的加总,只是这个不能简简单单的是一个线性加法,而有着更多的决定因素和嵌套关系。

对于群体行为,心理学和社会学了解的要比经济学通透的多,他们的精华成果也颇为值得借鉴。我欲借复杂网络构建模型,却奈何对其理解不足,怕造成灾难性的错误,只得搁置。故而对于群体行为,即将撰写的博文中只会涉及正态分布和布朗运动,暂时放下复杂网络。或许有朝一日,对复杂网络的理解通透了之后,可以在两者之间构建一个桥梁,或许能看到一番新的景象。

Categories
事儿关经济 网络新发现

[译文]动物们真的有动物精神吗?

原文标题:Do Animals have Animal Spirits? 

Marginal Revolution新鲜出炉的一篇博文。我承认这次我是标题党,动物精神是我比较感兴趣的一个话题而已。

译文:

我们在自然界中很容易看到“真实商业周期(real business cycle)”。我们不妨想象一个小生态系统——池塘。有一年一只寄生虫感染了浮萍。没有浮萍那么青蛙就没法捕捉飞虫,而后飞虫大量繁衍,但是青蛙却倍感饥饿,导致梭子鱼能吃的东西也变少。如果我们衡量总池塘的生物量(gross pond biota,GPD——译者注:这个我开始居然看成GDP了),我们可以看出自然的循环。事实上,如果我们测量池塘中的不同“部门”(青蛙、飞虫等),我们可以描绘出一幅完整的池塘中的每个部门依次对于开始这个冲击的反应、以及对其他所有部门的影响(就如同向量自回归)。

池塘里有一个凯恩斯经济周期吗?换言之,动物精神可以驱动一个自然界的商业循环吗?对我来说,很难确切的看出这个循环怎么工作。我们需要“钱”或者类似的东西对流动性产生冲击并且带来投资的下降。我们或许会得到一个群体协作类型的商业周期(coordination type business cycle with herd behavior,如同Roger Farmer)。有趣的是,在生物学中的这个趋势,至少在我看来,已被认为是群体行为——作为群体的最优选择,但在这里并不一定适用。我们知道粘菌在面对压力时候的自我组织和聚集。这个过程可以没有或者只有很少的外部冲击吗?一个自然生态系统可以提供一个商业周期循环的行为模型吗?如果只有人类拥有动物精神的话,这恐怕有些稍显荒诞。生物学和经济学有很多值得相互借鉴之处(译者注:比如一位评论者就说到“用Google Scholar”搜索一个生态系统循环模型“economics Lotka–Volterra”将得到3000+结果。)

顺带翻译一下的一个貌似来自学生物的人的回复:

如果我们允许青蛙换换口味,吃点原来不爱吃的东西,那么我们将不会看到如上的循环。
如果我们允许青蛙储存飞虫,我们也将看不到这个循环(他们将消耗那些存货并且用来交易)。

---我对生物学的了解胜于宏观经济学,先在此致歉。

Categories
事儿关经济

英文的神奇

可能是中文博客给过我种种神奇的经历了,所以现在已经见怪不怪了。但是英文博客却是好玩的紧,总有一些事儿出现让我觉得这个世界真的很神奇。

前几天更新了一篇日志,说的是我想写的一个题目,或者说我觉得足可以从本科毕业论文写到博士毕业论文的一个题目——如果我还有机会继续读下去并且打算拿到一个博士学位的话。没想到很快的就被某网站利用了,真神奇。如果不是trackback的机制,我估计也不知道原来还有如此神奇的事儿。可惜那个网站貌似是金融的,我在上面溜达了一圈实在没发现什么感兴趣的东西,而后灰溜溜的闪人了。

唯一有些疑惑的是,感觉那不是一个关于学术的网站……我就想难道我写的东西就这么的具有“广阔”的现实应用价值,以至于学术圈还未曾发现就被嗅觉灵敏的商业人士闻到了金钱的味道?真的是……(原谅我的自恋吧,哈哈。)

Fine... 最近一直在读凯恩斯的传记,实在是受益匪浅。这都读了一个月了,还没读完,不过万里长征也算是看到了尽头。凯恩斯的传记很有意思,越看到后面,搭在他的思想变化的脉搏上,就越让人感到兴奋。感触和体会真的很多,几乎每夜都在一种崇敬和兴奋交杂的心情中入眠。其实每天看完了都有一堆话想写下来的,可惜睡醒了就忘记了。简单的拎一点出来吧:对于数据的态度。书中提到“凯恩斯不是利用数据来证明自己的理论,也不是从数据中归纳出结论”,他有着非凡的数学才华,对于数据却更讲究直觉——“他从数据中发现问题、找寻灵感”。

“找寻灵感”说起来貌似也很容易,但是真正做起来往往就出现“做理论做得好的最后都转到计量去了”这种尴尬的境地。原来我一直坚持计量只能拿来作为论据辅佐证明理论模型的缺陷,但是看到凯恩斯的观点,才恍然大幅应该回归数据本源——我们生下来对于数据的态度,不就是如此吗?何必沉浸在计量方法的花里胡哨却忘记了我们为什么收集、分析数据?此言大有“一语点醒梦中人”的神奇功效。看到凯恩斯那种对于自己的理论谨小慎微的态度,才体悟到一个负责任的社会科学学家的态度。态度决定一切,不是吗?倘若都有此心,那么怎么会有dirty work甚至于学术腐败造假呢?

呃,华丽丽的跑题了。算了,先到这里吧,睡觉去了。

Categories
事儿关经济

利用Google Reader与最新学术信息保持同步

This post is written for those who are addicted to Google Reader/Rss subscription and live on academic papers.

很多学术男女们习惯于每周/月/季阅读最新的期刊以保持和潮流的同步。当然,有纸质版的期刊再好不过,我始终认为人在计算机面前的时候多少有些浮躁。不过,若是日复一日年复一年的看遍各大期刊,也是一件颇为累人的事情。虽说好期刊的文章质量大都有保障,但是也多少过于保守,有的时候一般的期刊上面却有能激发你的灵感的文章。尤其是作为学经济的,自然要讲究一个“交易成本”最小化,尤其是选择成本。

好在有互联网,有搜索引擎,根据某些关键词找文章自然不是一件难事。可是若是只想泛泛的看一些相关的东西,那么只是依赖搜索怕是不够。

好在有个东西叫做RSS,还有方便的浏览器(或者我更愿意称之为管理器)Google Reader,所以我们的最佳选择就是订阅一些相关机构网站的由一些相对“权威”人士维护的subscriptions。我熟悉的自然是经济学的领域,不过各个领域应该都有类似的东西,不是经济的不妨自己找找去。

对于经济学,可能除了期刊之外working paper才是最最新的东西,按照欧美两年的发表周期发出来的文章真的可谓是“黄花菜都凉了”。对付working paper,那么自然想到的就是Repec, 或者Econpaper。这里我就直接给出一个他家的免费服务——NEP: New Economics Papers。这里罗列了许多分门别类的订阅,由各个领域不用的专家在维护。对于现在分工这么细的经济学来说,最省事儿的办法就是看看别人弄好的东西——尤其是只打算看新闻的时候。

这里仅列出几个我感兴趣的subscription,其他的还请亲自移步自行挑选。

补充:

总有人问我其他学科的东西去哪里找,这里要特别感谢Hercy学姐发短信给我的:

http://arxiv.org/

这是一个working paper大集合,有点像NBER那种感觉。里面有Physics, Mathematics, Computer Science, Quantitative Biology, Quantitative Finance and Statistics这个几个分类,也有相应的RSS可以订阅。