其实这个是毕业论文附录的一部分(我可怜的毕业论文被我拆的七零八散的发布出来了),因为要求翻译一段英文原文,正好当时有意向翻译Jackson 的social and economic network,所以就把第一章引论翻译了一下子。里面是两个很有趣的小故事,让人对社会网络一下子印象颇深。这本书的部分章节可以在普林斯顿出版社网站上下下来试读,其中第一章也可以在Jackson自己的网站上下载。话说,前阵子做[cref %e7%bb%8f%e6%b5%8e%e5%ad%a6%e5%ae%b6%e4%bb%ac%e7%9a%84%e7%a4%be%e4%bc%9a%e7%bd%91%e7%bb%9c%ef%bc%88%e5%ad%a6%e6%9c%af%e5%9c%88%ef%bc%89]的时候不禁感慨,Jackson作为一个深谙社会网络重要性的大牛,自己在社会网络中果然居于不可替代的地位。可见理论与实践多么的和谐一致(说到这里,我不禁联想起谢益辉童鞋在R圈子中的hub地位,如果做一下social network analysis,估计结果也很可观。所以无论身处360行中的哪一行,如果想做状元,都请努力的建设自己的社会网络吧)。
注:下面的翻译忠实于原文,未经一般网络博客写作的气氛渲染。之中稍有学术名词,对其不感冒者直接跳过看结论即可。
- 中英文对照版可在此下载:jackson_cn_translation.pdf
一、美第奇家族成长史
这个故事将告诉我们,政治婚姻是怎么将一个原本平凡的家族推向权利的制高点的。
在第一个例子中我们首先来关注社会网络在意大利佛罗伦萨的银行家族美第奇 (Medici)十五世纪兴起的过程中所扮演的角色。美第奇家族被称为“文艺复兴教父”。当时美第奇家族在通知弗洛伦斯的少数几个家族中并不占优势,他们拥有的财富相比而言较少,政治地位也较低,但科西莫·德·美第奇一手导演了该家族的权利聚集。科西莫通过平衡美第奇家族在家族联姻、经济交往和政治支持网络中的中心地位,巩固了该家族的政治和经济实力。他对于社会网络中不规则地位的理解帮助他建立并且控制一个政党先驱,与此同时其他家族还在各种事务中挣扎。Padgett and Ansell [516]绘制了十五世纪三十年代佛罗伦萨几个重要家族婚姻网络的图形,为上述观点提供了有力的证据。图1展示了当时佛罗伦萨几个重要家族之间的联系,每条线代表两个家族尘缘之间的婚姻。
图1:佛罗伦萨家族之间的联姻关系
美第奇家族(科西莫·德·美第奇作为关键角色)在其此间兴起并逐渐掌控了佛罗伦萨的政治和商业。以前佛罗伦萨处于被几个大家族所统治所形成的寡头政治。如果我们关注各个家族的财富和政治势力情况,可以发现美第奇家族在其中并不突出,故而我们需借助观察社会关系的结构来理解为什么美第奇家族会异军突起。比如,斯特罗齐(Strozzi)家族有着更多的财富和当地立法机构更多的席位,然而美第奇家族的兴起让其黯然失色。正如Padgett and Ansell [516]所阐述的,理解家族兴起的关键正在于社会网络结构。
如果我们粗略计算当时网络中各个家族的重要性,只是单单的对家族婚姻连接数进行加总,就会发现美第奇家族位居榜首。然而,这种优势并不明显,他们仅仅以3/2险胜居于次席的斯特罗齐和瓜达尼(Guadagni)。虽然这对我们有所启发,但还不足以用作证据。我们需要更仔细的观察社会网络的结构,从而更好地挖掘美第奇家族成功的秘密。尤其值得一提的就是对于中间度(betweenness)的衡量。
代表家族i与j之间最短通路的数量, 代表了其中包含家族k的通路的数量。比如,在图1中,Barbadori 和 Guadagni家族之间最短通路长度为3,有两条:Barbadori - Medici - Albizzi - Guadagni 和 Barbadori - Medici - Tornabuon - Guadagni。如果我们定义i=Barbadori、j=Guadagni,那么。因为美第奇家族在两条通路上,所以。如果我们定义k=Medici, 、 i=Barbadori 、 j=Guadagni。同样的,如果让k=Strozzi,那么该值为0;如果k=Albizzi则该值为1。正因如此,美第奇家族在Barbadori 和 Guadagni家族的联系中居于关键地位。
为了获取一个家族何种程度上居于中心地位的直觉,我们可以计算中心度平均值。我们可以计算其在每一对家族之间最短通路的总数量所占的比例。美第奇家族在Barbadori 和 Guadagni的最短通路中所占的比例为1,而Albizzi为1/2。一个家族在其他各家族两两组合中的平均值代表了中心度,用来衡量其权利(依据freeman [255])。具体而言,我们可以对人一个家族 k 计算其中。如果i和j之间没有通路。分母表明其他家族最多可能有种组合。通过这样的方法计算可知,美第奇家族的中心度为0.522。故我们如果观察其他所有家族之间的最短通路,其中一半以上都需通过美第奇家族。相比而言,Strozzi为0.103,约10%。紧接美第奇家族位于次席的是Guadagni,其中心度为0.255。在某种程度上,婚姻关系正是交流信息、进行商贸往来、制定政治决策的关键。正因如此,美第奇家族相比于其他家族而言居于更有利的地位,至少从中心度上来看。当继续考虑当时社会环境的时候(比如战争后的财政问题),除了美第奇家族外别无旁人可以巩固势力。正如Padgett and Ansell [516, p. 1259]所指出的,“美第奇的政治权利起源于其他家族的在社会网络中的分隔,只有美第奇一个家族沟通了他们”。
这里的分析表明,社会网络结构是如何超越其他政治和经济特征所进行的分析,来提供一个有洞察力的视角。这个例子也说明社会网络结构的重要性并不是仅仅计算社会之间联系数就可得知的,对中间度或者中心性(centrality)的计算可以从不同角度来捕捉社会网络结构的特征。
这个例子亦提及了贯穿于本书的其他问题。比如,美第奇家族是偶然获得了社会网络中的如此特殊的地位,还是通过周密计划的?正如Padgett and Ansell [516, 脚注 13]所述,“现代的读者须知,当时所有家族的婚姻都是其族长(或同等地位的人)一手主导的。家族之间的联姻一定程度上正是一种政治联盟的体现。”在这种观点之下,我们接下来会问为什么其他家族相互之间没有形成更多联系,或者试图削弱美第奇的中心地位。我们亦会好奇,最终的社会网络是不是对于各家族来说都是最优的:对美第奇来说、对寡头通知来说、对十五世纪佛罗伦萨当地的政治经济运行情况来说。我们可以通过建立社会网络的成本和收益分析模型、以及网络形成原理的模型,来开始回答上述类型的问题。
二、现实版Gossip Girl
看Goosip Girl第一季的时候,是不是不太容易接受美国高中生之间如此混乱复杂的男女关系?其实,这很现实……
下面的例子来源于全国青少年健康纵向调查数据(National Longitudinal Adolescent Health Data Set),被称作“增加健康”。这些数据提供了多于9万个美国高中生的详细的社会网络信息,调查于二十世纪九十年代中期,且涵盖了学生们的社会经济背景、行为和观点。该数据提供且指出了网络的一些特征,本书后面章节将更为详细的讨论它们。
图2展现了该调查中某高中的学生之间恋爱关系的网络。这些学生被要求列出在调查前六个月内恋爱的对象。
图2:美国高中生恋爱关系网络
图2近似为一个二分网络(bipartite network),即节点可以被分成两组——男生和女生,所以只有两组之间有联系(有少数例外)。除了它的近乎二分特性,节点度的分布(与每个节点相连的边的数量)很符合边一致排列的随机图(具体见3.2.3),并且我们看到大型随机网络的很多特征。例如,有一个“巨大的分支(giant component)”,其中多余100个学生由一系列边所连接,而次大的分支只有10个学生。分支的结构对于疾病、信息和行为的传播有着重要的影响,将在第7、8、9章分别讨论。
此外,这个网络很类似于树:只有很少的循环或回路。在巨大的分支里面只有一个非常大的回路和一些小回路。回路的缺乏说明当沿着网络的边走直到死节点的时候,经过的大多数节点都是以前没有碰到过的。这种特征在网络导航中尤为重要。在许多随机网络中都发现,有足够的边来构造一个巨大的分支,但只有极少数情况为全连通的。这种类树结构与图[friend]中的密集的朋友关系形成了鲜明的对比,后者中回路更多而且节点之间的距离更短。
图3也是来源于增加健康数据集,涵盖了一群高中生。节点用种族区分,而且他们之间的关系仅仅是朋友关系而不是恋人关系。该网络比恋爱网络更为稠密。
图3:美国高中生的交友网络
图3中呈现的一个重要特征是Lazarsfeld and Merton [425]所提出的一个术语——同质性(homophily),即物以类聚的倾向。而且这种倾向性比我们从人口组成中所预期的更高。在该学校,52%的学生都为白人,且其中85%的朋友均为白人。类似的,38%的学生为黑人,且其中85%的朋友也为黑人。西班牙裔在学校中融合的更好,只占5%的人口而其中只有2%的朋友也是西班牙裔。如果种族并不应该决定友谊的因素,那么白人的朋友中应该有约52%的也是白人,而不是85%。这种倾向被称作“血缘同质性”,而且又很想的连续性。正如该图所指出的,学生们多多少少被种族所分隔,因而影响了网络中信息、学习的传播范围和速度——下文中将进一步探讨各种模式。
---------------------------
目前毕业论文已经发布的部分:
- 第一章:[cref %e7%bb%8f%e6%b5%8e%e5%ad%a6%e5%ae%b6%e4%bb%ac%e7%9a%84%e7%a4%be%e4%bc%9a%e7%bd%91%e7%bb%9c%ef%bc%88%e5%ad%a6%e6%9c%af%e5%9c%88%ef%bc%89]
- 致谢词:[cref %e6%af%95%e4%b8%9a%e8%ae%ba%e6%96%87%e8%87%b4%e8%b0%a2%e8%af%8d]
- 附录-译文:[cref %e4%b8%a4%e5%88%99%e5%85%b3%e4%ba%8e%e7%a4%be%e4%bc%9a%e7%bd%91%e7%bb%9c%e7%9a%84%e5%b0%8f%e6%95%85%e4%ba%8b%ef%bc%9a%e7%be%8e%e7%ac%ac%e5%a5%87%e5%ae%b6%e6%97%8f%e6%88%90%e9%95%bf%e5%8f%b2%e5%92%8c]
其他的就剩正文没贴出来了,因为现在还在改……接到通知优秀毕业论文要缩成5000字以内,痛苦啊痛苦……原来以为自己也就写了10,000多字,一删才知道至少也得20,000字,从39页华丽丽的缩减到7页……其实更郁闷的是,要从latex转到word,为啥每次我用latex排出来的论文总有种种原因要重排 -_-||