人类网络:社会位置决定命运.pdf
http://www.100md.com
2020年2月14日
![]() |
| 第1页 |
![]() |
| 第17页 |
![]() |
| 第27页 |
![]() |
| 第41页 |
![]() |
| 第153页 |
参见附件(27641KB,403页)。
人类网络:社会位置决定命运,人类活在世界上,社交是必须的一件事,那么社交网络如何选择自己合适的,怎么能够认识到社交力好的人群,这本书来告诉你。

人类网络内容提要
一本全新、重磅而有趣的之作,讲述社会网络的特点和人们在其中的位置如何塑造我们的观念和行为,并影响我们的人生。
人类网络的结构和位置,决定着每个人在交友、择校、就业、理财、养育子女、休闲娱乐等所有方面的选择,决定着人们的圈子和“三观”,决定着哪些人更有权势和影响力、更容易成功。没有人能逃脱生活编织的大网。
人类网络还与许多重大社会问题密不可分:传染病、不平等、社会固化、金融危机、贸易摩擦、战争与和平……对这些顽固的“社会癌症”,网络思维或许能帮我们找到根治之策。
马修?杰克逊对人类网络的观察与分析,结合了心理学、社会学、历史学、生物学、计算机科学、行为经济学等多个学科的成果,通过精彩纷呈的案例、逻辑、游戏与图示,给我们讲述人类社会网络的精彩故事。
人类网络作者信息
马修·杰克逊(Matthew O. Jackson)
斯坦福大学经济学William Eberle讲席教授,美国科学院院士,研究经济与社会网络的领军人物,从事该领域研究二十余年。他的在线课程“经济与社会网络”和“博弈论”听众人数超过100万。曾出版《经济与社会网络》等著作。
人类网络主目录
第1章 引言:网络与人类行为
第2章 权势和影响力:网络中的核心位置
第3章 扩散和传染
第4章 密而不能倒:金融网络
第5章 同质性:人以群分
第6章 社会国化与不平等:网络反馈和贫困陷阱
第7章 集体的智慧及愚蠢
第8章 我们的朋友与局部网络结构的影响
第9章 全球化:变化中的人类网络
人类网络:社会位置决定命运截图


人类网络:社会位置决定命运
[美]马修·杰克逊 著
余江 译
中信出版集团目录
引言
第1章 引言:网络与人类行为
更多的事情在改变
亿万人构成的网络
第2章 权势和影响力:网络中的核心位置
人气度:中心度
对比
关键是你认识谁——大海捞针
小额信贷的扩散
传播中心度
美第奇家族的崛起:人际网络的早期案例
“教父效应”:中心度带来中心度
网络中的影响力和权势的分类
第3章 扩散和传染
传染与网络结构
相变与基本再生数
外部效应与疫苗接种
连通却稀疏的联系
我们不断缩小的世界
中心度与传染:人气度的不利一面人类网络的变动与传导性
收集思想
第4章 密而不能倒:金融网络
对一场全球金融危机的解剖
金融传染的特殊之处何在?
自由市场与外部效应
监管
爆米花还是多米诺?
告别没有驾驶仪的飞机
第5章 同质性:人以群分
种姓制度
同质性
位置,位置,位置
谢林的洞见
导致同质性的更多理由
同质性的某些启示
同质性在我们的日常生活中
第6章 社会固化与不平等:网络反馈和贫困陷阱
社会固化
固化,不平等,“了不起的盖茨比曲线”
不平等
教育
通常的嫌疑人:机构和资本
工作网络与社会资本反馈与行为模式的持续差异:社会中的拔河现象
摆脱:网络分隔、社会固化与不平等现象
第7章 集体的智慧及愚蠢
集体的智慧
改变中的新闻版图
极端化:同质性的后果
人类面临的挑战
第8章 我们的朋友与局部网络结构的影响
蚂蚁与旅鼠
羊群效应、银行挤兑与集体迷失
博弈论与互补性
聚集现象与复杂传染和扩散
信任与加持
关系
社会嵌入性
要了解自己,得看清朋友
第9章 全球化:变化中的人类网络
网络的形成
贸易网络:要贸易,不要开战
连线:同质性与极端化的加剧
破坏性
更多的变化
参考文献致谢
版权页引言
献给萨莉和哈尔第1章 引言:网络与人类行为
导读
◎移动互联与社交媒体让我们的世界小到“尽在掌握”,但在技术
革命背后,传播消息和情绪的最终还是人与人构成的网络。
◎一沙一世界,一个小学班级的家长群可能构建的朋友关系网络,其数量竟然远超过宇宙中的原子总数。
◎与随机网络不同,人类网络有着极其普遍却令人吃惊的各种特
征。除身边的亲朋好友,整个社会和经济往来都属于“人类网络”,归
根到底是人与人的交往。
◎你的网络,就是你的命运。更多的事情在改变
在1492年左右开始的全球化1.0阶段,世界从大尺度走向中等尺
度。在给我们带来跨国公司的全球化2.0阶段,世界从中等尺度走向小
尺度。到2000年左右的全球化3.0阶段,世界从小尺度走向微型化。
——托马斯·弗里德曼(《世界是平的》作者),接受《连线》杂
志采访
2010年12月17日,26岁的街头小贩穆罕默德·布瓦吉吉在突尼斯中
部一座尘土飞扬的小城西迪布济德自焚。他以这一行动,向二十多年统
治期间反复镇压各种反对派的极权政府表达绝望和愤怒。布瓦吉吉的家
人长期以来直言不讳地批评政府,他因此频繁遭受当地警察的骚扰。当
天早上,警察又公开羞辱他,并没收了他的货品,这成为压垮他的最后
一根稻草。布瓦吉吉往自己身上倒满汽油,纵火自焚以示抗议。
如果是几十年前,这一故事的结局也就是爆发数千人参与的抗议。
西迪布济德以外的人甚至很少会知道那里发生了什么事件。然而这次,布瓦吉吉自我牺牲后引发的各种视频却不可阻挡地通过社交媒体快速传
播,并被广泛报道。事发几周前,维基解密网站曾曝光有关的机密文
件,突尼斯和其他国家进行镇压的消息已在网上疯传。随后爆发的“阿
拉伯之春”运动也正是依靠脸书和推特等社交媒体与移动电话,才得以
发动并组织起来。
[1]
尽管这些通信手段是现代的,但传播消息和愤怒情绪的最终还是人
类网络。新的特点在于消息传播的广泛和迅速,以及人们可以联合做出
响应。要理解究竟发生了什么,我们仍需弄清楚消息如何在人们之间传
递,还有人们的行为如何相互影响。由此爆发的浩大而激烈的抗议行动让突尼斯政府在2011年1月中旬
倒台。动荡波及邻近的阿尔及利亚,并在接下来的两个月里蔓延到阿
曼、埃及、也门、巴林、科威特、利比亚、摩洛哥、叙利亚,甚至沙
特、卡塔尔和阿联酋。“阿拉伯之春”运动的成败有待讨论,但抗议运动
在这片地区如此快速蔓延非但在历史上没有先例,而且凸显了人类网络
在我们生活中的重要地位。
正如上文引述的托马斯·弗里德曼的访谈,随着人类的通信手段在
近来发生的巨大变革,这个世界比以前缩小了很多个数量级:传统纸
媒、信件邮递、海外旅行、火车、电报、电话、收音机、飞机、电视、传真机……互联网技术与社交媒体不过是关于人类在何种距离、以何种
速度、与何人交流的漫长进化史的最新篇章。
虽然人类之间的交流网络正在改变,但其中的许多部分却是持久并
可预测的。理解人类网络及其变化过程,可以帮助我们回答有关当今世
界的很多问题,例如一个人在网络中的位置如何决定他的影响力和权
势?根据来自朋友的信息形成自己的观点,会让我们陷入哪些系统性的
错误?金融市场的传染现象是如何形成的,为什么不同于流感的蔓延?
我们社会网络的割裂如何导致了不平等、社会固化与两极分化?全球化
正在如何改变国际冲突和战争?
尽管人类网络在回答上述问题时起着关键作用,但人们在分析重要
的政治和经济行为与趋势时,却往往将其忽视。这不代表我们没有研究
过人类网络,而是我们对网络作为人类行为的驱动力的科学知识同大众
和决策者的认知之间存在缺口。本书的目标正是要缩小这一缺口。
本书的每一章都将展示人类网络如何改变我们对问题的思考,全书
的主题是网络如何促进我们对各种社会和经济行为的理解。
有几种关键的人际关系特征在发挥重要作用,因此本书讲述的内容
不只是强调一种理念。读完全书后,你会更充分地认识到自己所处的网络在多个方面的重要性。我们的讨论还将出自两种不同视角:一种是关
于网络如何形成,以及为什么展现出某些关键的特征;另一种则是关于
这些特征如何决定我们的权势、观点、机遇、行为和成就。
[1] 有关社交媒体与通信联络在卷入“阿拉伯之春”运动的各国中的作用,可参阅Brummitt、Barnett and D'Souza(2015)。亿万人构成的网络
生活其实很简单,但我们非要让它复杂化。
——无名氏 [1]
卡尔·萨根(美国天文学家和科幻作家)在他关于宇宙的名著中谈
到,我们的宇宙中存在亿万颗恒星。据估计,目前宇宙中可观测到的恒
星数量达到了300×10007 ,即300000000000000000000000颗。这个数字
听起来匪夷所思。像我一样,你或许也会因此感到自身的渺小卑微,对
大自然充满敬畏。
然而神奇之处在于,比起一个小小的社群——如一间教室、一家俱
乐部、一个团队,或一家小公司的员工——之中可能存在的各种朋友关
系网络的数量,以上数字却微不足道。不可能吧?你会质疑,怎能得出
这样的结论?
我们假设有个30人构成的社群,例如学校里某个班级的家长。从中
选出任何一位来,比如莎拉。我们设想,她在这个社群里经常交谈的人
或者可以求助的人,都视为她的朋友,那么,莎拉有可能与其他29人结
为朋友。再看第二个人,比如马克,除去同莎拉的朋友关系外,他还可
以与其他28人结为朋友。照此推算下去,在这个小社群中可以结为朋友
的两两组合的数量为:29+28+27+…+1=435。朋友关系看起来并不太
多,却可能由此构筑起数量极其庞大的人际关系网络。
假如这个社群完全无法交流,没有人成为其他任何人的朋友,我们
将会得到一个“空”网络,不存在任何朋友关系,所有435个可能的朋友
关系都没有实现。假如这个社群非常和睦,我们则会看到另一个极端,一个“全”网络,每个人都是其他任何人的朋友。在以上两种极端情形之
间有大量的网络类型。或许第一组配对的人彼此是朋友,第二组不是,第三组和第四组是朋友,第五组和第六组不是,等等。为计算出所有可
能的朋友网络的数量,我们可以把每一组潜在的朋友关系标记
为“是”或“否”,即存在两种可能性。因此,可能的朋友网络的数量将等
于:2×2×…×2,共计435个项的乘积。435次翻番的结果大致等于1后面
加上131个零,而之前提到的恒星总数只有23个零。
[2]
因此,该社群中
可能出现的朋友网络的数量将是宇宙中恒星数量的许多倍,事实上,它
比我们估计的宇宙中所有原子的数量还要多出很多数量级!
[3]
即使在30人的范围内,也已经难以用任何系统性的方法来标记如此
众多的网络。在动物分类中,当人们提到“斑马”、“熊猫”、“鳄鱼”或
者“蚊子”时,我们很清楚他们指的是什么。然而除了少数特殊类型以
外,我们并不能用这类办法来描述人类网络。当然这不是说我们对其束
手无策,而是强调理解社会的构成是非常复杂的任务。
对动物的分类和识别,我们可以借助某些特征:是否有脊椎?有多
少条腿?是草食性、肉食性还是杂食性?是否胎生?成年后体型多大?
皮肤属于何种类型?能否飞行?是否在水中生活?……在对人类网络分
类时,我们也可以识别出某些关键特征。例如,我们可以通过现有的关
系区分网络,这些关系是较为均衡地分布在人群中,还是能看出某些隔
离模式。另外,此类特征将帮助我们理解若干重要议题,如经济不平
等、社会阶层固化、政治极端化,乃至金融传染现象等。
借助人类网络的研究来理解人类的行为是可行的,有如下几方面的
理由。首先,人类网络的几个主要特征对于人的行动原因有深刻的解释
力。其次,这些特征是简单、符合直觉、可以量化的。再次,人的行为
表现出的规律会导致带有某些特征的人类网络:很容易分辨是这些人形
成的有规律的网络,还是通过随机联系形成的、并不依赖周围的其他联
系或节点的网络。例如,我们可以看看图1.1所示的两类人类网络:图(a)是某所高
中的学生之间的亲密朋友关系网络(其细节将在本书第5章介绍);图
(b)是有着数量相同的节点和联系,却完全由计算机随机生成的网
络。
以上两个网络有哪些显著差异?只需仔细观察,你就能窥见一二。
其一是这所高中的不幸之处,有十来个学生没有亲密的朋友,而随机网
络中所有的节点都存在与其他节点的联系。其二更令人吃惊,却又是人
类网络的普遍特征:具有高度分隔性。网络上半部分的学生很少与网络
下半部分的学生结为朋友,而随机网络中的联系则无序地指向所有方
向。
在把这些高中学生的种族因素加入,形成图1.2后,网络的分隔特
征将变得更为明显,也更能说明问题。图1.1 人类网络与随机网络
这种分隔是人类网络的主要特征之一,对之后的论述有着重大影
响。下面将会看到,就我们为什么会形成有这种特征的网络,既有显见
的解释,也源自某些微妙的理由。归根到底,我们关注这些网络及其特
征是因为它们的影响,因此到本书结尾处读者会明白,为什么在高中的
人际网络中出现此类分隔会对上大学的决策产生深刻的影响,却跟流感
的传染基本没有关系。图1.2 带有种族标记的高中学生网络。带花格的节点是“黑人”(学生自己认同的身份),灰
色节点是“白人”,剩下的少数节点为“西班牙裔”(黑色节点)或者“其他未知”(白色节
点)。 [4]
对人类网络的科学研究除了对我们生活的方方面面有密切的重要意
义外,还是个引人入胜的领域,部分原因在于它跨越了多个学科:理解
人类网络需要依靠来自社会学、经济学、数学、物理学、计算机科学与
人类学等学科的核心概念和研究成果。
[5]
例如,我们的讨论将大量借
助经济学中的外部效应概念,即人们的行为会给周围的人带来影响,并
加上各种形式的反馈以放大这种效应。这些现象是许多复杂系统的共同
特征:设定的条件便于描述和理解,但系统的特征和行为却可以非常丰
富。
我们的讨论还将远远超越个人的亲朋熟人的关系网,甚至涉及国家
之间的条约和银行之间的合同等关系。但我们考察的整个社会和经济往
来最终都属于“人类网络”,因为它们都会在某个层面涉及人与人的交
往。
[6]
本书的出发点是,你在网络中的位置如何决定你的权势和影响力,因为这将对后续的几乎一切讨论都产生作用。我们将分析你可能发挥影
响力的多种不同渠道,并逐一观察它们如何依赖于你的人际网络。
[1] 这句话广为传播,并经常被当成孔子的名言,但并没有证据表明是出自他的著述。邢亦
青告诉我,中文里最接近此说法的是来自1060年写成的《新唐书》:“世上本无事,庸人自扰
之。”但无论这句话源自何处,它还是揭示了这里要阐述的主题:简单的事情如何轻易变得很复
杂。
[2] 数学表达式为2435 ,大致相当于10131 。
[3] 我们已知的宇宙(大致在900亿光年范围内)中的所有原子的数量大致为2275 。
[4] 本书第5章将详细介绍这一学生网络。数据来自Add健康研究项目(Add Health Study,针对青春期到成人健康的一个国家长期研究项目),由Kathleen Mullan Harris主持,J.Richard
Udry、Peter S.Bearman与Kathleen Mullan Harris设计(University of North Carolina at Chapel
Hill),由尤妮丝·肯尼迪·施莱弗国家儿童健康与人类发展研究所(Eunice KennedyShriver,National Institute of Child Health and Human Development)提供资助(P01HD31921),以及来自23家其他联邦机构和基金会的联合资助。特别感谢Ronald R.Rindfuss与Barbara Entwisle
对初始研究设计的支持。该项目的网站上有如何获取数据资料的信息
(http:www.cpc.unc.eduaddhealth)。本书的分析并未接受该项目资金(P01-HD31921)的直接
支持。
[5] 由于人际网络涉及的范围极广,有各种来自不同视角的背景材料可参考。教材包括:
Wasserman and Faust(1994,社会学,统计学);Watts(1999,复杂系统,社会学);
Diestel(2000,图论);Bollabás(2001,随机图论);Goyal(2007,经济学);Vega
Redondo(2007,复杂系统,经济学);Jackson(2008a,经济学,社会学,图论,复杂系
统);Easley and Kleinberg(2010,经济学,计算机科学,复杂系统);Barabási(2016,物理
学,复杂系统);Borgatti,Everett,Johnson(2016,物理学,数据收集,分析)。还有几本面向
大众介绍人类网络对我们生活的重要性的出色作品,如Barabási(2003),Watts(2004),Christakis and Fowler(2009),Ferguson(2018)。本书将对这一广泛领域中的某些概念做综合
与提炼,另外也会涉及没有在上述著作中出现的若干主题和应用,以及其他重要的经济和社会
发展趋势。在此过程中将发展和强调某些新的理念。在本书的撰写中,我不可避免地要大量依
赖自己的研究,但重点还是大家对人类网络的集体认识。
[6] 学者用以描述人类交流网络的一个共同术语是“社交网络”(social networks)。这个词汇
同时还有着更为普及的通俗含义,意指网络平台及其相关的各类社交媒体。其实人类天然属于
互相交流与协作的物种,社交网络从史前便已出现,其内涵远远超过现代交流平台。因此,笔
者对于这两个说法——人类网络与社交网络——不做区别。第2章 权势和影响力:网络中的核心位置
导读
◎今天是人气度的时代。名入网红的关注度直接左右着大众的观
点、情感与抉择。
◎社交中的“友谊悖论”,让最受欢迎的人出现在很多人的朋友圈
中。时尚业以之推动潮流走向,中学生也容易由此“沾染恶习”……
◎拥有人脉广泛的朋友比拥有为数众多的朋友更重要——关键是你
认识谁。朋友的朋友,朋友的朋友的朋友……如何通过特征向量中心度
测算你的全部网络影响力——这正是谷歌搜索成功的秘密。
◎美第奇家族在文艺复兴时期的崛起,缘于他们在家族婚姻与商业
网络中的绝好位置,有着独一无二的“中介中心度”。
◎伟人不是生而伟大,而是越活越伟大。中心度带来更多中心度,朋友的数量会像复利那样增长。
有时候,富有理想的人会被整个业界圈子反感,被视为讨好卖乖和
追求个人私利。可是,默默无闻的美德只有在天堂才会得到回报。要在
这个世界上取得成功,你必须让人们知道你。
——索尼娅·索托马约尔(Sonia Sotomayor,美国最高法院大法
官),《我挚爱的世界》(My Beloved World )1930年,圣雄甘地动员了数万人参与反抗英国统治的“食盐进
军”(Salt March)。这是一场长度超过200英里
[1]
的步行运动,从甘地
的基地到生产食盐的沿海城市丹迪,目的是抗议盐税。在当地的炎热气
候下,食盐是必需品,消费量很大。高额的盐税于是成为英国殖民者给
印度带来的苦难的特定象征。从更宽广的视角看,食盐进军发起的非暴
力不合作运动最终结束了英国的统治。
如果你发现英国对殖民地的税收在之前遇到过类似抗议,那并不稀
奇。甘地同样注意到,一个多世纪前的波士顿茶党曾反抗英国的税收。
他讲道:“美国依靠苦难、英勇战斗和牺牲赢得了独立,而印度应该依
靠苦难、牺牲和非暴力在上帝眷顾下实现自由。”据说食盐进军后在伦
敦同印度总督欧文爵士会面时,甘地被问及希望在茶水中加糖还是奶
油,他回答说不,他希望加点盐,“好让我们回想起著名的波士顿茶
党”。
[2]
食盐进军让我们瞥见了甘地后来将完成的壮举的冰山一角,他在
1930年4月非法生产食盐的行动鼓励了数百人追随非暴力不合作运动。
马丁·路德·金曾提及第一次读到甘地向大海进军时的感动。我们很容易
看出这如何启发了他在发动民权运动与组织游行时的做法。
有大量的案例表明,个人有能力直接或间接地激发千百万人的行
动。极大的影响范围是甘地和马丁·路德·金最终成功改变世界的关键。
很自然地,一个人的位势和影响力可以通过他发动或激励的人数来判
断,因为这反映了他的作用范围。
人类网络能帮助我们认清和测量这种作用范围。对作用范围的第一
个测量指标是简单地数一个人认识多少人,或者有多少朋友或同事。在
当今世界,我们可能还会询问,他在社交媒体上有多少关注者。我们将
看到,一个人有多少朋友或关注者,对决定一个群体的认知和社交习俗
有着微妙的影响。当然,有许多直接的朋友或熟人只是个人发挥影响力的一种方式,而本章的很大部分将用来探讨权势的其他人类网络根源。无论甘地还是
马丁·路德·金,对于他们动员起来的民众都只直接认识其中很小一部
分,也不可能都有个人接触。他们有着重要的同盟和朋友,并通过其行
动产生的宣传影响更多人。食盐进军就是从少数追随者起步,随着运动
的发展和宣传的扩大,才变得声势浩大。
一个人的朋友或熟人可以很少,但如果这些朋友或熟人自身举足轻
重,他也可能具有相当的影响力。此类间接作用的范围往往就是权势所
在,我们能通过人类网络的概念非常清楚地看到这种影响力。借助显赫
的友人来获取影响力是一种有迭代性、循环式的说法,但在人类网络的
环境下,这很容易理解,并且带有许多启示。对权势和影响力的迭代
的、基于网络的测量方法可以帮助我们弄清楚如何最好地启动扩散效
应,以及是什么让谷歌成为极具创新性的搜索引擎。
提到对权势的衡量,这不是我们要讲的故事的结尾。人们还可以用
另一种方式变得更加重要——在网络中显得尤其突出——即成为关键的
连接点或者说协调人。某人可以成为相互不直接认识的人们之中的桥梁
或中介,使他处于协调其他人行动的独特位置,从而获取居间好处,强
化其权势。这类权势既反映在《教父》那样的故事中,也可以用于解释
美第奇家族通过人际网络在中世纪的佛罗伦萨的崛起。
在之后探讨金融传染、不平等和极端化等现象时,理解人际网络如
何赋予权势和影响力将非常有帮助。我们先从直接影响力入手。
[1] 英制单位。1英里约等于1.609公里。
[2] 参阅Adrija Roychowdhury,“How Mahatma Gandhi Drew Inspiration from the American
Independence Struggle,”The Indian Express ,2016年7月4日。人气度:中心度
迈克尔·乔丹没有像甘地那样动员民众参与游行,却激励了大家购
买球鞋。他对数量庞大的民众的影响力无与伦比。仅仅是在运动生涯阶
段,乔丹就从希望他帮忙推销产品的各家公司收获了5亿美元以上的报
酬,这绝非偶然。
[1]
而他从打篮球中获取的薪水才刚超过9000万美
元。从上述两个数字来看,乔丹在当时的市场营销价值远远高于他作为
运动员和娱乐明星的直接价值(今天依然如此)。这种令人难以置信的
受关注度使他可以直接影响全球千百万人的决策。
[2]
在网络术语中,某个人在特定网络中有多少联系或者链接(关系)
被称为此人的“度”(degree)。与之相关的反映某个人在网络中处于何
种中心程度的指标被称为“中心度”(degree centrality)。如果某人有200
个朋友,另一个人有100个朋友,则根据中心度指标,前者的中心位置
是后者的两倍。这一指标是符合直觉的,也是衡量影响力的显而易见的
第一种方法。
[3]
并不是只有在甘地、马丁·路德·金或乔丹那样的层次上,人们所能
影响的人数多寡才具有意义。你也经常受到自己的朋友和熟人的影响。
不过在无论规模多小的任何社群中,有着最高的度的人总是拥有超出比
例的存在感和影响力。
这里说的超出比例的存在感代表一种名为“友谊悖论”(friendship
paradox)的重要现象,由社会学家斯科特·菲尔德在1991年提出。
[4]
你是否有过这样的印象:其他人的朋友比你多得多?如果是的话,你不必感到孤独。我们的朋友平均拥有的朋友人数超出社群中的一般水
平,这正是所谓的友谊谬论。图2.1展示的是詹姆斯·科尔曼的一项经典研究介绍的某所高中的朋
友网络中的友谊悖论。
[5]
图中有14个女生,对其中9个而言,她们的朋
友平均拥有的朋友人数超过她们自己,另外2个的朋友人数与她们的朋
友的朋友人数相同,只有3个女生的朋友人数超过她们的朋友的朋友人
数。
[6]
图2.1 友谊悖论。数据来自科尔曼在1961年对高中学生朋友网络的研究。每个节点(圆圈)代
表一位女生,每条连线代表两位女生之间存在朋友关系。友谊悖论在于,大多数女生比自己的
朋友的交际更少。每位女生的圆圈中的前一个数字代表她有几个朋友,后一个数字代表她的朋
友平均有几个朋友。例如,左下角的女生有2个朋友,而那两个女生分别有2个和5个朋友,因此
平均数为3.5。这个圆圈里的两个数字2和3.5表明,该女生的朋友数少于自己朋友的平均朋友
数。在全部14位女生中有9位属于这种情况,有3位的朋友数多于自己朋友的平均值,有2位与自
己朋友的平均数相同。
友谊悖论不难理解。最受人喜欢的人会出现在很多人的友人名单
中,而朋友极少的人只会现身于少数人的名单。相对于在人群中的占
比,有众多朋友的人在大家的友人名单中会被过度代表,而朋友少的人则会代表不足。比起只有5个朋友的人,有10个朋友的人被计算为朋友
的次数是前者的两倍。
从数学角度看,这一悖论并不奇怪——大多数悖论同样如此。然而
该现象对我们的几乎所有交往都有着重要意义。任何做过家长(或学
童)的人都不会对下面的说法感到陌生,如“学校里其他所有人都
有”,“学校里其他所有人都能够……”。尽管这类陈述往往是错误的,却总是反映着我们的感知。最受欢迎的学生可能在孩子们的朋友中被过
度代表了,如果这些学生都在追随某种时尚潮流,孩子们就会认为所有
人都是如此。人气高的人在决定感知和行为标准方面发挥了超出比例的
作用。
为了最直观地看清友谊悖论的含义,我们先思考一个简单的例子,然后再分析它背后的有关数据。
我们来看一个班级的学生如何受朋友的影响。
[7]
从内心来说,这
些学生都是比较从众的性格。他们面临一个简单的选择:是穿纯色的衣
服,还是格子花纹的衣服?每个人对此有各自的偏好,在开学头一天,他们都根据自己的偏好选择服装,其结果如图2.2所示。
作为喜欢循规蹈矩的人,学生希望追随大多数人做事,只有在选择
每种风格的人数都相同时,他们才听从自身的偏好。如图2.2所示,有4
个学生喜欢纯色衣服,8个学生喜欢格子衣服。这样,由于三分之二的
学生喜欢格子衣服,而如果大家都能看到整个群体的喜好,到第二天上
学时,所有人都会穿上格子花纹的衣服。然而请注意,头一天选择纯色
衣服的是最受欢迎的4个学生,或许也是群体中最引人注目的一批学
生。图2.2 开学头一天,最受欢迎的4个学生选择纯色衣服,其余8个学生选择格子衣服。
学生看不见所有人的情况——他们主要是和有连线的朋友交流。
图2.3的(a)到(d)显示了之后每天发生的情况。最受欢迎的这批
学生看到了彼此的着装以及其他某些人的着装,其中大多数都是纯色衣
服,因此他们将继续穿纯色衣服。其他部分学生主要看到的是最受欢迎
的这批学生,他们将换成穿纯色衣服。我们从图2.3的(a)中看到,最
受欢迎的学生在第二天继续穿纯色衣服,另有4名学生加入他们,总共
有8名学生变成穿纯色衣服。从这里开始问题很快得到了解决,从图2.3
的(b)到(d),每天都有更多穿格子衣服的学生看到大多数朋友穿纯
色衣服,于是改变自己的风格。到第五天时,班上的每个学生都穿上了
纯色衣服,而事实上在开学时他们大多数更喜欢格子风格。
我们可以通过图2.4分析友谊悖论在这一服装风格流行变化中的作
用,该图根据学生在开学第一天看到的朋友的风格,显示他们如何错误
地感知了整个群体的偏好。虽然三分之二的人偏好格子衣服,但由于最受欢迎的学生在大家的朋友关系中被过度代表,最终使三分之二的学生
以为选择纯色衣服的人是大多数。图2.3 学生观察周围的情况,以迎合大多数朋友的选择。最受欢迎的4名学生彼此都是朋友
(形成小派系),都保留纯色服装。在全体学生的感知中,这批学生被重复计算了,引发了连
续改变着装的进程。图2.4 友谊悖论发挥作用。每名学生边上的分数代表他们对于纯色格子衣服流行度的感知,来自每个人看到的朋友的选择。大多数人都错误地以为纯色衣服是主流选择,只有右下方的少
数几个一开始感觉格子衣服占主导。而这些学生很快也会看到大多数朋友换上了纯色衣服。
这个例子的构造中有两方面的特点或许会让你留意。其一是最受欢
迎的学生有着同样的偏好,都喜欢纯色衣服,因而促使整个群体快速向
这批学生喜欢的风格统一。这个现象很重要,最受欢迎的学生为什么彼
此相似是有原因的,下文很快将展开讨论。其二是这批受欢迎的学生组
成了一个小圈子,彼此都是朋友,从而强化了他们的行为,维持了他们
对纯色衣服的选择,并最终让群体中的其他人接受。上述两个条件让我
们的案例变得更简洁明了,但即使没有这些,最受欢迎的人依然具有超
出比例的影响力。事实上,时尚设计师早就看清了让名人穿上他们的各
种新款设计走上奥斯卡奖红毯的重要性。
人气度与友谊悖论的作用在同辈间的影响或许是最纯粹的,比如学
生对于彼此的感知。有大量研究发现,学生容易高估他们中间吸烟、喝酒、滥用药物的人的比例以及频率,而且往往高出相当多。例如,有项
覆盖100所美国大学的大型研究发现,学生对11种不同物品的消费量有
系统性高估,包括香烟、酒类和大麻等。
[8]
具体而言,有项对酒类消
费的深入研究对比了学生自己报告的饮酒行为——上次参加聚会或交际
时喝了多少——与他们对该学校的一般学生上次参加聚会或交际时喝了
多少的感知。在该研究包含的130所大学的72000多名学生的信息之中,居于中位数的学生报告说自己喝了4杯酒——这真令人吃惊,尤其是四
分之一的学生说喝了5杯或者更多。然而更令人惊讶的是,尽管上面的
数字已经够高,仍有超过70%的学生在估计自己学校的一般学生的饮酒
量时高估了1杯甚至更多。
[9]
要解释这种错误感知,我们并不需要去深入探究学生的心理,友谊
悖论就能给出轻松解释。当学生参加欢聚或社交场合时,他们的交往更
多会集中在那些经常参与交际的人身上,因此他们对酒类消费的感知会
过分反映参加了很多聚会的人。这形成了另一种模式的友谊悖论:学生
在聚会中见到的人通常比一般的学生参加的聚会更多。学生的感知不但
受自己在聚会和其他社交场合的经历的影响,还取决于他们知道的自己
的亲密朋友的情况。友谊悖论在这里同样会产生作用。如果人气较高的
学生抽烟喝酒比较多,同样会扭曲学生的估计。而事实上确实有项研究
估算出,中学生的朋友人数每增加一个,他抽烟的概率就会提高5个百
分点。
[10]
在饮酒上面也有类似的结论,中学生的朋友增加5个,他喝
过酒的概率会提高30个百分点。
[11]
参与社交最活跃的学生更容易抽烟喝酒,有几方面的因素推动。原
因之一是对青少年来说,这些消费是一种社交活动。花更多时间跟其他
人交往的人,因此有更多喝酒的理由。也存在一种反向效应:有较高饮
酒倾向的学生喜欢找合适的机会去尝试以及与其他人分享。
[12]
最主要
的一个因素是,父母监督较少的学生有更多时间跟其他学生出去混,也
有更多机会尝试酒精、香烟和毒品。最后是社交行为本身具有的反馈性质,看到同伴喝酒会激励自己喝酒,由此让同伴的饮酒量增加,然后继
续在反馈回路中形成循环。
[13]
所以,考虑到学生对伙伴的行为的估计至少有部分(即使不是大部
分)是根据自身的观察,友谊悖论的影响,再加上大多数社交活跃的学
生经常有极端行为这一现实,自然会让学生系统性地高估伙伴的行为模
式。更普遍地看,由于许多行为会受到大家感知的习俗的影响,最终的
行为将受到参与社交活动最多的人的超出比例的推动,就此形成的习俗
也比不依赖人际网络时的感知更为极端。
友谊悖论会被社交媒体放大,那里产生的影响幅度可能非常惊人。
例如,有项关于推特的研究发现,[14]
超过98%的用户的关注者少于他
们关注的对象,通常来说,一位用户的“朋友”(friends)的关注者人数
是他的10倍以上。那些人气更高的用户更为活跃,尽管其数量较少,但
却在内容传播上扮演着关键角色。鉴于社交媒体的应用增加,尤其是在
青少年中,人群的感知被极少数最受欢迎的用户扭曲的可能性变得非常
大,特别是考虑到人气最高的社交媒体用户可能有相当特立独行的行为
时,就像我们看到的学生的人气度与较早和较多地抽烟喝酒之间存在关
联那样。参与聚会本身是一种社交行为,如果有喝酒吸毒等照片或故事
分享出来,可以进一步放大社交媒体的影响。相反,埋头读书那样的行
为往往是独自完成的,有关的信息也更少用于分享。因此青少年高估自
己伙伴消费的药物和酒精,而低估他们用于学习的时间,是很自然的结
果。
无论我们是否有所意识,与友谊悖论相伴的偏向性远远超出“友
谊”的范围。友谊偏差只是“选择性偏差”(selection bias)的情形之一,其含义是,我们的观察往往来自有偏向性的样本,取决于这些样本如何
选取。我们会过多地乘坐最满员的航班,在最火爆的餐厅吃饭,在最拥
挤的路段和时段开车,在人流最大的时候去公园和景点,参加最喧嚣的
音乐会,看最热门的电影,等等。这些经历扭曲了我们自己的感知以及我们对社会习俗的认识,而且其效应经常没有被我们意识到。正如肖恩
·弗里德里克(2012)在一项有关我们过高估计别人的付费意愿的研究
中所述:“比起那些躲在办公室里、不愿花4美元买咖啡的人来说,在星
巴克排队的顾客要显眼得多。”
[15]
[1] 仅耐克公司在当时就给他支付了4.8亿美元。
[2] 这里忽略了关系一个人为什么能影响以及动员那么多其他人的个性和其他因素。除在人
类网络中的位置外,还有许多特征可能使某人成为重要的意见领袖——这一课题在Katz and
Lazarsfeld(1955)的开创性成果后已得到广泛研究。可参阅:Rogers(1995),Valente and
Pumpuang(2007),Valente(2012)及其详细的参考文献,以及Gladwell(2000)。
[3] 尽管本章及之后各章并未强调,但应该明确指出,我们考察的联系和网络的类型会根据
环境发生变化。例如,一位政治家制定法律的能力取决于同其他议员的联系,而他动员选民的
能力则取决于同媒体、党派和职员的联系(及这些人的人际联系)。由于在人际网络中有联系
的两个人并不总是真正的“朋友”关系,在网络研究用语中经常称之为“邻居”,但本书中不做区
分。关于不同人际网络的区别和相互作用,可参阅Ferguson(2018)。
[4] 参阅Feld(1991)。
[5] 参阅Coleman(1961)。
[6] 该案例中的人际网络有两个(内部相连的)部分。没有在本书中展示的更大的网络部分
表现出了类似的现象:在146个女生的朋友关系网络中,80人拥有的朋友人数少于自己的朋友平
均拥有的朋友人数,25人的朋友人数与自己的朋友的朋友人数相同,41人的朋友人数超过其朋
友的朋友人数。
[7] 对人们的观点的估计出现偏差的类似案例,可参阅Lerman、Yan and Wu(2015)。我们
还可以从知名博客上看到类似现象(如Kevin Schaul2015年10月9日发表在Washington Post 上的
博客,“A Quick Puzzle to Tell Whether You Know What People Are Thinking”),以及参考有关的
实验结果(Kearns、Judd、Tan and Wortman,2009)。
[8] 参阅Perkins、Meilman、Leichliter、Cashin and Presley(1999)。
[9] 参阅Perkins、Haines and Rice(2005)的表2。
[10] 参阅Valente、Unger and Johnson(2005)。
[11] 参阅Tucker et al.(2013)。关于人气度与其他特征或行为存在相关的其他案例,参阅
Eom and Jo(2014)。
[12] 有关这两种效应的更广泛讨论,可参阅Jackson(2016)。
[13] 通过仔细观察,我们可以估计反馈效应的大小:某个人的行为在多大程度上因为发生
的社会环境的不同而出现差异。对若干受社会影响的行为来说,这类效应大于2(参阅Glaeser、Sacerdote and Scheinkman,2003)。本书第8章还将讨论此类效应对一系列行为的影响,从犯罪和
逃税,到坚持上学和寻找工作。
[14] 参阅Hodas、Kooti and Lerman(2013)。
[15] 参阅Frederick(2012)。对比
你只要反复拷问数据,大自然总会坦白。
——罗纳德·科斯,《经济学家该如何选择?》 [1]
我希望被视为在所有方面都表现最好的人,而不只是得分。
——迈克尔·乔丹,2003年NBA(美国职业篮球联赛)全明星赛
谁是历史上最伟大的篮球运动员,维尔特·张伯伦还是迈克尔·乔
丹?你或许会考虑勒布朗·詹姆斯。作为在芝加哥长大的人,我有自己
的答案。但列入比较的对象其实是在比赛中有着截然不同的风格与作用
的伟大运动员。
有太多不同的统计数字可用来总结他们的职业生涯。例如,乔丹和
张伯伦在几个方面有着惊人的相似:整个职业生涯的常规赛平均得分都
是30.1分;常规赛总得分都超过3万分,乔丹为32292分,张伯伦为
31419分;都多次获得最有价值球员奖项,乔丹为5次,张伯伦为4次。
可是也有些指标他们差异较大:乔丹带队夺得过6次NBA总冠军,张伯
伦仅有2次;张伯伦的场均篮板数则达到惊人的22.9个,远超过乔丹的
6.2个。
在其他某些维度上,别的球员则更胜一筹。斯蒂芬·库里的三分球
总命中数远远超过前人。卡里姆·贾巴尔维持顶尖水平的时间跨度无与
伦比,他打了20个赛季,总得分超过4万分,参加了19次全明星赛,之
前还以史无前例的方式征服过大学篮球赛场。詹姆斯的全面统治力则从
他作为高中二年级学生登上《体育画报》杂志封面就广为人知。但如果
真要衡量运动员的全方位贡献,我们得考虑“三双”的指标——得到至少10分、10个篮板、10次助攻,三项统计数据都达到两位数。这必须让人
回忆起奥斯卡·罗伯特森,他曾经在整个赛季实现了场均三双——该成
就只是在最近才被拉塞尔·威斯特布鲁克赶上——而且完成三双的比赛
次数令其他所有人望尘莫及,哪怕是“魔术师”约翰逊。
这里的要点不在于真要展开一场有关篮球技艺的“熊队还是牛队”的
争论,[2]
而是想强调如下几点:统计数字是用简洁的方式反映有用的
信息;不同的统计数字概括了不同的内容;即使有大量的统计指标也可
能难以反映它们所描述事物的所有细微之处。
如果对事物的测量总是能归结为一个单纯的统计指标,我们的生活
就会变得简单很多。可是让我们的人生如此有趣的部分原因正在于,对
于许多最重要的事情来说,实现这种单一维度的排名经常是不可能的:
各种排名最终会变得充满争议又令人着迷。人们该如何比较海顿、施特
劳斯和斯特拉文斯基的音乐创新呢?该如何比较埃莉诺·罗斯福、哈里
特·斯托与哈里特·塔布曼在人权领域的贡献?梅西和马拉多纳谁才是更
出色的足球运动员?我们能够对毕加索和达·芬奇的艺术评判高低吗?
还是说把毕加索与亨利·马蒂斯的作品做比较要容易些,不仅因为他们
是同时代的画家,而且是竞争对手?许多人或许会说,这种比较是无法
实现且毫无意义的。然而,它能迫使我们去认真思考对于上述人物所做
贡献的不同反映维度,以及为什么他们的贡献具有革命意义。
[3]
当我
们看到不同的篮球统计数据时,眼前会浮现不同的球员,每一位都有自
己的绝活。类似的是,当我们观察反映人们网络位置特征的不同统计数
据时,也会有不同的人浮现,成为最“中心”的人物。有些人在某些指标
下居于非常中心的位置,在其他指标下则不然。而哪些网络统计指标最
适用则取决于不同场合,好比你要给自己的篮球队引入一位顶级得分者
还是一位顶级防守者,也得根据情况而定。
我们已经看到,测量中心程度的一个指标——中心度——能帮助解
释为什么网络里中心度最高的人有超出比例的影响力。这是第一种“网络效应”。作为最基本和最浅显的反映网络中心位置的指标,中心度类
似于篮球比赛中的场均得分。然而,如果继续这个类比,不同的人可能
有不同的长处体现在网络中的位置上,因此根据我们提问题的方式,到
底谁是最核心的人可能会有所变化。正如张伯伦是统治级别的篮板好
手,乔丹能带队夺冠,而库里以全新的方式突破了防守一样,如果只根
据中心度来比较人际网络中的不同节点(人),可能完全错过权势和影
响力的某些最关键的方面。接下来让我们看看一些其他的概念。
[1] 这一引言有不同版本出自不同人物。例如,一个接近的说法是“如果足够长时间地拷问
数据,它会坦白一切”,源于Darrell Huff在1954年的著作《如何用统计数字撒谎》(How to Lie
with Statistics )。不管Huff有没有说过,那本书里其实没有这句话。不过该书的内容确实证明
了以上说法的真实性与重要性。对这里的论述而言,关键在于很多事情都具有多面性,从不同
角度看会有极大的不同。
[2] 这个典故来自喜剧节目《周六夜现场》(Saturday Night Live )中的若干小252品,其中
有典型的芝加哥体育迷在争论对不同项目的当地体育明星的崇拜。
[3] 有关这类比较的意义,我们可以看到马蒂斯的《蓝色的裸体(关于比斯克拉的回忆)》
[Blue Nude (Memory ofBiskra )]给毕加索带来了触动,并影响了他的作品《亚维农的少
女》。塞巴斯蒂安·斯密(Sebastian Smee)的《竞争的艺术》(The Art ofthe Rivalry )深入描述
了他们之间的竞争与艺术上的相互影响。关键是你认识谁——大海捞针
建立关系网是废话,交朋友才是正事儿。
——史蒂夫·温武德(Steve Winwood),英国音乐人
如果不是谢尔盖·布林在1995年偶然受命带拉里·佩奇参观斯坦福大
学校园——当时佩奇正在考虑到斯坦福读博士——谷歌公司或许就不会
存在。布林一家是在20世纪70年代后期从俄罗斯移民到美国,对数学和
编程长期着迷的他已经在斯坦福学习计算机。佩奇同样对计算机着迷,并一同回忆起了“爱读图书杂志,在家里把东西拆掉、搞清楚如何运
转”的童年。尽管这两人的强烈个性时有冲突,但布林与佩奇的共同爱
好和智慧却让他们结为挚友。对我们而言最重要的是,他们都对万维网
的构造有着日益浓厚的好奇心。
到1996年,布林和佩奇共同着手为网络设计搜索引擎。刚开始他们
在佩奇的宿舍放置一部用他们所能找到的部件拼凑出来的计算机,布林
的房间则作为开发创意和程序的办公室。在他们作为学生联合撰写的一
篇论文中,布林和佩奇描述了互联网将在20世纪90年代后期如何快速扩
张,搜索引擎将因此如何难以胜任。最早的搜索引擎之一,1994年
的“万维网虫”仅索引了超过10万个网页。到1997年,另一个搜索引擎
AltaVista号称每天收到数千万条查询,而互联网已经有数亿个网页需要
搜索和索引。需要索引的网页的巨大数量使我们不可能找到用户真正想
要的内容。借用布林和佩奇的话:“到1997年11月时,排名前四的商业
化搜索引擎中只有一个能够找到它自己——具体意思是指在该搜索引擎
查询它自己的名字时,能在前十个结果中显示自身的搜索页面。”
那么,我们如何能在这样的汪洋大海中找到正确的那根针呢?当用户输入某些关键词时,确实有某些明显的方法去识别他或许想看到的网
页,但问题是有太多的网页包含同样的关键词。某些网页频繁出现关键
词,并不能保证它们就是大多数用户寻找的内容。追踪过去的信息流向
并深入考察不同网页的内容,或许能提供帮助。在这方面做过许多不同
尝试,但似乎没有方法充分奏效。这很容易让人以为,互联网只是变得
太大了,为之提供任何合理的索引和导航都注定是不可能完成的任务。
布林和佩奇的突破源自他们对万维网的网络构造的兴趣:包含如此
丰富的有用信息,因为其构造并非源自意外。网页与它们视为重要的其
他网页相连。那么布林和佩奇是如何看待和利用这一信号的呢?他们的
关键发现是,找到搜索者可能最感兴趣的网页的一个有效办法,是分析
其他网页上面的链接指向哪个网页。如果其他重要网页指向某个网页,就表明这也是个重要网页。判断某个网页的地位并不是简单计算有多少
网页跟它有链接,而是看它是否与某些链接最广泛的网页相连。在许多
场合下,拥有“人脉广泛”的朋友比仅仅拥有人数众多的朋友更为重要。
这种定义是循环式的:某个网页很“重要”,是因为它在其他的“重
要”网页上有链接,而这些网页的重要性,又是来自被别的“重要”网页
链接。尽管有这种循环特性,但结果却表明它是漂亮的解决方案,在网
络环境下尤其适用。
假设我们希望散布一条可能会口口相传的消息,从图2.5显示的人
际网络中,我们将看到为什么对人气度的直接测量指标并不够用。很明
显能看出,南希和沃伦尽管都各有2位朋友,他们的位置却存在很大差
异。差异之处在于,他们的朋友的交际度不一样,以及与之相关的,他
们中谁在网络中所处的位置更为有利。沃伦的朋友每人只有2个朋友,而南希的朋友则分别有7个和6个朋友。于是,尽管沃伦和南希在他们自
己的“度”(朋友人数)上得分相同,但南希的朋友却有着比沃伦的朋友
更高的度。
我们可以暂停一下:不是只计算朋友的数量,而是计算每个朋友能带来的更多的朋友的数量,跟踪朋友的朋友——我们称其为“二度朋
友”(second-degree friends)。从直接的朋友扩大到计算朋友的朋友将
是个很好的开始,由此看来南希在传播消息方面比沃伦处于更好的位
置。但迭代为什么要止步于此?为什么不接着考虑“三度朋友”?虽然南
希的朋友艾拉没有给她带来多少三度朋友,但迈尔斯却带来了更多的联
系。从南希开始经过三步后,我们已经联系到了网络中除沃伦之外的所
有人。从沃伦开始经过三步后,我们只能联系到5个其他人,而南希却
是16个人。这使得南希在散布消息方面是个比沃伦好得多的候选人,尽
管他们本身有着相同的度数。
图2.5 南希和沃伦在网络中的度都是2。但他们各自的朋友的人际联系却大为不同,从而导致
他们在网络中的整体位置也相差悬殊。
在一个大型网络中我们该如何理解这点,是否可以永远持续下去?
对此有不同的处理办法,此处只介绍最核心的理念。我们首先可以计算
第一度朋友数,如图2.5所示,南希和沃伦各自的分值为2,因为他们各
有2个朋友。接下来加入二度朋友的数量,但这些人的重要性是否应该
同第一度朋友相同呢?例如,假如从南希开始散布消息,这条消息从南
希传到迈尔斯那里的概率,理应高于传到迈尔斯的某个朋友的概率——
因为消息必须首先从南希传给迈尔斯,然后还必须从迈尔斯传给其他
人。消息传递两步的概率可能会比只传递一步的概率低得多,例如只有
后者的一半。由此看来,我们可以把朋友的朋友的分值设置为朋友的分
值的一半。南希有11个二度朋友,由此得到的朋友的朋友的分值将为112。沃伦只有一个二度朋友,得分为12。把一度和二度朋友合计,南
希的得分为7.5,沃伦的得分仅为2.5。我们再看三度朋友,南希有3个,沃伦有2个。对这些朋友的分值再次缩小一半,每个为14,于是南希的
得分将增加34,总分为8.25,沃伦将增加24,总分为3。以此种方式迭
代,我们就能够量化南希在网络中的影响力比沃伦大多少。
南希和沃伦之间的对比还能为另一个问题提供解决方案。我们可以
把每个人的中心度定义为他的朋友的中心度总和的一定比例——类似于
刚才所做的计算。按照这一定义,南希将从艾拉和迈尔斯的得分中获得
一定比例,而艾拉和迈尔斯的得分又来自他们朋友的得分的一定比例,以此类推。迭代机制也相似,艾拉和迈尔斯的得分来自各自的朋友,这
些人算是南希的二度朋友,他们的得分又来自各自的朋友,可以算是南
希的三度朋友,并继续下去。
[1]
幸运的是,这种类型的方程组——每个人的中心度都是其朋友中心
度总和的一定比例——是非常自然且易于处理的数学问题。从18世纪到
20世纪,有若干大名鼎鼎的数学家为这一领域做出了贡献,其中包括:
欧拉、拉格朗日、柯西、傅立叶、拉普拉斯、魏尔斯特拉斯、施瓦茨、庞加莱、冯·米赛斯和希尔伯特等。希尔伯特将此类问题的求解命名
为“特征向量”(eigenvectors),成为现在的通用术语。特征向量出现在
各种研究领域的应用中,从量子力学(薛定谔的方程),到构成面部识
别技术基石的“特征脸”(eigenfaces)的定义,并不出人意料。通过求解
上述案例中的特征向量,我们会发现南希的分值约为沃伦的3倍,如图
2.6所示。
[2]
布林和佩奇的创新之处是利用他们所谓的“网页分级”(PageRank)
来给网页排名,这与以上的论述和特征向量的计算有关。尽管布林和佩
奇要解决的问题并不是通过网络来传播谣言,但却同样是基于另一个有
密切联系的迭代问题——随机游走问题(random surfer problem)。某
位用户从某个网页起步,跟随该网页的链接随机进入另一个网页,点击每个链接的概率都相等。该用户持续这一操作,以此模式在互联网上随
机游走。
[3]
积累一定时间后,如果我们要计算该用户登录每个页面的
相对时间比例,就是属于特征向量计算。在此情形下,每一步计算使用
的权重都与每个页面包含的链接的数量成比例。
图2.6 每个节点(人)的特征向量中心度。南希得到的分值约为沃伦的3倍,尽管他们有相同
的连接数。迈尔斯的此项得分最高,但中心度最高的则是艾拉。
布林和佩奇面临两个挑战。概念上的挑战是寻找最相关的网页,解
决办法是不用人气度来排名,而是用迭代方法、以特征向量来计算网页
的链接水平。更为现实的挑战则是如何在规模极为庞大的互联网上应
用,这需要漫游网络、建立网页索引、储存每个网页的内容和链接的数
据,然后对网络位置做上述的迭代计算。在小小的社群中计算南希和沃
伦的分值是一回事,将其套用到亿万个网页上则完全是另一回事,尤其
是网页的内容与链接还经常处于变化中。
布林和佩奇开发出了基于此类计算,并特别适用于庞大网络的一种
算法,称其为“BackRub”,开始在斯坦福大学的服务器上运行。
BackRub的名字来自寻找反向链接(backlinks),即把人们带到某个网
页的链接。该软件很快超出了布林和佩奇在斯坦福服务器上的学生账户
的权限,到1997年,他们把这一搜索引擎移走,更名为“Google”——这
是googol一词的变体,其含义是1后面加100个零的庞大数字,意指他们
的算法试图征服的互联网的天量规模。对早期在互联网上苦于搜索的所有人来说,谷歌引擎找到有效网页的能力令人难以置信。当时还有众多
搜索引擎对手,人们往往会尝试多个引擎,却仍经常无法找到自己真正
需要的网页。到1998年,《个人计算机》杂志(PC Magazine )报道说
谷歌“有着给出极其有效的搜索结果的神奇本领”,并将其加入最顶尖的
100家网站的行列。
[4]
之后的故事则成为世人熟知的历史。
[5]
[1] 这里有个细微的区别,我们可能做重复计算。例如艾拉的7个朋友中有一个是南希,这
样我们就把南希算成了她自己的二度朋友。重复计算实际上让数学处理变得更容易了一些,因
为我们只需要追踪每一步的联系数量,而无须考虑已经计算在内的人。重复计算造成的影响可
参阅Banerjee、Chan drasekhar、Duflo and Jackson(2013,2015)。
[2] 如果你对图中的数字感兴趣,可以提示下,中心度数值的平方之和为1,因此中心度数
字的向量在标准数学意义上是归一化的(L2或欧几里得范数)。
[3] 他们的算法还包括某些偶然的随机跳跃到新的节点,重新开始整个游走过程,以避免不
会长期陷入某些彼此指向的网页构成的局部区域。
[4] 随着计算力与互联网经验的进步,包括谷歌在内的搜索引擎一直在快速演进。这些引擎
如今包含了有关用户和不同网页的丰富得多的信息,以及对人们喜欢如何漫游网络和真正希望
搜寻何种内容的更为定制化的信息。此外,互联网在今天是个移动的靶标,内容经常发生改
变。但无论如何,网页分级的概念是个重要突破,很好地包含了网络信息。
[5] 除搜索引擎和信息传播外,追踪一度联系之外的更多联系在其他许多场景中同样重要。
对中心度的这类迭代计算和特征向量方法,在谷歌出现前几十年就已经在社交网络的研究中广
泛采用,20世纪50年代的先驱者是Leo Katz,70年代Phil Bonacich对此类方法做了规范。特征向
量中心度的多种版本被用于寻找犯罪活动网络中的“核心成员”,因为犯罪具有社交特征:人们
通过彼此交往了解到犯罪机会,并形成相互鼓励,这类网络中最核心的人对其他人的参与有着
最大的影响力(可参阅Lindquist and Zenou,2014)。此类中心度指标还用于对投资者之间的交流
的研究,以预测哪位投资者能在股市中获得最高回报(Ozsoylev、Walden、Yavuz and
Bildik,2014)。小额信贷的扩散
谷歌的历史表明,基于特征向量中心度的算法超越了其他对手,但
搜索引擎算法相当复杂,谷歌的成功或许还要归因于算法中的其他独特
之处。我们可以从更有说服力的证据来分析一个人的朋友的位置的重要
性。BackRub算法通过从他处到达某个网页的便利程度分析其地位,而
在许多情况下,我们感兴趣的是某个人在触及其他人方面有多大的影响
力。
带着这一疑问,我于2006年访问了麻省理工学院,与我的朋友、在
那里担任教授的阿比吉特·班纳吉讨论:在行动中测试影响力的差异会
多有意思。幸运的是,班纳吉那次恰好是我应该找的人(其实经常如
此)。从他那里得知,麻省理工学院另一位教授埃斯特·迪弗洛(Esther
Duflo)正通过她姐姐安妮联系印度南方的一家BSS(Baratha Swamukti
Samsthe)银行,该银行计划通过口碑的方式推广新的小额贷款计划
——从这个研究项目的启动中我们都能看到人际网络发挥的作用。该口
碑推广计划最终给我们提供了观察网络结构在信息传播中如何发挥作用
的绝好机会,并让我们可以测试何种中心度测量指标最能反映一个人的
信息传播能力。我与班纳吉、迪弗洛以及当时的麻省理工学院研究生阿
伦·钱德拉塞卡(Arun Chandrasekhar)——他的家庭正好来自要调查的
地区卡纳塔卡邦——于是启动了这项后来为期很长的研究项目。
小额贷款革命的先行者是穆罕默德·尤努斯。他于20世纪70年代在
孟加拉国创立格莱珉银行,从20世纪80年代开始广泛发放数额极小的贷
款。尤努斯与格莱珉银行的创新在2006年得到了诺贝尔和平奖的认可。
该创新很简单,却充满机智。全世界的许多贷款都要求以住房或汽车作
为抵押品,或者是给有就业记录的人提供预付工资,或者是通过信用卡
给有信用记录的人提供贷款,还有强悍的收款机构负责追究违约客户。尤努斯的小额贷款则是面向极端贫困的人群,他们工作不稳定,几乎没
有抵押品,所生活的环境的收款成本可能极高。那么,他对此的创新是
什么?
尤努斯的创新是,贷款是基于连带责任——如果某个人未偿还贷
款,更多的人也将为此负责。一个人的贷款违约,他的亲朋也会受到牵
连。这种小额贷款目前已有多种变体,其中一个典型模式正是我们的项
目跟踪的BSS银行采纳的,并能反映上述理念。BSS银行的贷款只发放
给18~58岁的女性,每个家庭只能发放一笔。妇女被分成五人一组的群
体,对贷款承担连带责任:某个女性的贷款违约,整个小组都将被视为
拖欠还款。违约将使借款人未来无法获得贷款,或者至少使违约者的借
款变得更加困难。在某些时候,这一机制的作用范围更广,连带责任跨
越到其他小组,出现太多的违约会使整个村子无法从贷款人那里获得资
源。让人们对还款承担连带责任,会给他们带来名誉和社会压力,从而
尽量不因为拖欠而让村里的同胞受害。同时还意味着组员有动力提供互
相帮助,在某人无法还款时施以援手。
另外,偿还一笔贷款通常让借款人可以获得后续的、规模更大的贷
款。根据当前的还款——本质上可以让人们逐步积累信用记录——做出
在未来发放更多贷款的承诺,也是对还款的一项重大激励。参与者往往
还会接受一些基本的财务培训,鼓励她们留下储蓄,教她们追踪收入、做计划以及简单记录支出项目等。这些培训看似初级,对村民来说却可
能很有效果。
[1]
在访问一个村庄时,有一位接受财务状况调查的当地
女性生动地向我讲述她如何增加了获得的贷款规模,保持着家庭现金收
支的会计记录,还建立了由穆斯林和印度教徒共同参加的多族群小组,以及把几笔贷款合并起来购买了一辆二手卡车,启动了一项生意。
虽然有些还款迟滞现象,但在我们开展研究的数年中,BSS银行在
这些村庄发放的贷款基本上没有出现违约。
[2]小额贷款的另一个重要特征是,贷款对象限定为女性会给家庭内部
的关系产生影响。虽然有部分资金(但不多)最后被这些村里的男性家
庭成员掌控,但贷款只能通过家庭中女性才能得到的事实,毕竟让妇女
在这些钱该如何投资或花费方面有了发言权。
[3]
BSS银行推广的小额贷款揭示了网络中心度的重要性,以及中心度
与特征向量中心度之间的差异。
我们研究的BSS银行面临一个问题:如何将提供小额贷款的消息散
布给计划进入的卡纳塔卡邦的75个村庄的潜在借款人。那些村里不安宁
的种姓制度政治气氛,加上腐败,使银行并不希望依靠村级政府来散布
消息。尽管某些村民能通过移动电话联系到,但他们已饱受垃圾信息之
苦,因此也不能利用手机做推广。其他宣传手段还包括邮寄宣传单,甚
至用汽车装载扩音器播报,但这些也已被过度使用了,而且主要是跟政
治竞选挂钩。因此,不论好坏,银行决定采用的办法是找到某些处
于“中心”位置的个人,让她们口头传播关于银行与提供小额贷款的消
息。
问题在于,银行对当地的朋友关系网一无所知。它如何能找到最中
心的村民呢?这能起作用吗?银行估计,最有利于传播消息的村民应该
是教师、店主和自助团体的带头人。
[4]
我们姑且把这些人称为“初始种
子”。银行当然希望这些种子处在中心的位置,它们考虑的是中心度,对特征向量中心度则毫无概念。
对我们的研究有用的地方在于,某些村里的初始种子有着较高的
度,而另一些村里的则较低。例如,某些村里的教师有很多人际往来,其他村里的教师则较为孤僻。更重要的是,还有些村子里的初始种子有
较高的特征向量中心度,但中心度较低,其他一些村子的情况则相反。
在某些村里,这种信息传播方式很奏效,而在其他颇为类似的村里则相
当失败:某些村里符合条件的家庭参与信贷的比率接近一半,某些村里则不到十分之一。于是,我们能从中看出哪种关于中心度的测量指标能
最好地预见信息从初始种子开始的传播结果。究竟是初始种子的哪种网
络中心度测量指标能解释信息传播在不同村庄之间表现出的6倍以上的
差异?
2007年——在BSS银行进入这些村庄之前——我们对当地的成年村
民开展了调查,并描绘出了他们的人际网络图像。这些小村子特别适合
做网络分析,因为大多数交往都是在本村里,并且是面对面进行。
[5]
根据我们之前讨论的人气高的人在决定其他人的感知和流行趋势方
面所起的重要作用,乍看上去,度数较高的人应该是传播小额贷款消息
的优质种子。但结果并不总是这样——初始种子的度与小额贷款在村里
的传播速度之间并没有关联关系。
[6]
我们对人气度的重要性的分析没有意义吗?显然不是。就像篮球运
动员的案例一样,人气可能是重要的,不过它只是更广阔的图景的一个
方面。人气较高的人在塑造人们对社会习俗与时尚的感知上很有用,并
能直接影响众人。然而我们的研究却表明,开展小额贷款的村子的主要
问题是让消息普遍传递给整个村里的人,而不是简单地影响大家的感
知。到2008年时,即使对生活在偏远村庄的人们来说,没听说过小额贷
款的人也很少,正如发达国家的大多数人知道信用卡及其对自己有用一
样。此时需要做的不是创造一种流行趋势,或影响村民对于有多少其他
村民获取了贷款的印象,而是要让尽可能多的村民知道,银行正在提供
这样的贷款。
[7]
事实上,有关小额贷款的消息的散布不只是初始种子能传递给多少
朋友,还包括他们能影响多少二度朋友、三度朋友,等等。
[8]
初始种
子的直接朋友通常只占整个群体中一小部分。虽然初始种子的度数似乎
完全没起作用,但初始种子的特征向量中心度较高的村子相比之下却有
着明显更高的参与率。把初始种子的特征向量中心度最低的村子同最高的村子进行对比,平均而言,后者的小额贷款参与率是前者的三倍。在
村子里广泛散布消息,要求其传播范围远远超出初始种子的直接朋友,到达他们的朋友的朋友的朋友的……
[1] 例如,关于简单的培训在这种情况下可能发挥的作用等,可参阅Karlan and
Valdivia(2011)。
[2] 这里需要小心,不能把情况描述得过于乐观。对任何运转良好的大型创新,同样能找到
糟糕的案例。全球各地都有相关的报道:某些人借了太多钱,因此毁掉了财务和人生,比如因
为太多的信用卡债务而宣布个人破产的情形。小额贷款的高偿还率已吸引许多公司进入这个业
务,某些带着很进取的策略,道德动机较少,与发达国家的信用卡和小额贷款差不多。对小额
贷款在多大程度上改善了借款人的生活,已经有人展开过讨论。生产率的显著提高可能需要多
年才能展现,并难以从其他趋势和项目中分解出来,因此尽管小额贷款在世界各国快速普及,获取这些服务的人的财富或收入是否有明显提高,证据却并不统一(Banerjee and
Duflo,2014;Crépon、Devoto、Duflo and Parienté,2015)。但总之,贷款的提供依然能帮助人们熨
平消费和支出,这对极端贫困的人群尤其具有意义。
[3] 参阅Schaner(2015),例如关于家庭资金收入的变化会如何影响其支出。
[4] 自助团体是这些村里的非正式群体,往往开设联合的银行账户,并经常向团体缴款,然
后从团体得到各种形式的轮流式付款或贷款。
[5] 相反,在纽约、伦敦、悉尼或北京这种大城市里,人们可能跟某些人面对面交流,跟其
他人通过社交媒体或电话交流,其熟人可能遍布整个城市乃至更大的世界。对如此大规模而多
样化的网络做较完整的描述几乎不可能,而在小村子里则是可行的。我们通过一系列有关居民
间彼此交流方式的问题来测量人际网络:资金借贷、提供建议、煤油的借贷(用于烹饪和取
暖)、紧急救助等。这些村庄平均有超过200个家庭,每个家庭以这些方式平均同15个其他家庭
交往,但彼此差异很大,度小于10或高于20的家庭数量都不少。
[6] 实际上,最终的小额贷款参与率同初始种子的中心度的直接关系图显示出不显著的轻微
负向关系特征。在控制各村庄的若干特征后,依然没有显著相关性。该研究的详细内容可以参
阅Banerjee、Chandrasekhar、Duflo and Jackson(2013)的补充资料表S3。
[7] 如果是有关人们不熟悉的某种新产品,他们在做决定前希望看其他人怎么做,那么这些
种子的人气度会重要得多。这方面的研究可参阅Cai、de Janvry and Sadoulet(2015),Kim et
al.(2015)。
[8] 还有许多其他因素可能影响参与率,包括朋友的参与决策。在统计数据分254析中,我
们仔细控制了这些因素的影响。有关细节和技术处理,可参阅Banerjee、Chandrasekhar、Duflo
and Jackson(2013)。传播中心度
这还不是小额贷款故事的结局。
对任何话题的兴趣最终都会随时间衰减。大多数新闻报道获得的主
要关注是来自最初的几小时或几天,很快会被后来的报道取代,不但是
在媒体上,也反映在人们的交谈与进一步传播上面。这意味着,特征向
量中心度可能过度测算了网络中的位置对散布消息的作用。一方面,只
看中心度忽视了消息传播不止一个环节的事实。另一方面,特征向量计
算方法把传播理解为在网络中无限循环的无休止的过程。现实其实是介
于这两种极端情形之间的。
考虑到这点后,我们在小额贷款案例的研究中定义了一种新的中心
度测量指标来反映实际传播过程。人们散布消息,但在一定数量的迭代
后将不再就某个话题继续交流。例如某个话题可能会被议论两三天,然
后大家就失去了兴趣。我们对小额贷款消息传播的估计是,通常会经过
大致三次迭代的传播,不怎么会超出“朋友的朋友的朋友”的范围。
还有,某些话题会激励人们去和所有认识的人谈论,其他话题就不
行。在小额贷款的案例中,我们估计在每次迭代中,一个家庭的人向某
个朋友谈及的频率大约为15。这好比在计算南希和沃伦的分值时,采
用15的权重,而非12,另外只传递到朋友的朋友的朋友的范围,而不
是无限迭代下去。
[1]
于是南希的得分依然会高于沃伦,但超出幅度会
缩小。
传播中心度(Diffusion centrality)介于中心度与特征向量中心度这
两种极端情形之间。如果让迭代次数以及从一个节点到另一个节点的信
息传播概率足够大,那么传播中心度就接近于特征向量中心度。如果只做一次迭代,或者信息传播概率很小,传播中心度将与中心度成比例。
在中间情形下,它反映着一个人在网络中的影响范围有限,并与传播内
容是否热门和持久有关。
在小额贷款信息的传播上,结果表明传播中心度是比特征向量中心
度还精确得多的预测指标。对于解释小额贷款信息在村子之间的传播,初始种子的传播中心度的解释力是他们特征向量中心度的好几倍。
[2]
这一故事的最终寓意是:可以用不同方式测量中心度,在不同情景
下,某些测量指标的预测表现会比其他指标更为出色。
至此,我们已经看到了用三种不同的思考方法测算一个人在网络中
的位置。中心度反映直接影响力,特征向量中心度反映一个人的朋友的
势力,传播中心度反映一个人在给定时间和兴趣程度下传播或接收信息
的范围。正如上文中篮球运动的例子,这些仍只是描述网络中位置重要
性的很多方法中的几种。尽管我们不需要把其他方法都罗列出来,但仍
有一种中心度测量指标与之前介绍的几种存在关键的区别。美第奇家族
的崛起这一迷人的历史事件,能够让我们从权力的视角揭示最有趣的中
心度测量指标之一。
[1] 有关的计算细节,可参阅Banerjee、Chandrasekhar、Duflo and Jackson(2015)。
[2] 这一指标在估计传播概率和迭代次数上更具灵活性,因此在预测上理应比其他指标更
好。但即使在分析消息传播前固定传播概率和迭代次数,该指标在这些村庄里的结果也表现更
好。为了限制传播中心度相对于其他指标的优势,我们根据某些基本网络特征固定了家庭之间
的交流频率(使得信息刚好能传播到网络中的所有人),根据研究中人们接触到小额贷款的时
间固定了迭代次数。即使如此,传播中心度的表现也超过其他指标[可参阅Banerjee、Chandrasekhar、Duflo and Jackson(2013)补充材料表S2的第10列]。更多的差异可比较该表底
部的R2(衡量不同村庄的小额贷款参与率有多大比例能被各种中心度指标解释)。事实表明,传播中心度增加的R2是特征变量中心度的3倍以上。美第奇家族的崛起:人际网络的早期案例
美第奇家族创造了我,同时也毁灭了我。
——达·芬奇
政治问题在科西莫的房子里解决。由他选的人出任职务……他才是
决定战争与和平的人……他是无冕之王。
——教皇庇护二世
公元1434年对佛罗伦萨是个关键的年份,自此形成的庇护环境孕育
了早期的文艺复兴。佛罗伦萨从多个富有的政治望族——如阿尔比齐和
斯特罗齐——的不同派系统治的寡头政体,转变为由一个家族——美第
奇家族——执掌的社会。这段时间前后,美第奇家族委托艺术家多纳泰
罗完成了独特而充满创意的著名的真人大小的大卫铜像,以纪念这位战
胜强大怪物的英雄,或许并非出于偶然。是什么让该家族的族长科西莫
·美第奇集中并巩固了权势?
美第奇家族尽管出身精英,但15世纪30年代之前在政治和金钱上都
并不出类拔萃。例如,斯特罗齐家族的财富更多,在地方议会中掌控着
更多席位,然而美第奇的崛起让他们黯然失色。
1434年以前,美第奇家族同其他寡头——包括斯特罗齐和阿尔比齐
家族在内的其他有财富和权势的银行业家族——展开了角逐。斗争在
1433年白热化,科西莫与美第奇家族的其他成员被逐出佛罗伦萨,斯特
罗齐和阿尔比齐这两个家族在其中扮演了关键角色。家族之间的对立不
只是因为对当前权力的争斗,以及同竞争城市卢卡的战争失利带来的经
济负担,还有更深的根源。美第奇家族,尤其是萨尔韦斯特罗·美第奇(科西莫的堂兄)是14世纪70—80年代反抗势力强大的行会的“梳毛工
与酒馆老板起义”的主要支持者。这场被称为“人民党”(Ciompi,其大
致含义是:“朋友,我们来喝一杯”)的起义是为了反对重税以及抗议贵
族阻止低阶层民众加入行会和掌握政治经济权力。起义虽然最终失败,但却带来了持久的变革,美第奇家族对起义的支持也让他们在之后几十
年获得了声誉。随着美第奇家族的银行帝国持续扩张,他们同其他寡头
家族的竞争在1433年进入高潮。当时,其他寡头家族占据了执政团
(Signoria)的多数位置,这是统治佛罗伦萨的有轮值特色的核心政治
实体,包含9位名为执政官(Priori)的公会成员。1433年9月,阿尔比
齐家族的密切盟友伯纳多·瓜达尼(Bernardo Guadagni)成为司法长官
——由执政官轮流担任的一个职位。里纳尔多·阿尔比齐联合斯特罗齐
家族及其他害怕美第奇的寡头家族,说服了伯纳多与执政团将科西莫·
美第奇及其部分家族成员逐出佛罗伦萨。这一决定是在阿尔比齐家族的
军队监视下,由执政团在同部分聚集起来的市民匆忙协商后做出的。
美第奇家族的流亡没有持续多久。反对美第奇家族的寡头们严重低
估了科西莫的势力。他和盟友设法将大量资本撤出了佛罗伦萨,由于同
卢卡的战争失利已经造成的沉重打击,导致了严重的金融危机。此外,通过美第奇家族与其他家族的许多盟友,科西莫还影响了新的执政团人
选,很快令局势彻底改观。科西莫于1434年秋在盛大游行中重返佛罗伦
萨。短短几天后,轮到里纳尔多·阿尔比齐被驱逐了——这次是永远。
科西莫靠什么权势召集众多的盟友,组织报复行动并改组政府?为
什么阿尔比齐家族没有能力反制?
首先,无须赘述的是科西莫必须非常有自知之明。能够在那样高度
激烈的竞争环境中巩固和支配权力需要极大的远见、极强的手腕和极高
的智慧。这种对人生的智慧与宽阔视野表现在:科西莫对哲学的浓厚兴
趣,委托学者对柏拉图的著作做了首次全文翻译;对艺术的广泛资助,不只是对多纳泰罗,还包括安杰利科、菲利波·利比、吉贝尔蒂、米开罗佐和布鲁内列斯基等;支持佛罗伦萨设立首家公共图书馆;以及作为
大使和在国际政治中扮演的角色等。科西莫是位真正的文艺复兴人士,他的慷慨,与他的商业、社会和政治活动,使大约一个世纪之后的尼科
洛·马基雅维利对其崇敬有加。马基雅维利写道:“科西莫是最为慎重的
人之一,有着严肃而谦卑的风度,又极端开明和仁慈。他从未尝试过反
对党派或统治者的任何事情,对所有人都慷慨大度;凭借这种不懈的大
度品性,他成为所有层级的公民的同路人。”(Book IV of History
ofFlorence )
其次,从我们的视角来看更关键的是,科西莫对佛罗伦萨的社会和
经济网络大拼图的深刻理解及其所处的幸运位置至关重要。这个位置使
他能建立和掌控一个早期的政治党派,而当时的其他主要家族的反应则
显得不知所措。
美第奇家族的网络涉及两组关键的联系:商业与婚姻。商业事务以
他们的银行为中心,包含整个大家族成员中的特许经营权。美第奇银行
不仅是佛罗伦萨的精英家族的主要资金来源,也为许多非精英家族提供
便利,甚至还服务于教皇和遍布当地的众多宗教领袖。除基本的银行和
贷款业务外,美第奇家族也参与了各类合伙企业、房地产交易与贸易。
在这些经济联系之外,还有同其他精英家族的联姻网络作为补充。
当时精英家族间的婚姻远没有浪漫可言。这种联姻可能安排某个家
族三十多岁的儿子迎娶另一个家族十多岁的小女儿。女孩充当某种社会
担保品,把新的家庭同自己的血亲捆绑起来,女婿则往往成为与对方家
族交往的重要商业联系人和政治帮手。
[1]
这类商业与婚姻纽带体现了巩固关系所需的同盟和担保,形成了有
利的合作环境。否则,政治联盟与经济合同都会难以执行,竞争可能过
于激烈。
从图2.7中可以看出,美第奇家族在佛罗伦萨部分关键精英家族间的婚姻和商业网络中处于独特地位。图中的每个节点代表一个家族,两
个家族之间的联系代表连接他们的婚姻,或者各种商业伙伴及其他交易
关系。
该网络揭示了美第奇家族地位的若干重要特征。最明显的一点是他
们的联系比其他任何家族都多,婚姻与商业联系的数量几乎是两个主要
竞争对手阿尔比齐家族和斯特罗齐家族各自的两倍。
图2.7 节点代表15世纪佛罗伦萨的部分关键家族。黑色实心节点的家族支持美第奇家族,格子
底纹节点的家族属于美第奇的对立派,灰色实心节点(萨尔维亚蒂家族与巴尔巴多里家族)与
双方均有结盟。家族之间的连线代表存在婚姻或商业联系。
除联系数量之外,美第奇家族还在他们同盟家族中起到关键联系人
的作用,而对立的家族中则没有这样独特的联系人。例如,阿齐亚奥
里、基诺里、帕齐和托纳布奥尼这几个家族相互之间均没有直接联系,都是通过美第奇家族联系在一起。在该图显示的15个家族之外,情形同
样如此:根据更为完整的包含92个精英家族的数据库,同美第奇家族联姻的家族中有超过半数同最多两个其他家族联姻,而同反对美第奇的家
族联姻的家族中,则有超过半数同四个以上的其他家族联姻。
[2]
因此,美第奇家族处于他们一派势力的核心,担当着关键联络人的
角色。从图上看他们似乎处于一个星形的中心。相比之下,图的另外一
侧没有这样的关键家族:各反对家族相互联系更密集,更分散化。为清
晰起见,我们把上面的网络拆分成两个部分,如图2.8所示。
[3]
这一网络位置的意义可以通过一个简单类比看清楚。假设你举办一
个小型聚会,大多数来宾只认识你(或许还认识另外一位)。聚会中的
谈话因此可能会围绕你展开,你会处在一个独特位置上,知道不同来宾
有哪些共同点,什么话题可能让人感兴趣。相反,如果小型聚会上的来
宾彼此都是朋友,交流就可能分散得多,并会分解为不同的谈话或群
组。用这个类比来思考文艺复兴早期佛罗伦萨的政治活动并不牵强,当
时的交流必须面对面展开或者利用书信。美第奇家族不只能协调与他们
有联系的家族的政治行动,而且处于独一无二的绝好位置。美第奇家族
不需要担心自己的支持者分散开,去讨论他们没有授权的话题。与之相
比,他们的主要对手阿尔比齐家族的位置就不够有利。反对美第奇的各
个家族没有一个领导家族,也未能在关键时刻采取协调行动。
[4]
美第奇家族关键的网络位置还能让我们明白,他们的财富和生意在
科西莫指挥下何以能够蒸蒸日上。他们被称为“文艺复兴时代的教父”,这不是偶然。美第奇家族在网络中的位置非但对协调政治行动至关重
要,也使他们成为许多商业交易的突出的中间人。要在各种交易中确保
安全感,家族联系或以前的生意往来能有所帮助,或者是通过与自己有
联系的某位中间人来交易。美第奇家族是许多对其他家族之间的关键连
接点,关系网中的很多路径要通过他们,其数量远超其他任何家族。例
如在这一联姻网络中,有超过一半的成对家族之间的最短连线通过美第
奇家族,而通过斯特罗齐家族的只有约十分之一,通过阿尔比齐家族的
数量也差不多。从该连接指标来看,得分仅次于美第奇的是瓜达尼家族,他们成为网络中超过四分之一的连线的关键联系人。网络学家将该
指标称为“中介中心度”(betweenness centrality),其变形在20世纪70年
代由雅克·安东尼斯(Jac Anthonisse)和林顿·弗里曼(Linton Freeman)
首次引入。
[5]
对网络中的每个节点,中介中心度反映了其他各对节点
之间的最短连线通过该节点的比例。图2.8 支持美第奇的各家族的网络与反对美第奇的各家族的网络。把美第奇家族从其群组中拿
走,会使图(a)中的整个网络解体,而图(b)中则没有哪个家族处于必不可少的位置。中介中心度包含我们刚刚分析的两个观念:如果某个节点的两个朋
友彼此没有直接联系,他们之间的最短连线就会通过该节点,即该节点
位于他们之间。这使得该节点不但能担任经纪人或中间人,而且可以成
为其他节点的行动的协调人。这就能解释美第奇家族一方面是商业中的
居间人,另一方面又是政治行动的核心组织者。他们的位置比其他家族
好得多,也非常聪明地利用了这一点。
[1] “政治帮手”(political lieutenant)这个说法来自Dale Kent(1978)。Kent在20世纪70年
代对数据的仔细整理给这里的人际网络分析奠定了基础。后来的研究(John Padgett and
Christopher Ansell,1993)对这些数据做了拓展,并对其中的网络深入分析。这里的图示中的数
据来自Ronald Breiger and Pip Pattison(1986),其中借鉴了Padgett的研究的数据,还包括
Padgett的研究中的另一个家族集合。我对引用的数据做了相应更新,包括在美第奇的对立派一
边的阿尔比齐家族与佩鲁齐家族及加斯科尼家族的婚姻和商业联系。
[2] 这个观点来自Padgett and Ansell(1993)。该研究认为:美第奇家族的政治控制力由精
英网络的分裂所致,只有该家族能够居间协调。另可参阅Burt(1992,2000,2005)。
[3] 普奇家族是美第奇的强烈支持者,尤其是给流亡中的科西莫及其家人提供了援助。因此
尽管有关数据没有包含他们之间的正式的商业或联姻联系,他们依然维持着稳固的联盟。另外
我在美第奇家族一边加入了萨尔维亚蒂家族和巴尔巴多里家族——由于他们在冲突中的最终站
位。如果放弃他们,而把普奇家族的联系加进来,会让美第奇的星形状态更为突出。
[4] 美第奇一派与对立寡头之间的差别在1434年9月底最终摊牌时表露无遗,也就是科西莫
返回佛罗伦萨之前。里纳尔多·阿尔比齐试图组织人马接管即将坚定地倒向美第奇家族的政府。
他呼吁包括斯特罗齐家族在内的其他家族派出武装力量,但由于这些家族之间要相互商议,反
应很混乱。相反,科西莫即使在流亡之中,也能借助自己的核心位置轻松聚集起武装力量保卫
新的执政团。
[5] 来自Jac Anthonisse(1971)和Linton Freeman(1977)。关于尼克松和福特的人际网络
的分析可参阅Ferguson(2018)。“教父效应”:中心度带来中心度
伟人不是生而伟大,而是越活越伟大。
——维托·柯里昂(《教父》中的黑帮老大)
凡有的,还要加给他,叫他有余;没有的,连他所有的也要夺过
来。圣经如是说,至今依然。
——比莉·荷莉黛(Billie Holiday)与小亚瑟·赫尔佐格
(Arthur Herzog Jr.)的歌曲《God Bless the Child》
我们不清楚科西莫在多大程度上有意识地设计了美第奇家族的网络
位置,以及他是否清楚成为其他家族的关键连接点的重要性。但无论如
何,婚姻是人为的安排,而非偶然的事件。此外,众所周知科西莫愿意
为因欠债而被禁止参与佛罗伦萨政治活动的家族还钱,由此积极地培育
了其他家族的联系和忠诚。这对于选举出支持美第奇家族的执政团、让
他从流亡中回归起到了关键作用。
然而,除构建网络的所有精心设计外(本书第5章和第9章对此还将
做更多讨论),网络形成中还存在反馈效应。这些效应能解释为什么某
些人的位置最终会远比其他人更接近中心。
中心度能带来更多中心度。如果人们新交到的朋友与他们已经有的
朋友数量成比例,则朋友的数量就会像复利那样增长。已经处于更中心
位置、朋友数更多的人,其中心度分值的增长将快于位置不够中心的
人。
在网络环境下,这一过程被称为“优先连接”(preferentialattachment)——新联系的形成与某个节点已经有的联系的数量成比
例。艾伯特-拉斯洛·巴拉巴西与雷卡·阿尔伯特研究过优先连接效应,发
现这会使网络中节点的联系数量出现高度悬殊。
[1]
可是为什么我们在网络环境下会看到优先连接或类似的复利倍增机
制?
假如你需要信息,那应该去联系在人际网络中交际广泛的人士。因
此,有更多联系的人在交往中更具吸引力。
[2]
不过复利效应还有另外
一方面。中心度的增长不仅来自与处于中心的人联系有多大吸引力,还
取决于是否容易联系到处于中心的人。对该课题,我与自己之前的学
生、经济学家布莱恩·罗杰斯曾开展过研究。
[3]
你是如何结识朋友的?有些是通过你的朋友——由某个朋友引见,或者在朋友组织的聚会上见面。友谊悖论在这里有潜在影响:你最容易
结识的是那些已经有最多朋友的人。由此会造成富者愈富的现象,居于
更中心位置的人更容易参与会面,也更容易结交新的朋友。
如果是通过老朋友结识新朋友,那么你见到某个人的概率就同他们
已经有的朋友的数量相关。假如某人的朋友人数是另一人的两倍,你见
到他的概率就是另一人的两倍,因为认识他的任何一位朋友,都会给你
一次见到他的机会。于是有更多朋友的人会以更快的速度结交新朋友。
有证据表明,此类效应在更为广泛的场景中同样存在,从研究人员如何
寻找合作者,到出口商如何开发新的商业合同。
[4]
如今这已成为互联
网社交平台上内置的机制,你之所以得到建立新联系的建议——“你认
识某某人吗”,恰恰是因为被推荐者已经是你的朋友的朋友。该算法表
明,新的联系是基于现已存在的网络。
我和罗杰斯的研究发现,网络本身在新的联系形成中作用越大,复
利效应就越明显,节点之间联系的不平等越突出。当人们通过现有联系去寻找其他人的时候,可以出现巨大的乘数效应。它不但会增加一个人
的度,还会影响特征向量中心度和传播中心度等指标,因为同其他联系
广泛的节点增加了联系。这在商业环境中尤其重要,处于较好的位置会
让人在相互联系中更具吸引力,也更容易被人找到,从而更便于建立关
键联系与形成滚雪球现象。
这种效应的程度以及由此导致的网络位置的不平等,在不同场景下
有巨大差异。某些网络相当平等,人们的中心度只有少数随机差异,某
些网络则有着极度的不平等。某所高中的学生之间朋友数目的差异也许
很随机,完全像扔硬币一样。相反,如果我们分析的是有多少链接指向
不同的网页,其差异则会非常不均等,而且发现某个网页似乎主要取决
于现有链接——通过现有链接越容易找到某网页,该网页就越能获得更
多的链接。相比高中生之间的朋友网络,互联网网页的度数之间的差异
程度要大得多。
[5]
[1] 参阅Barabási and Albert(1999),Price(1976),Krapivsky、Redner and
Leyvraz(2000),Mitzenmacher(2004),Jackson and Rogers(2007a),Clauset、Shalizi and
Newman(2009)。他们分析互联网上“Notre Dame”域名的不同网页有多少链接时已发现了该现
象。另外参阅Albert、Jeong and Barabási(1999)。
[2] 例如从专利数据看,与联系较多的人(在过去与多少人有过联合专利)联合申报专利,相对与联系较少的人联合申报专利,成功的概率更高。可参阅Akcigit、Caicedo、Miguelez、Stantcheva and Sterzi(2016)。
[3] 参阅Jackson and Rogers(2007a)。另一种可能性是,人们只是拷贝其他人的链接,或
把随机与喜好因素给混合了。有关研究可参阅Kleinberg、Kumar、Raghavan、Rajagopalan and
Tomkins(1999),Kumar、Raghavan、Rajagopalan、Sivakumar、Tomkins and Upfal(2000),Pennock、Flake、Lawrence、Glover and Giles(2002),Vázquez(2003)。这会导致类似的分
布结果,但在其他网络特征上存在差异。
[4] 可参阅Fafchamps、van der Leij and Goyal(2010),Chaney(2014),Jackson and
Rogers(2007a)。
[5] 参阅Jackson and Rogers(2007a)。网络中的影响力和权势的分类
我们已经看到,网络结构给财富和政治权力指标以外的影响力提供
了关键的解释。此外,网络结构的意义经常超出简单计算每个成员间各
自有多少联系。我们的分类法包含了四种人们发挥影响力的基本途径,以及与之相关的测算人们在其网络中的中心度的指标:
[1]
◎人气度——“中心度”:某人是否有很多朋友、熟人和关注者?
在社交媒体中把消息发送给数百万关注者的能力,让一个人拥有了影响
大量民众思考和了解什么的力量。人气度高的人受到超出比例的关注,由此可以扭曲人们对趋势和习俗的看法。
◎联系(你认识谁)——“特征向量中心度”:某人是否与其他交
际广泛的人有联系?朋友数量多可以有帮助,但拥有几个位置绝好的朋
友同样有用,甚至更加重要。
◎影响范围——“传播中心度”:某人所处的位置在多大程度上利
于传播消息或最早得知消息?能否通过网络中有限次数的传播影响很多
人? [2]
◎中介桥梁——“中介中心度”:某人是不是高能量的经纪人、关
键的中间人,或者处于协调他人的独特位置?其他人之间的相互联络是
否必须通过此人开展?某人是不是某个群体与其他群体之间的关键桥
梁,离开他就无法连接?
从一定意义上讲,人气度是个局部性的指标,我们只需要数清一个
人有多少朋友或熟人。而其他三个概念更具有全局性,包含更大范围的
网络的信息。哪一种中心度的概念更适用,人们如何发挥力量,则取决于场合。我们很快将会看到,这些概念在传染、不平等和极端化等现象
中起到了关键作用。
[1] 除这里提到的之外,还有许多其他测量中心度的指标。某些在概念上相似,但计算方法
略有不同,其他涉及另外的概念。对数学更感兴趣的读者可以参阅Borgatti(2005);
Jackson(2008a,2017);Bloch、Jackson and Tebaldi(2016);Jackson(2017)。
[2] 这同时涉及所谓“紧密中心度”(closeness centrality)的指标,反映某人同他人的密切程
度。第3章 扩散和传染
导读
◎黑死病杀死过亿万人口,但真正令人惊讶的是其蔓延的速度之慢
与有条不紊。
◎疾病的传播映射着人类的移动和交际范围。阻止传染的秘诀在于
控制“基本再生数”。但由于网络中的外部效应,个人激励并不等于社
会最优,根除任何疾病都极其困难,大多数传染病仍会周期性暴发。
◎人类网络中常见的“巨型分支”把绝大多数人绑在一起。无论是
流感、时尚或者热门消息,我们均无处可逃。
◎社交网络极为稀疏,但人与人之间的连接路径却非常短。我们今
天生活在“六度分隔”的小世界中——短短几次转发,你的信息便可以
抵达地球上的任何人。
多少勇敢无畏的男子、如花似玉的美人、活泼可爱的少年……早晨
还和亲朋好友一起享用茶点,夜里却和他们的祖先一起在冥界共进晚餐
了!
——乔万尼·薄伽丘,《十日谈》(1353)
1347—1352年前后,腺鼠疫(俗称黑死病)缓慢但持续地在欧洲蔓
延。罪魁祸首——鼠疫杆菌——是由跳蚤携带的病原体,在它们吸食感
染者的时候摄入。这种杆菌会堵塞跳蚤的消化道,使它们更加渴望营养
物,从而贪婪地继续觅食,将杆菌传染给更多宿主。跳蚤很适应寄生在
老鼠、人类和其他动物身上,某些抵抗力强的宿主充当细菌携带者,其
他一些则在被叮咬和感染后很快死亡。这种疾病非常可怕:开始像流感
那样令人衰弱和发烧,但很快转为大范围出血。坏死的组织呈现黑色,从而有了“黑死病”的名称。
当时的卫生条件、对传染病的认识不足,以及人类和许多动物接触
密切,共同导致这种疾病对中世纪的勃兴城市带来致命的打击。
[1]
它
使巴黎和佛罗伦萨的人口在两三年内减少了大约一半,汉堡和伦敦等城
市的死亡人数更多。现在我们认为,黑死病是从中国沿着丝绸之路传到
君士坦丁堡,然后在1347年随着热那亚的商船进入西西里岛,很快消灭
了岛上近一半的人口。此后疾病继续蔓延,冲击意大利部分地区,此后
是马赛,再扩展到整个法国和西班牙,最终在几年后进入北方的一些国
家。总体上,黑死病估计杀死了超过40%的欧洲人口,在抵达欧洲前还
在中国和印度夺去了约2500万人的生命。
从现代视角来看,真正令人惊讶的是这种疾病蔓延的速度缓慢但又
有条不紊。虽然黑死病的传播偶尔会出现远距离跳跃,例如沿着丝绸之
路等贸易路线或者通过航船,但它在整个欧洲的推进平均来说每天却只
有约两公里,即便以当时的徒步旅行标准看也相当缓慢。
[2]
尽管黑死
病很少在人与人之间直接传染,但却是随着人类活动而蔓延——通过寄
生在船舱的老鼠、农场牲畜和人类身上的,以及躲藏在衣服中的跳蚤
——因此这种瘟疫的传递是依赖人类网络以及人类周围的各种动物。
黑死病的缓慢传播告诉我们,中世纪时大多数人类的移动和交际范
围是多么有限。现代的传染病大不相同,传播极其迅猛,通常在几周甚
至几天之内就跨越不同的大陆。2014年通过在南加州一家美国主题公园
的接触而在未接种疫苗的成人和儿童中暴发的麻疹,几天后就出现在数百英里外的学校里。2015年暴发的埃博拉病,在一周内便由塞拉利昂的
医疗工作者带到欧洲和北美的城市。
本章我们将看到,传染和扩散如何受到网络结构的影响。除对于疾
病传染的深入探讨外,这方面的认识还将提供一个起点,以理解观念、金融情绪以及就业和工资的不平等性等更为复杂的传播现象——它们将
是后续各章的主题。
[1] Katharine Dean et al.(2010)认为,黑死病在中世纪的传播或许主要是通过256跳蚤和虱
子,它们的宿主以人类为主,不太依赖老鼠和其他动物。当时的卫生状况使得跳蚤和虱子十分
常见,并能轻易找到新的宿主。这一疾病在现代的病例较为罕见,更多是因为人与有跳蚤寄生
的动物接触,或人与人比较密切的接触所致。而身上经常带有跳蚤和虱子的人数大大减少,使
这些寄生虫更难以直接在人与人之间传播。
[2] 参阅Marvel、Martin、Doering、Lusseau and Newman(2013)。传染与网络结构
吕克斯:会传染吗?
普斯多鲁斯:你见过不传染的瘟疫吗?
——伯特·谢夫勒夫与拉里·吉尔巴特所著剧本《春光满古城》中
的对白
我们今天的许多网络与中世纪的人际网络当然有巨大差异,但从一
种特殊类型的现代网络中,我们仍能学到与黑死病缓慢而顽固的蔓延有
关的许多原理。
图3.1描述了美国一所高中青少年的浪漫关系(或者说性关系)网
络。学生记录的是18个月中的交往关系。
[1]
在该图描绘的网络中,典型的学生只有一个或两个交往对象,可是
该网络依然出现了一个“巨型分支”(giant component):图的左方的巨
大相连部分,包含通过一系列相互关系而连接起来的288名学生。图3.1 美国中西部一所高中里的人际网络,来自Add Health数据库。图中的节点代表各个学
生,颜色代表性别。每条连线代表在18个月的时间内存在恋爱或者性关系。某些分支旁边的数
字代表这类分支出现的次数,例如,有63对学生只在他们相互间存在关系。孤立的学生没有显
示在图中。有刚好超过一半的学生处于图左方的一个巨大分支中。对本图中的数据首先加以分
析和探讨的研究成果是Peter Bearman,James Moody and Katherine Stovel(2004)。
“分支”是一个网络的各个部分,其中的每个节点都能通过一条联系
路径到达彼此。
[2]
图3.1中有刚好超过一半的学生处于巨型分支中,其
余分属许多小型分支。
[3]
有超过四分之一的学生报告说没有恋爱关系
(大家应该都记得高中的寂寞时光),这些人并未显示在图中。
该图凸显了一个危险:尽管平均而言每个学生只有很少的交往对
象,但性传播疾病却可能蔓延到很大一部分群体。图中的每个连接都代
表疾病从一个人传染给另一个人的可能性。如果巨型分支中的某个人染
病(例如通过与校外的某人交往),疾病就可能在这一分支乃至整个学
校中广泛传播。
[4]
例如,HPV病毒(人乳头瘤病毒)就是通过性传播,可能导致宫颈
癌等几种癌症。HPV病毒的一个危险在于,它通常是无症状的,被感染
者没有理由认为自己染病,从而可能继续把病毒传染给其他人。据估计,大约有40%的美国成年人携带HPV病毒,其中许多人并无意识。
[5]
大多数被感染者对性关系的态度并不随意,他们只是碰巧成了巨型
分支的一部分。
从图3.1中,我们能一眼看出为什么疾病的传播可能比较慢,因为
每个人的连接数量较少。可是通过巨型分支,最终仍能达到很高的感染
率,正如当年的黑死病那样。
从图中还能看到,疾病的传播并不依赖有滥交者或性工作者的存
在。连接度较高的人可以放大和加快疾病的传播,但对于有着巨型分支
的网络而言他们并非必要条件,只需要每个人有一个以上的连接就足够
了。
这样的网络达到的连通性给广泛的传染提供了可能。
[1] 该图的数据来自Peter Bearman、James Moody and Katherine Stovel(2004),其中涉及
Add Health数据库(即本书第1章引用的the National Longitudinal Adolescent Health data set)。本
图与该研究中的图2略有差异。
[2] 具体而言,分支是指网络中的一个部分,其中的每个节点都能通过网络中的路径到达彼
此,其最大范围是指该分支中的所有节点的每个连接(也即分支中的节点的所有相邻节点)都
包含在该分支中。
[3] 人类网络通常只有一个巨型分支。有两个巨型分支要求每个分支里都有很多人,而这两
个分支如果要彼此分开,一个分支中的任何人都不能与另一分支中的任何人有连接。当人数较
多时,这是很难做到的。只需要一个跨越分支的连接,就能将两个分支合二为一。
[4] 这里忽略了时间因素。某些人际关系发生前,其他一些就结束了,因此对疾病在该网络
中的传播方向肯定有某些限制。若考虑时间因素可能迟滞传染过程,但未必能避免巨型分支中
的很多人依然被传染。更多研究可参阅Johansen(2004),Wu et al.(2010),Barabási(2011),Pfitzner、Scholtes、Tessone、Garras and Schweitzer(2013),Akbarpour and
Jackson(2018)。
[5] 根据人口样本以及检测和定义采用的技术,对该病毒普及程度的估计有很大悬殊,并由
于很多人对自己被感染一无所知而变得更复杂。性行为活跃人群中曾经被感染的比例估计远远
超过50%,有关研究可参阅Revzina and DiClemente(2005)。相变与基本再生数
“相变”(phase transition)这一术语经常用在热力学中,意思指物质
形态的改变。
[1]
例如当水变成冰或水蒸气时,我们就说发生了相变。
人类网络也在发生相变,从孤立节点和小型分支的聚集,到包含由
相当比例的节点构成的巨型分支,并最终形成所有节点都能通过网络路
径连接的形态。网络中的联系所占比例的增加,就好比随着温度的提
高,把冰变成水,再变成水蒸气。
相变的一个醒目特征是其发生可以非常突然。温度略低于冰点时,你还站在冰上,而提高1度之后,你就掉进了水里。类似的是,网络中
联系频率的微小改变可以对其组成结构产生巨大效应。图3.2描绘了这
种情况。随着每个人的平均朋友数从0.5人[图(a)]增加到1.5人[图
(b)],我们从一个基本没有连接的网络跨越到一个大多数人能相互
连通的网络。联系频率的进一步小幅提高[图(c)和图(d)]使之成
为“路径连通”(path-connected)或简称“连通”(connected)的网络:其
中的每个人都能通过网络路径实现彼此联系——图(c)处于近似连通
状态,还有两个节点未被连上。
网络的相变对疾病控制具有基础性的意义。与疾病及可能传播疾病
的网络有关的一个关键数字是疾病的“基本再生数”(basic reproduction
number)。其含义是一个典型的感染者会让多少其他人受到新的感染。
若基本再生数大于1,则疾病会蔓延,若小于1,则疾病会消亡。
基本再生数的临界值为1,对应图3.2所示的网络出现巨型分支的相
变情形。背后的原理极简单却很关键:每个感染者造成的新感染多于1
个,传染就会继续扩大,每个新感染会造成更多人被感染,使其不会停止。而低于临界值时,传染过程会走向衰减。用网络的术语讲,如果每
个人有1个以上的朋友,则这个分支会向外生长,扩展为一个巨型分
支。如果平均朋友数小于1,网络将成为大量互不连接的小型分支与孤
立节点的集合。这与物种繁殖(再生)有着明显的相似性:如果一个社
会中每个成年人的平均子女数多于1,如此循环,社会将成长壮大。如
果每个成年人的平均子女数小于1,社会将走向萎缩。图3.2 不同平均度数的网络对比。如图(a)所示,每个节点的连接少于1的网络处于零散状
态。一旦如图(b)那样,每个节点的平均连接数大于1,就会连接成一个巨型分支:图(b)右
下方通过路径能够彼此相连的很大一群节点。每个节点的平均连接数继续稍有增加,会使几乎
所有节点被联系起来,如图(c)所示。最终导致网络实现完全的路径连通,任意两个节点都有
路径能连接起来,如图(d)所示。
我们很容易找出某个种群的再生数由于环境的关系,降低到每个成
年个体的生存后代数量低于1,使其走向灭绝或接近灭绝的例子。美洲
野牛的数量在18世纪可能超过5000万头,到19世纪末只剩下约500头。
它们的再生数在南北战争后急剧减少,因为新建的铁路线带来了更多的
猎人,也更容易把兽皮运出去。枪支的改进让猎人可以在很远距离外杀
死一头野牛,并且不会惊扰整个兽群,例如19世纪70年代开发出的“大
50式”夏普斯步枪拥有四分之一英里(超过400米)的可靠射程。大平原
印第安人评价说:这种枪是“用在今天,毁了明天”。
[2]
猎人数量的增
加,枪支的改进,每人杀掉更多的野牛,更快地把战利品运出去,让野
牛的死亡速度远远超出了繁殖速度。北美野牛的再生数量快速下跌,原有的种群在几十年里几乎被消灭殆尽。
疾病的基本再生数取决于从一个人到另一个人的传播有多容易,以
及每个人有多少人际联系。因为不是每个联系都会传染疾病,基本再生
数通常低于网络中的平均度数。再生数根据不同的病种和地点存在差
异。
埃博拉病的基本再生数(在没有医疗干预时)据估计在几内亚和利
比里亚略高于1.5,在塞拉利昂则接近2.5。
[3]
这一差异源于人口密度的
不同,它影响了人们每天平均接触的其他人的数量,塞拉利昂的人口密
度比几内亚和利比里亚高出约60%。
相较之下,麻疹的再生数比埃博拉病高得多,因为它不是通过血液
和唾液,而是由悬浮颗粒传染。根据当地的人口密度与接触频率,再生
数可达到12~18。麻疹对于未接种疫苗的人群而言非常危险。白喉、流
行性腮腺炎、小儿麻痹症和风疹等疾病的再生数介于其间,为4~7。
[4]
疾病再生数的差异对应着不同的网络环境。艾滋病毒(HIV)要通
过亲密接触才能传染。而只需要一次握手,或者在汽车或飞机上坐在咳
嗽的人附近,就能让人们染上流感。由此导致在流感传播网络中存在太
多的人际连接,而艾滋病传播网络中的连接数较少。然而这并不意味着
艾滋病不会传播,它在世界上某些地区和某些人群中的再生数远远高于
1,因此在全球的许多社群中依然相当常见。
[5]
再生数是免疫政策的核心。疫苗并不需要完全有效,或者接种到每
个个体,才能阻止疾病的广泛传播,它只需要把再生数降低到1以下即
可。接种疫苗不仅能保证接种者的安全,而且阻断了他们在传播网络中
的联系,由此降低了社会中的疾病再生数,有利于保护其他人群。假如
开始时的疾病再生数为2,每个感染者平均会传染2个人,那么只需给略
超过一半的人口接种疫苗,就会使疾病再生数低于1,从而限制疾病的蔓延。
不幸的是,人们必须给自己接种疫苗的激励,这恰恰也是许多疾病
如此难以根除的部分原因。因为存在我们熟知的“外部效应”,人们的激
励往往处于次优的水平。
[1] 有关背景可参阅Stanley(1971)。
[2] 大50式步枪因为1874年的一次战斗变得声名狼藉,大约30名野牛猎人在得克萨斯州潘汉
德镇的阿多比墙(Adobe Walls)贸易站对抗几百名科曼奇族(Comanche)、夏安族
(Cheyenne)和基奥瓦族(Kiowa)的战士。战斗第三天,一位名为比利·迪克逊(Billy
Dixon)的猎人在大约1538码之外射杀了一位印第安首领(他自称是出于运气),从而迫使印第
安人结束了战斗。
[3] 参阅Althaus(2014)。
[4] 这类高阶计算结果是从人群中的大量异质性特征中抽象出来的,学校内的再生数可能远
高于普通人群。大致测算通常是根据对较大人群长期病例数的观察,而更详细的信息则可以用
于防疫政策的设计。对我们的讨论而言,高阶数字能反映本质信息。
[5] 疾病的再生数可能在某个人群或某些地方大于1,而在其他人群或地方则不同,这依然
可能导致其蔓延到很大部分人群,并跨越边界。更详细的讨论可参阅Jackson and López
Pintado(2013)。外部效应与疫苗接种
一烛燃千烛,一烛寿未减。欢乐与人共,欢乐亦如常。
——佛陀
很容易出现的一幕是,一座位置关键的灯塔带来的好处,必然被大
量的船只分享,但因此对它们收费则很不方便。
——亨利·西季威克(英国哲学家、经济学家),《政治经济学原
理》(1883)
哲学家亨利·西季威克于1838年,即维多利亚女王登基后的第二
年,生于英国约克郡,死于1900年,比维多利亚女王早一年。他生前因
许多成就而得名,而且是最早真正精确阐述了外部效应的人之一。
[1]
西季威克在揭穿通灵学(psychics)上发挥了关键作用——包括在今天
变得更加有名的灵媒欧萨皮亚·帕拉蒂诺(Eusapia Palladino)。西季威
克还是纽纳姆学院(Newnham College)——剑桥大学第二所招收女生
的学院——的创建者。他撰写过关于道德理论的论文,帮助该学科在维
多利亚时代奠定了基础。
但对我们而言,亨利·西季威克的遗产反映在前面的引文中,他揭
示了外部效应的概念:一个人的行为会影响其他人的福利状况。
[2]
西
季威克指出,是别人修建和看护的灯塔,让往来的船只获得了好处。
我们都感受过或大或小的外部效应:某个邻居在学习鼓乐,长途飞
行中有人踢自己的椅背,身处交通拥堵之中……还有像气候变化的例子
中,外部效应甚至可以延伸到尚未出生的人,未来几代人生活的气候环
境部分取决于我们今天的碳排放水平。在熟悉这一概念后,你会注意到外部效应无所不在。这使得人们的
交往变得更加有趣,自由市场也不再是解决一切麻烦的灵丹妙药。在许
多道德伦理困境以及最为紧迫的社会和经济问题的核心当中,我们都能
看到外部效应,从言论自由到枪支管控乃至气候变化等。外部效应是人
类网络的一个基本特征,并将在本书中反复现身。
[3]
一位在机场咖啡店工作的员工注射流感疫苗,不仅能够帮助他自己
保持健康,也会给众多乘客带来好处,防止他们因为这位员工染上流感
而受到扩大传染。这位员工对疫苗接种的决策产生的外部效应会影响其
他人是否得病,但他在做出决策的时候,或许没有充分考虑对于其他人
的所有潜在影响。斯坦福大学(与其他很多组织类似)认识到了这点,希望帮助人们做出正确的决策,因此给学校员工和学生提供了免费的流
感疫苗。即使只给社群中的部分人接种疫苗,也会让整个社群受益。各
国政府就特别重视给学校的儿童、教师、医务工作者和老年人接种疫
苗,此类人群不仅特别容易被感染,也容易传播疾病。
政府深入参与接种疫苗事务并不是偶然现象。当存在外部效应时,自由市场无法把个人激励同社会整体福利协调起来。父母在权衡子女接
种疫苗的成本收益时,并不总会考虑到这会给其他人带来的更广泛的后
果。在此类市场中,给人们的行为提供补贴或树立监管规范对大家都有
利。要求儿童在入学前接种疫苗不仅是为了给这个孩子提供保护,还缘
于每个孩子是否接种疫苗会影响其他人受到感染的可能性。少数人未接
种疫苗,就可能使某种疾病获得藏身之地,并能更广泛地传播。
根除一种疾病的最大挑战在于,外部效应是在全球范围内发挥影
响。中国曾经在2000年宣布消灭了小儿麻痹症,但是到2011年又再次暴
发,病源可能来自邻国。同这种疾病的斗争已取得了巨大进步,就在
1988年时,全球还有超过100个国家深受其苦。然而,即使只剩下一个
国家继续流行某种疾病,就足以使其保持活性,并可能卷土重来,蔓延
至其他地方。让民众对看似已经消失的某种疾病保持警惕是费时费力、难度极大的。只是由于区区两三个国家失职,致使某种疾病继续潜伏,就让全球的孩子们年复一年地接种相应疫苗,这或许是极其令人懊丧的
事情。
疫苗接种政策还有负面反馈效应:疫苗接种工作越成功,疾病的威
胁越小,民众对保持警惕的激励就越低。当某种疾病泛滥时,人们会高
度关注,主动给自己接种——不是因为关心外部效应和他人的健康,而
是吓得给自己保命。人类最早的接种就是因为天花的致命暴发:在疫苗
接种法正式发展起来的几个世纪之前,中国人就从病人身上刮下少量干
掉的痘疤,通过吞食或者用抓痕渗入皮肤来获取免疫力。不过疾病一旦
退潮,人们就不再害怕,接种率随之下降。这会使疾病的再生数提高,使其可能再次暴发。
因为许多人对疫苗接种抱有恐惧(本书第7章对此将详细讨论),在疾病退潮时回避接种,上述的反馈效应可能导致强烈的周期现象。接
种率的微小变化可能导致疾病再生数的剧烈相变,加上传染网络的全球
规模,造成要根除任何疾病都非常困难,大多数传染病会随时间呈现周
期性暴发。按照世界卫生组织的说法,天花是被正式根除的唯一一种人
类疾病。最后一个有记录的病例是发生在1977年的索马里,1980年世界
卫生组织宣布该疾病已被消灭。完全消灭天花是不可小看的成就,全球
各国花费了几十年的工夫对新发现的任何病例做出快速反应,隔离病
人,并迅速给当地的民众接种疫苗。
[1] 西季威克发现在设计对社会福利水平的测算时,外部效应不可回避。早期的哲学家,包
括约翰·穆勒和杰雷米·边沁等人,在设计测算社会福利的方法时试图处理外部效应,但没能给
出清晰的表述。亚当·斯密(1776)与阿尔弗雷德·马歇尔(1890)在讨论市场效率时涉及这类
问题,但基本回避了外部效应——尽管马歇尔对西季威克及其作品很熟悉。马歇尔似乎对政府
做任何事情的能力都不够信任,他回避外部效应的议题或许并不奇怪,因为克服外部效应往往
需要采取监管、税收或其他政府干预措施。庇古是许多经济学家熟悉的与外部效应有关的名
字,他在1920年的一篇文章里直接提出了该议题。有趣的是,这或许是他对阿林·杨的评论的答
复,杨在1913年指出庇古的早期著述(Wealth and Welfare ,by
A.C.Pigou,M.A.,London:Macmillan,1912)忽略了这类效应,并建议更全面地将其纳入理论思考
(参阅Young,第676页)——我还要感谢阿罗提示我注意杨的文章。但直到20世纪60年代,随着罗纳德·科斯以及布坎南和斯塔布尔宾(James Buchanan and Craig Stubblebine)的两篇文章发
表,外部效应才真正形成现代理论(Coase,1960;Buchanan and Stubblebine,1962)。涉及这类概
念的中间研究成果还包括Frank Knight(1924)、Tibor Scitovsky(1954)等。对此的精彩介绍
可参阅Kenneth Arrow(1969)。
[2] 外部效应的这一定义是较为广泛和现代版本的,并不要求某人的行为对其他人的影响是
有意而为,并适用于所有类型的行为,从抽烟到工厂排污等。既包括正面外部效应,如有人提
出了网络安全方面的公共密钥加密创意;也包括负面外部效应,如有人在体育竞赛中舞弊。很
多外部效应是偶然的,也并非初始行为的原因,例如抽烟造成的外部影响等。但也有些情况存
在258故意的外部效应,例如有人编写软件,让别人免费试用。这使定义有些模糊,例如有人击
打他人,就并非我们想用外部效应概念表达的意思,却符合这里的定义。本书将坚持采用范围
可能过于广泛的定义,以简化叙述,并覆盖网络中可能出现的各种类型的外部效应机制。
[3] 网络环境中有多种类型的外部效应,应注意不要与特定类型的所谓“网络外部效应”相混
淆。该术语是指,例如某个人使用某项新技术所能获得的消费价值,取决于有多少其他人也在
使用该技术。网络外部效应对网络而言当然很重要,但还有其他各种类型的外部效应需要我们
关注。连通却稀疏的联系
人类网络的好消息和坏消息都在于,许多人能够良好地连通:大多
数人处于一个巨型分支之中。尽管这种连通的网络给控制疾病的蔓延造
成了挑战,但它对传播有效信息而言却至关重要,例如某个国家的残暴
政府、振奋人心的新书或电影,以及高效的新科技等。
有趣的是,社交网络可以有很好的连通,同时联系却往往很稀疏。
这似乎互相矛盾,且看下面的解释。
以脸书网站为例。根据皮尤研究中心最近的一项调查,[1]
脸书在
美国的成人用户平均有338位好友,超过一半的成人用户的好友数超过
200位。十多岁的青少年用户的好友人数更多。这远远超出了让网络走
向连通的每人一个朋友的临界值,按此标准,脸书上的社交网络应该具
有高度的连通性。事实上,在脸书超过7亿的活跃用户中,99.9%都包含
在同一个巨型分支里。
[2]
因此除少数孤立的个人与小团体外,几乎所
有的全球脸书用户都可以通过该平台上的朋友路径获得几乎任何其他人
的信息。
既然网络中的几乎所有人都处于一个巨型分支里,脸书的社交网络
怎么会联系稀疏呢?这里的“稀疏性”(Sparsity)的含义是,按理说你可
以在脸书上有7.2亿个好友,但事实上并没有。我们都知道有人在脸书
上有几千位好友(别忘了友谊悖论),但没有任何人的好友数能达到理
论上最大值的哪怕百分之一。面对几亿个可能的选择,人们平均却只拥
有几百位好友,这意味着脸书上的潜在好友成为现实的比例不到一百万
分之一。脸书网络的潜在连接里只有极小比例真实存在,因此它是极其
稀疏的。但就是这个极小比例的真实连接,已足以把几乎全部用户纳入
一个巨型分支。除了将几乎全部用户包含在一个巨型分支外,尽管脸书网络极其稀
疏,用户之间的连接路径却非常短。或许令人震惊的是,任何两位活跃
用户之间的平均距离只有4.7个连接。
[3]
这被称为“小世界”现象
(small-world phenomenon),并配有通俗演义:从匈牙利作家福利杰
斯·卡林西于1929年撰写的短篇小说,到后来的约翰·格尔的剧本《六度
分隔》(Six Degrees of Separation )。小世界现象是若干数学家在20世
纪50年代发现的许多随机网络的强势特征之一,[4]
并且是邓肯·沃茨
(Duncan Watts)于1999年发表的重要著作《小世界》(Small Worlds )
中的主角。
小世界现象由心理学家斯坦利·米尔格拉姆于20世纪60年代中期通
过实验做了精美的描述。米尔格拉姆最开始的研究对象是生活在肯塔基
州威奇塔市和内布拉斯加州奥马哈市的一些人,他给这两个地方的居民
写信,邀请对方参与一项研究,实验对象就是回信的人。米尔格拉姆要
求实验对象设法把一个文件袋送给马萨诸塞州的某个目标人。那些目标
人是他挑选出来帮助开展实验的,其中一位是股票经纪人,另一位是某
个神学院的学生的妻子。实验对象会得知目标人的姓名、居住的市镇,以及其他一些背景。给他们的指令则是:“如果你不是亲自认识这位目
标人,那就不要尝试直接联络他,而是把这个文件袋寄给……某个比你
更有可能认识目标人的熟人……这位熟人必须跟你熟到可以直呼其名的
程度。”接下来,每个收到邮寄来的文件袋的人都会看到上述指令,然
后要把自己的个人信息加入其中,并继续上面的寄送过程。
有个文件袋从堪萨斯州的一家小麦农场寄出,农场主将其寄给他家
乡的一位牧师,牧师再寄给他认识的在马萨诸塞州坎布里奇镇的另一位
牧师,此人正好认识作为目标的股票经纪人。在此案例中,文件袋从堪
萨斯的始发人出发,只用了三步就抵达了半个美国之外的目标人。
从目标人那里收回文件袋后,米尔格拉姆可以分析有多少文件袋抵
达了最终目的地,以及每个文件袋经历了多少次传递。结果表明,在内布拉斯加州发出的160个文件袋中,有44个抵达最终目的地,比例为
27.5%。文件袋所花费的传递步骤的中位数为5,分布区间为2~10,传递
步骤的平均数略高于5。
[5]
考虑到在传递过程中收到文件袋的人并不都是该实验的自愿参加
人,而只是从某个熟人那里收到邮件,他们继续寄送这些文件袋的可能
性应该比较小。因此完成任务的文件袋所占的百分比还是相当不错的。
当然,自愿参与也意味着,文件袋抵达目标人的步骤较少或许部分缘于
实验中的偏差。如果某个文件袋必须经过更长的传递路径,需要10个人
来递送,那跟只需要5个人的情况相比,就必须有两倍的人参与才能最
后成功。这会造成需要较少中间人的传递路径更容易取得成功,并反映
在最终数据里,而需要更多中间人的传递路径更容易被中途搁浅。后来
的实验矫正了这一偏差,发现传递步骤平均为10,是米尔格拉姆的结果
的两倍,但依然是个较小的数字。
[6]
该实验的结果非比寻常,不仅因为花费的传递步骤之少,还表明尽
管人们并没有任何网络地图来指引自己如何递送,但依然有如此多的文
件袋被送达最终目的地。联系马萨诸塞州的一位股票经纪人,或者像后
来的实验那样,联系北京的一名学生、伦敦的一位水暖工……你正好知
道自己与目标人之间在网络中的最短路径的概率可谓微乎其微。因此,许多文件袋通过相当短的路径就能送达这一事实表明,不仅存在这些较
短的路径,而且在任意两个人之间很可能都存在许多条较短的路径,此
外人们很清楚该如何高效地实现传递。至于人们如何能够在网络空间中
顺利导航,我们将在第5章再深入探讨。
社交网络可以非常稀疏,仅实现了不到百万分之一的可能连接,却
依然只需要短短几个连接就能让任何人到达数亿用户中的其他任何人,这究竟是如何做到的?
[7]
我们依然用脸书的社交网络为例,选取一位
名为戴安娜的普通用户。由于普通用户有几百位好友,我们取平均数,假设与戴安娜至少有偶尔交流的大约有200位好友。
[8]
接下来我们计算她的二度朋友的人数,即通过两个连接可以到达的人。假设戴安娜的每
个朋友也各有200位好友,且都不在她自己的好友的行列。
[9]
那么仅走
出两个连接路径,我们就能够到达4万名用户(=200×200)。如果继续
下去,我们将在第三步到达800万人,在第四步到达16亿人,这已经超
出了脸书网站的全部人群的规模。还有,大多数用户是在后面几步抵达
——说明大多数用户之间的连接距离为4或5。这个简单推导能让我们明
白,为什么社交网络中人们的相互距离会如此之短。
[1] 参阅Pew Research Center Internet Project Survey,2013年8月7日到9月16日,http:www.pewresearch.orgfact-tank20140203what-people-likedislike-about-facebook。
[2] 参阅Ugander、Karrer、Backstrom and Marlow(2011)。
[3] 参阅Backstrom、Boldi、Rosa、Ugander and Vigna(2012)。
[4] 最早的数学研究是Ray Solomonoff and Anatol Rapoport(1951),继而在20世纪50年代
后期到60年代早期由数学家在奠定随机图理论时做了更深入的研究,参阅Paul Erd?s and Alfréd
Rényi(1959,1960)。另外的更不为人知的独立研究成果包括Edgar Gilbert(1959)。
[5] 更详细的后续研究参阅Travers and Milgram(1969)。
[6] 参阅Dodds、Muhamad and Watts(2003)。
[7] 这一问题的答案很重要,但此处只是介绍了其基本思想。更详细的讨论和数学细节,可
参阅Watts(1999)和Jackson(2008)。
[8] 更普遍地说,在脸书网站外,对某人认识的人(指在过去两年有过联系并能相互联络)
的数量的估计差异很大,根据估计采用的技术和样本,其上限约为数百人到数千人。可参阅
McCarty、Killworth、Bernard and Johnsen(2001),McCormick、Salganik and
Zheng(2010)。
[9] 如果考虑到友谊悖论,可能连接到更多的朋友。若考虑到戴安娜的朋友可能彼此也是朋
友的比率,则会降低连接到的人数。因此这里的估算基本上是正确的。对数学感兴趣的读者而
言,这种简化计算有两个问题。第一是我们高估了相邻点扩张的速率,因为不是每一步到达的
每一个朋友都是“新”朋友,有人在之前已经到达了。例如,某个用户的朋友的朋友也是该用户
的朋友。如果戴安娜与艾米丽和丽萨是朋友,那么在走出长度为2的连接路径时,如果艾米丽和
丽萨也是朋友,由于她们已经包含在戴安娜的200位朋友之中了,她们在第二步连接中就不应该
重复计算。所以,计算每个人每一步有200位朋友,通常会包含部分重复统计。但即使我们做个
较为保守的近似计算,把每一步连接到的新朋友的数量减半,降为100,那么在四步连接后依然
能得到:200×100×100×100=2亿。更准确的模拟可以假设开始阶段连接到的新朋友数量较多,之后减少,但通常大多数新朋友还是在最后一步出现,因为大多数人是在最后一步才能到达。
到第五步,我们能到达7.2亿人。由此可以理解为什么学者的研究发现任何两位活跃用户的平均距离为4.7(Ugander Karrer、Backstrom and Marlow,2011)。简化计算的第二个问题是假设每个
朋友在下一步会带来相同数量的新朋友,但人群中有着巨大异质性,有人可能有500位新朋友,有人几乎没有。在巨大网络和平均度的影响下,这种差异基本可以抵消。相关的网络模型研究
可参阅Erd?s and Rényi(1959,1960);Jackson(2008b)等。即使对于脸书网站这样丰富和全球
化的网络而言,大数定律依然适用,忽略个体差异的近似计算能得到非常准确的结果。我们不断缩小的世界
朝圣者并不知道,但他们正走进墓地。
——查尔斯·曼恩(美国记者、作家) [1]
我们把当今世界的社交网络同中世纪的社会做个对比。假设当时的
朋友数不是200人,而是5人,我们再来做与以上同样的计算。在四个连
接步骤后,我们将到达大约625人(5×5×5×5=625),而非16亿人。为
连接当时地球上的全部人口可能需要12步,而非4~5步。
[2]
不过,中世纪的世界依然是大致连通的——即使朋友数只有几个,也远远超出再生数为1的临界值。而且中世纪的社会也具有小世界特
征。从一个人到另一个人需要12步或者更多的连接,这大于现代社会的
4~5步,但与当时生活的数亿人口相比,仍然是个很小的数字。中世纪
时更远的网络距离,确实导致病菌或思想的传播比我们今天更为缓慢和
分散。然而那时的世界依然有足够好的连通性,能够实现远距离的传递
和感染。这点反映在一长串的疾病中,它们的不断暴发使人类的生存始
终处于应战状态。
[3]
一旦数十万人开始加入全球旅行,世界就会看到非常快速和致命的
传染病。这方面一个令人惊恐的例子是1918—1919年的流感季,那季暴
发的流感属于尤其恶劣的类型:对年轻人和原本较为健康的人群特别致
命,因为流感会造成过度的免疫系统反应,从而导致受感染者的死亡率
超过10%。这种疾病后来被称为“西班牙流感”,其实是污蔑了西班牙。
西班牙人在报告感染率和死亡率上做得很准确,而其他国家则是为了维
持1914—1918年的毁灭性世界大战后的斗志,而压制了流感的相关信
息。
[4]
它们的新闻报道让人以为传染病是来自西班牙,实际上在当时已经广为传播。流感在当年蔓延的关键与战争结束、导致全球范围出现
大量军队调动有关。许多士兵居住在拥挤的地方,并参与长途旅行。此
外,这次的疾病带有两个使其能通过人群快速和广泛传播的特点。其一
是该流感能通过很小的液滴传播,当某个人打喷嚏或咳嗽时,这些液滴
会形成空气传播,从一个人传到超过一米之外的其他人,也能残留在物
品表面,然后被别的人接触。其二是人们可以在一周以上保持传染性,有时始于症状出现之前,晚于症状消退之后。流感的毒性、疫苗的空缺
以及大量人员的全球移动结合起来,造成了历史上最大规模的流感暴发
之一以及非常致命的后果。这场流感大约传染了5亿人,约为全球人口
的三分之一,比欧洲的全部城市人口多得多,在各国总计夺走了5000万
~1亿人的生命。
这个案例还表明,人类网络的连通性不是固定不变的。当年的大规
模军队调动非比寻常,造成了比之前年份更强的小世界现象。除人类迁
移的偶然的剧烈变化以外,人与人之间如何交流还存在强烈的季节性特
征。例如学校的开学季会造成多种疾病的激增,对该现象的首次记录是
在1929年,由研究若干疾病随时间波动的统计学家赫伯特·索珀完成。
他注意到格拉斯哥的麻疹暴发模式或许可以用学季来解释。学校开学期
间,对各种疾病缺乏免疫力的许多孩子相互接触,造成当地的人际网络
的连通性很高。相反在学校放假期间,当地的连通性大幅下降。不过,休学期间的出行距离加长会导致远程的连通性提高。
[5]
因此,人际互
动网络根据季节可能发生多种变化。用于预测疾病传播(尤其是流感
等)的现代流行病学模型就考虑到了学季、旅行模式、同医务工作者的
往来,以及影响传播网络连通性的其他很多因素。
谈及传染病输入的致命性,莫过于天花、麻疹、斑疹伤寒以及流感
对美洲人的影响。据估计,这些疾病最终可能杀死了超过90%的土著人
口。
[6]
美洲本土人群的人口密度与交流程度各不相同,因此疾病的危
害用了较长时间传播。在墨西哥,天花随着一艘来自古巴的西班牙船只于1520年抵达,几
年内就摧毁了阿兹特克帝国的大多数人口。不到十年,天花又消灭了南
美洲的印加帝国的多数人口。各种传染病此后还将横扫北美洲,杀死东
海岸和中西部肥沃地带的居住密度较高的大量人群。而北美洲的某些更
边远、人口密度较低的地区,要在一个世纪之后才被传染上,但没有人
躲得过去。就在来自英国的清教徒移民抵达前几年,他们将登陆的新英
格兰沿岸部分地区的美洲印第安人遭到了疾病的重创,对土地和资源的
争夺大为减轻,朝圣者因此得到了好得多的生存机会,而不用面对几年
前还密集得多的本土人口。
最后一些被传染病杀死的人是夏威夷的本土人群,直至19世纪,他
们才最终被外人造访,然后遭到欧洲人的疾病的反复重击。卡美哈梅哈
二世国王与卡玛玛鲁王后前往伦敦去谈判条约的旅程导致了他们及大部
分随员的死亡。他们在参观到处是士兵子女的皇家军事庇护学校
(Royal Military Asylum)时染上了麻疹。
[7]
这一病魔最终将在1848年
搭乘来自墨西哥的美国海军护卫舰“独立号”(Independence)前往夏威
夷的希洛。
[8]
百日咳与流感也将在同年冬天来到夏威夷,与麻疹一起
掀起一系列流行病,最后杀死约四分之一的本土人口。在人口普查中,那年被称为“死亡之年”。当地社会尚未恢复,天花又在1853年随着从旧
金山来到火奴鲁鲁的另一艘船只“查尔斯·马洛里号”入侵。人们以为对
这艘船已做了有效的隔离检疫,然后才起航,却还是带来了疾病,在数
月内造成当地数千人死亡。当库克船长于1778年首次来到夏威夷时,有
人估计当地的人口超过30万。而在1900年人口普查中,本土夏威夷人已
不足4万。
现代医疗已极大提升了我们对传染病以及卫生和免疫重要性的认
识,并减轻了多种疾病的日常威胁。尽管距离消灭传染病尚有很长的
路,但在世界变得越来越密切相连时,人类仍能成功生存,这已是非凡
的成就。工业化社会典型个人交往的其他人的数量比几个世纪前高出若
干数量级,尤其是我们通常依赖其他许多人为自己提供食品和卫生服务。此外,现代旅行意味着许多交往是在远距离发生,任何一天,都有
数十万人在跨国旅行。因此许多疾病的潜在传染网络与图3.1所示的高
中生关系网相比有三个显著差异:更为密集,几乎所有节点都包含在巨
型分支中,节点之间的平均距离更短。这意味着许多传染病在今天的传
播可能会比几个世纪以前更迅速、更广泛,而它们曾在当时一再杀死过
千百万人。我们只能寄望于科学与新疫苗的发展速度继续快于新病种的
出现和人类网络连通性的增长。
[1] “A Few Things You(Probably)Don't Know About Thanksgiving,”Becky Little,National
Geographic ,2016年11月21日。
[2] 更多的对比可参阅Marvel、Martin、Doering、Lusseau and Newman(2013)。
[3] Cesaretti Lobo、Bettencourt、Ortman and Smith(2016)指出,中世纪城市在社会和空间
结构上同现代城市有许多共同特征。但中世纪的人口与现代相比城市化率低得多,旅行也少得
多。更多内容可参阅Ferguson(2018)。
[4] 参阅Valentine(2006)。
[5] 详细讨论可参阅Altizer et al.(2006)。
[6] 参阅Jared Diamond(1997)。
[7] 参阅Shulman、Shulman and Sims(2009)。
[8] 参阅Schmitt and Nordyke(2001)。中心度与传染:人气度的不利一面
我们在讨论测量中心度和影响力时提到的友谊悖论,对传染和扩散
也有影响。在人们的朋友名单中被过分代表不但能给你带来较高的影响
力,也伴随着较高的风险暴露。因此,如果你有时对某个朋友的高人气
感到嫉妒,其实也有可聊以自慰的地方。人气最高的人可能是首批听到
新消息的,但也可能是首批暴露给新的传染病的。
这方面一个声名狼藉的案例是加拿大的航班服务员盖尔坦·杜加
斯。美国疾病控制中心的一份研究发现截至1983年,在当时已知的248
名艾滋病毒感染者中,有40人曾与杜加斯发生过性接触。很多人认为杜
加斯是“零号病人”,纷纷指责他造成了艾滋病在后来的大流行。
[1]
但
根据更多数据从事后来看,我们弄清楚了艾滋病在20世纪60年代就已经
进入美国,很可能是来自海地——那里的病例则来自更早的发源地非
洲。所以即使没有这位私生活混乱的航班服务员,艾滋病也会在全球牢
牢扎根。但不管怎样,杜加斯促成了最引人注目的一场早期暴发。
与之类似,据估计在塞拉利昂的一次埃博拉病暴发中,有超过一半
的病例可能是由3%的感染者传播的。同样,即使没有这些联系广泛的
人,疾病依然可能暴发。只是这批人更容易暴露给疾病,并会加速传
播。
[2]
要弄清楚具有较高度数的人为什么对传染病并非必不可少,我们只
需看一个网络案例。再回到图3.1,我们看到有个庞大的巨型分支,但
网络中度数较高的人却非常少:只有一个人的度数为7,一个人的度数
为6,几个人的度数为5,绝大多数节点的度数都是1或2。
这点尤其需要强调,因为人们对此有个常见的误解。网络要实现连通、传染或扩散,枢纽和关键连接点并不总是必须的。这类节点更容易
被卷入,并可能导致早期的暴发,但在连接最多的节点未加入时,许多
传染也会发生。如果删除高中恋爱网络中几个度数最高的节点,我们可
能会把几个小分支从巨型分支中拆分出来,但总体图景依然大致完好。
在巨型分支中酝酿广泛传染的基本驱动力是网络总体的平均度。在许多
人际网络中,是大多数人的度数高于1的倾向使疾病传染和信息扩散变
得无所不在。
当然,度数较高的人更容易被感染,能够加速传播,在正处于相变
阶段的网络中可能造成重大影响。更重要的是,如果有人需要找到影响
最大的节点,他应该从最中心的节点开始。度数较高的人受感染的风险
较高,这一认识为分析疾病的自然传播提供了新的指导。
例如,斯蒂芬妮·戈弗雷同她在澳大利亚和新西兰的同行研究了壁
虱和螨虫在大蜥蜴——生活在新西兰的一种爬行动物——种群里的分布
情况。
[3]
大蜥蜴的原名来自毛利语,意指它们的背脊。这种动物非常
有意思,并非真正的蜥蜴,而是喙头目动物(Rhynchocephalia)留下的
后裔,而该目中的其他物种早在6000多万年前的白垩纪末期就与许多恐
龙一起灭绝了。大蜥蜴在头顶有第三只“眼睛”,并非用于视觉,而可能
是通过吸收紫外线来调节新陈代谢。这种动物的生活非常孤独,大多数
时间都在自己领地内进食昆虫,偶尔还有鸟蛋或青蛙,然后晒太阳。至
少就某些标准来看,日子过得还算不错。图3.3 大蜥蜴 [4]
尽管生性孤僻,大蜥蜴的领地还是存在重叠,偶尔会彼此接触——
当然它们的繁殖也要求有接触。大蜥蜴是一种壁虱的宿主,壁虱身上带
有一种对大蜥蜴有害的血液寄生虫。此外大蜥蜴还容易感染一种螨虫。
从网络视角看,有趣之处在于壁虱在离开宿主后不能长期存活,它在大
蜥蜴之间的传播要求宿主之间有密切接触,对交际网络有着很高的依赖
性。相反,螨虫则可以不依赖大蜥蜴而存活,不太依赖宿主的密切接触
来传播。
戈弗雷与她的同行跟踪了斯蒂芬斯岛上的许多大蜥蜴,描绘出了它
们的运动轨迹和领地。这些领地有着差异悬殊的分布模式,某些大蜥蜴
只与另外一只的领地有重叠,其他一些则居于更中心的位置,同十只甚
至更多同类的领地有重叠。这个指标反映着它们的中心度:每个个体有
机会与多少同类接触。戈弗雷与同行接下来要数清大蜥蜴身上有多少壁
虱(你的夏天是怎么度过的?),发现大蜥蜴的中心度与它身上有多少
壁虱以及相关的血液寄生虫的数量存在密切而显著的相关关系。由于壁
虱需要靠交际网络在大蜥蜴之间传播,有着较高度数的个体自然面临较
高的感染风险。有趣的是,研究者没有在能离开大蜥蜴存活的螨虫身上
发现类似的相关关系:网络对螨虫的传播并非必要,中心度对感染率不
起什么作用。
[5]学者对很多物种开展过此类分析,包括人类在内。
[6]
尼古拉斯·克
里斯塔基斯与詹姆斯·福勒分析过哈佛大学的哪些学生最早感染流感。
[7]
他们监控了两个群体:一个群体的数百名学生是从样本中随机挑
选,另一个样本的数百名学生则是由其他人提名的朋友。从友谊悖论可
以知道,比起随机挑选的学生,被别人作为朋友提名的学生应该有更高
的度数。事实上,研究者确实发现:被其他人作为朋友提名的学生染上
流感的时间比随机群体平均早两个星期。人气度的确有不好的一面。
[8]
[1] 参阅Randy Shilts的著作And the Band Played On (1987)。
[2] 参阅Lau et al.(2017)。
[3] 参阅Godfrey、Moore、Nelson and Bull(2010)。
[4] 图片来自BarbulatShutterstock.com(Vectorstock),有授权。
[5] 这里可能有其他因素与度存在关联,例如大蜥蜴的领地大小,或许与该动260物染上壁
虱的概率有关。在缺乏可控实验时,我们不能排除所有其他可能的解释,但螨虫感染与度不存
在相关,却与领地和身体大小存在相关的事实,能支持我们的解释。
[6] 参阅Godfrey(2013)。
[7] 参阅Christakis and Fowler(2010)。
[8] 度数较高并不总是对传染有害。Duboscq、Romano、Sueur and MacIntosh(2016)发
现,社会交往较多的日本猕猴身上的虱子数量较少,而且是一种季节现象。猕猴之间的一个重
要社会交往是彼此梳理毛发,帮助清除对方身上的虱子卵——真正的友谊不过如此。因此社会
交往不只会造成虱子传播,也会帮助将其清除。度数较高意味着让其他猴子梳理的次数更多,虱子数量因此下降。人类网络的变动与传导性
2009年,一种高致命性的新型流感——H1N1病毒——在世界上传
播,它是1918年给人类造成巨大生命损失的西班牙流感的近亲。
同那个夏天飞往北京的其他所有人一样,我抵达时需要通过一台体
温测量仪的检测。中国不是对旅客做筛查的唯一国家,还有几十个国家
也对旅客进行检查,并要求填写表格,报告所有的症状。被视为感染的
人将被拒绝入境或进行隔离,人类网络针对疾病做出了改变。
在某些情况下,旅行限制和警告会造成极其昂贵的成本。墨西哥在
2009年最早发现部分H1N1型流感病例后,当年春天发布的许多旅行警
告提及该国,这导致2009年春季后期进出墨西哥的旅行人数下降了约
40%。对于一个把旅游业作为重要产业的国家,如此剧烈而大幅的旅客
减少使其深受打击。
事后来看,通过仔细分析旅行网络以及流感病例在全球出现的时间
和地点,我们会发现旅行模式的改变对阻止流感传播收效甚微。旅行模
式改变让疾病传播推迟了几天。
[1]
但即使是对旅客筛查最严格的国家
也仅仅使流感在其境内的广泛传播推迟了7~12天,并没有阻止不可避免
的传染。
[2]
环球旅行在今天已极为普遍,即使削减其中很大一部分,并尽可能
地拦截感染者,对流感的传播也只有很小的改变。我们可以把这种策略
理解为在全球网络中砍掉部分(而非全部)数量众多的远距离连接,它
对于真正削减流感的再生数起不了多大作用。当然,这并不是说在流感
暴发期间人们不能通过回避旅行来维持健康。如果你愿意在流感季节躲
在遥远的山间小屋,你个人感染流感的机会基本可以消灭掉。但阻止较大人群的出行活动在经济上是不切实际的。
隔离检疫有时甚至会造成灾难性结果,尤其是在传染被深入了解之
前。早期对于小儿麻痹症暴发的应对能说明这一点。这种疾病至少在古
埃及时代就已出现了,历史上的被感染者包括许多著名人物,从罗马皇
帝克劳狄一世到沃尔特·司各特爵士(Sir Walter Scott)等,但其暴发是
相当随机性的。小儿麻痹症成为更大型的传染病是在1910年前后的欧
洲,然后在1916年夏季的纽约出现了大规模的剧烈暴发。当时对该疾病
的认识严重不足:儿童可能在晚上正常入睡,第二天早上醒来时就不能
走路了。
这种病非常可怕,很自然带来了恐慌。小儿麻痹症的传递路径是从
感染者的排泄物到其他人的口腔,因此靠近儿童的露天排污管是个致命
的组合。而当时关于该疾病的各种理论导致人们杀掉了约八万只猫和
狗,另外还归罪于蚊子、水银、臭虫和其他许多东西。纽约的首批病例
大部分碰巧是意大利人,于是某些意大利居民受到隔离。隔离导致卫生
状况恶化,更多的孩子受到感染,由于其他原因发烧的孩子与患上小儿
麻痹症的孩子被关在一起,后果极其致命。
[3]
这不是说改变网络中的接触模式从来不是有效策略。例如对于基本
再生数小得多的埃博拉病,在早期确认疾病暴发并限制人员进出,确实
起到了效果。还有个有利之处是,这些疾病往往是暴发在出行率比较低
的地区,限制塞拉利昂的某个村子周围的出行,与试图切断北京、伦
敦、纽约或墨西哥城的人员进出是完全不同的。多项研究认为,能有效
控制大型流感传染的办法只包括接种疫苗、隔离受感染者(确保他们留
在家中或诊所,直至不再具有传染性),以及在某些病例中使用抗病毒
药物,以缩短感染期,降低传播概率。
[4]
这些办法都能显著降低流感
的再生数,效果颇为突出。
关键之处在于,网络对于在其连接上传递的事物会做出改变和响应。在疾病或金融困境等危险传染物蔓延时,人们的反应是感到害怕,切断联系,孤立自己的节点,龟缩起来。与之相反,在听到某些重大消
息以后,人们会积极地相互联系,增加网络的稠密度,加快喜人信息或
猥琐流言的传播。充分理解网络的传染特征需要我们认识到网络是动态
的实体,并经常会对传染做出反应。本书第7章和第8章还将回到这方面
的概念上,探讨技术普及、教育投资决策以及社会学习等话题。在这些
过程中,人们的行为方式将取决于其他人的行为以及网络的状态。
[1] 参阅Bajardi et al.(2011)。
[2] 参阅Cowling et al.(2010)。
[3] 参阅Donald G.McNeil Jr.,“In Reaction to Zika Outbreak,Echoes of Polio Global Health,”The
New York Times ,2016年8月29日。
[4] 参阅Ferguson et al.(2006)。收集思想
在现代社会,我们的很多网络是连通的,而且无论好坏,你和大多
数人共同处在巨型分支当中。我们经常染上流感和其他传染病,也参与
最新消息和流言蜚语的传播。有些新闻想不知道都几乎不可能。
作为一种消遣方式,有群人给自己设立了一个挑战:保持极少的人
际往来,成为最后听说某条新闻的人。这项挑战的正式名称是“在美国
最后知道谁夺得了超级碗的人”,其参与者自称“消息躲避人”,因为他
们要尽量避免被人告知谁赢得了当年的超级碗。游戏是基于大家的信
任,目标是尽可能长时间地不要获知超级碗冠军的归属。
[1]
然而这条
信息的传播过程很难逃避,首先,有三分之一的美国人从一开始就
被“谁获得了超级碗”的消息“感染”了,因为他们直接观看了比赛。其
次,这是条热门消息,不仅是比赛后几天里热议的话题,还是许多新闻
媒体的头条报道。
避免听说热门消息其实是项艰巨的挑战:要求努力改变我们的习
惯,避免接触大量的媒体、谈话和人物。挑战的一个有趣之处在于,参 ......
[美]马修·杰克逊 著
余江 译
中信出版集团目录
引言
第1章 引言:网络与人类行为
更多的事情在改变
亿万人构成的网络
第2章 权势和影响力:网络中的核心位置
人气度:中心度
对比
关键是你认识谁——大海捞针
小额信贷的扩散
传播中心度
美第奇家族的崛起:人际网络的早期案例
“教父效应”:中心度带来中心度
网络中的影响力和权势的分类
第3章 扩散和传染
传染与网络结构
相变与基本再生数
外部效应与疫苗接种
连通却稀疏的联系
我们不断缩小的世界
中心度与传染:人气度的不利一面人类网络的变动与传导性
收集思想
第4章 密而不能倒:金融网络
对一场全球金融危机的解剖
金融传染的特殊之处何在?
自由市场与外部效应
监管
爆米花还是多米诺?
告别没有驾驶仪的飞机
第5章 同质性:人以群分
种姓制度
同质性
位置,位置,位置
谢林的洞见
导致同质性的更多理由
同质性的某些启示
同质性在我们的日常生活中
第6章 社会固化与不平等:网络反馈和贫困陷阱
社会固化
固化,不平等,“了不起的盖茨比曲线”
不平等
教育
通常的嫌疑人:机构和资本
工作网络与社会资本反馈与行为模式的持续差异:社会中的拔河现象
摆脱:网络分隔、社会固化与不平等现象
第7章 集体的智慧及愚蠢
集体的智慧
改变中的新闻版图
极端化:同质性的后果
人类面临的挑战
第8章 我们的朋友与局部网络结构的影响
蚂蚁与旅鼠
羊群效应、银行挤兑与集体迷失
博弈论与互补性
聚集现象与复杂传染和扩散
信任与加持
关系
社会嵌入性
要了解自己,得看清朋友
第9章 全球化:变化中的人类网络
网络的形成
贸易网络:要贸易,不要开战
连线:同质性与极端化的加剧
破坏性
更多的变化
参考文献致谢
版权页引言
献给萨莉和哈尔第1章 引言:网络与人类行为
导读
◎移动互联与社交媒体让我们的世界小到“尽在掌握”,但在技术
革命背后,传播消息和情绪的最终还是人与人构成的网络。
◎一沙一世界,一个小学班级的家长群可能构建的朋友关系网络,其数量竟然远超过宇宙中的原子总数。
◎与随机网络不同,人类网络有着极其普遍却令人吃惊的各种特
征。除身边的亲朋好友,整个社会和经济往来都属于“人类网络”,归
根到底是人与人的交往。
◎你的网络,就是你的命运。更多的事情在改变
在1492年左右开始的全球化1.0阶段,世界从大尺度走向中等尺
度。在给我们带来跨国公司的全球化2.0阶段,世界从中等尺度走向小
尺度。到2000年左右的全球化3.0阶段,世界从小尺度走向微型化。
——托马斯·弗里德曼(《世界是平的》作者),接受《连线》杂
志采访
2010年12月17日,26岁的街头小贩穆罕默德·布瓦吉吉在突尼斯中
部一座尘土飞扬的小城西迪布济德自焚。他以这一行动,向二十多年统
治期间反复镇压各种反对派的极权政府表达绝望和愤怒。布瓦吉吉的家
人长期以来直言不讳地批评政府,他因此频繁遭受当地警察的骚扰。当
天早上,警察又公开羞辱他,并没收了他的货品,这成为压垮他的最后
一根稻草。布瓦吉吉往自己身上倒满汽油,纵火自焚以示抗议。
如果是几十年前,这一故事的结局也就是爆发数千人参与的抗议。
西迪布济德以外的人甚至很少会知道那里发生了什么事件。然而这次,布瓦吉吉自我牺牲后引发的各种视频却不可阻挡地通过社交媒体快速传
播,并被广泛报道。事发几周前,维基解密网站曾曝光有关的机密文
件,突尼斯和其他国家进行镇压的消息已在网上疯传。随后爆发的“阿
拉伯之春”运动也正是依靠脸书和推特等社交媒体与移动电话,才得以
发动并组织起来。
[1]
尽管这些通信手段是现代的,但传播消息和愤怒情绪的最终还是人
类网络。新的特点在于消息传播的广泛和迅速,以及人们可以联合做出
响应。要理解究竟发生了什么,我们仍需弄清楚消息如何在人们之间传
递,还有人们的行为如何相互影响。由此爆发的浩大而激烈的抗议行动让突尼斯政府在2011年1月中旬
倒台。动荡波及邻近的阿尔及利亚,并在接下来的两个月里蔓延到阿
曼、埃及、也门、巴林、科威特、利比亚、摩洛哥、叙利亚,甚至沙
特、卡塔尔和阿联酋。“阿拉伯之春”运动的成败有待讨论,但抗议运动
在这片地区如此快速蔓延非但在历史上没有先例,而且凸显了人类网络
在我们生活中的重要地位。
正如上文引述的托马斯·弗里德曼的访谈,随着人类的通信手段在
近来发生的巨大变革,这个世界比以前缩小了很多个数量级:传统纸
媒、信件邮递、海外旅行、火车、电报、电话、收音机、飞机、电视、传真机……互联网技术与社交媒体不过是关于人类在何种距离、以何种
速度、与何人交流的漫长进化史的最新篇章。
虽然人类之间的交流网络正在改变,但其中的许多部分却是持久并
可预测的。理解人类网络及其变化过程,可以帮助我们回答有关当今世
界的很多问题,例如一个人在网络中的位置如何决定他的影响力和权
势?根据来自朋友的信息形成自己的观点,会让我们陷入哪些系统性的
错误?金融市场的传染现象是如何形成的,为什么不同于流感的蔓延?
我们社会网络的割裂如何导致了不平等、社会固化与两极分化?全球化
正在如何改变国际冲突和战争?
尽管人类网络在回答上述问题时起着关键作用,但人们在分析重要
的政治和经济行为与趋势时,却往往将其忽视。这不代表我们没有研究
过人类网络,而是我们对网络作为人类行为的驱动力的科学知识同大众
和决策者的认知之间存在缺口。本书的目标正是要缩小这一缺口。
本书的每一章都将展示人类网络如何改变我们对问题的思考,全书
的主题是网络如何促进我们对各种社会和经济行为的理解。
有几种关键的人际关系特征在发挥重要作用,因此本书讲述的内容
不只是强调一种理念。读完全书后,你会更充分地认识到自己所处的网络在多个方面的重要性。我们的讨论还将出自两种不同视角:一种是关
于网络如何形成,以及为什么展现出某些关键的特征;另一种则是关于
这些特征如何决定我们的权势、观点、机遇、行为和成就。
[1] 有关社交媒体与通信联络在卷入“阿拉伯之春”运动的各国中的作用,可参阅Brummitt、Barnett and D'Souza(2015)。亿万人构成的网络
生活其实很简单,但我们非要让它复杂化。
——无名氏 [1]
卡尔·萨根(美国天文学家和科幻作家)在他关于宇宙的名著中谈
到,我们的宇宙中存在亿万颗恒星。据估计,目前宇宙中可观测到的恒
星数量达到了300×10007 ,即300000000000000000000000颗。这个数字
听起来匪夷所思。像我一样,你或许也会因此感到自身的渺小卑微,对
大自然充满敬畏。
然而神奇之处在于,比起一个小小的社群——如一间教室、一家俱
乐部、一个团队,或一家小公司的员工——之中可能存在的各种朋友关
系网络的数量,以上数字却微不足道。不可能吧?你会质疑,怎能得出
这样的结论?
我们假设有个30人构成的社群,例如学校里某个班级的家长。从中
选出任何一位来,比如莎拉。我们设想,她在这个社群里经常交谈的人
或者可以求助的人,都视为她的朋友,那么,莎拉有可能与其他29人结
为朋友。再看第二个人,比如马克,除去同莎拉的朋友关系外,他还可
以与其他28人结为朋友。照此推算下去,在这个小社群中可以结为朋友
的两两组合的数量为:29+28+27+…+1=435。朋友关系看起来并不太
多,却可能由此构筑起数量极其庞大的人际关系网络。
假如这个社群完全无法交流,没有人成为其他任何人的朋友,我们
将会得到一个“空”网络,不存在任何朋友关系,所有435个可能的朋友
关系都没有实现。假如这个社群非常和睦,我们则会看到另一个极端,一个“全”网络,每个人都是其他任何人的朋友。在以上两种极端情形之
间有大量的网络类型。或许第一组配对的人彼此是朋友,第二组不是,第三组和第四组是朋友,第五组和第六组不是,等等。为计算出所有可
能的朋友网络的数量,我们可以把每一组潜在的朋友关系标记
为“是”或“否”,即存在两种可能性。因此,可能的朋友网络的数量将等
于:2×2×…×2,共计435个项的乘积。435次翻番的结果大致等于1后面
加上131个零,而之前提到的恒星总数只有23个零。
[2]
因此,该社群中
可能出现的朋友网络的数量将是宇宙中恒星数量的许多倍,事实上,它
比我们估计的宇宙中所有原子的数量还要多出很多数量级!
[3]
即使在30人的范围内,也已经难以用任何系统性的方法来标记如此
众多的网络。在动物分类中,当人们提到“斑马”、“熊猫”、“鳄鱼”或
者“蚊子”时,我们很清楚他们指的是什么。然而除了少数特殊类型以
外,我们并不能用这类办法来描述人类网络。当然这不是说我们对其束
手无策,而是强调理解社会的构成是非常复杂的任务。
对动物的分类和识别,我们可以借助某些特征:是否有脊椎?有多
少条腿?是草食性、肉食性还是杂食性?是否胎生?成年后体型多大?
皮肤属于何种类型?能否飞行?是否在水中生活?……在对人类网络分
类时,我们也可以识别出某些关键特征。例如,我们可以通过现有的关
系区分网络,这些关系是较为均衡地分布在人群中,还是能看出某些隔
离模式。另外,此类特征将帮助我们理解若干重要议题,如经济不平
等、社会阶层固化、政治极端化,乃至金融传染现象等。
借助人类网络的研究来理解人类的行为是可行的,有如下几方面的
理由。首先,人类网络的几个主要特征对于人的行动原因有深刻的解释
力。其次,这些特征是简单、符合直觉、可以量化的。再次,人的行为
表现出的规律会导致带有某些特征的人类网络:很容易分辨是这些人形
成的有规律的网络,还是通过随机联系形成的、并不依赖周围的其他联
系或节点的网络。例如,我们可以看看图1.1所示的两类人类网络:图(a)是某所高
中的学生之间的亲密朋友关系网络(其细节将在本书第5章介绍);图
(b)是有着数量相同的节点和联系,却完全由计算机随机生成的网
络。
以上两个网络有哪些显著差异?只需仔细观察,你就能窥见一二。
其一是这所高中的不幸之处,有十来个学生没有亲密的朋友,而随机网
络中所有的节点都存在与其他节点的联系。其二更令人吃惊,却又是人
类网络的普遍特征:具有高度分隔性。网络上半部分的学生很少与网络
下半部分的学生结为朋友,而随机网络中的联系则无序地指向所有方
向。
在把这些高中学生的种族因素加入,形成图1.2后,网络的分隔特
征将变得更为明显,也更能说明问题。图1.1 人类网络与随机网络
这种分隔是人类网络的主要特征之一,对之后的论述有着重大影
响。下面将会看到,就我们为什么会形成有这种特征的网络,既有显见
的解释,也源自某些微妙的理由。归根到底,我们关注这些网络及其特
征是因为它们的影响,因此到本书结尾处读者会明白,为什么在高中的
人际网络中出现此类分隔会对上大学的决策产生深刻的影响,却跟流感
的传染基本没有关系。图1.2 带有种族标记的高中学生网络。带花格的节点是“黑人”(学生自己认同的身份),灰
色节点是“白人”,剩下的少数节点为“西班牙裔”(黑色节点)或者“其他未知”(白色节
点)。 [4]
对人类网络的科学研究除了对我们生活的方方面面有密切的重要意
义外,还是个引人入胜的领域,部分原因在于它跨越了多个学科:理解
人类网络需要依靠来自社会学、经济学、数学、物理学、计算机科学与
人类学等学科的核心概念和研究成果。
[5]
例如,我们的讨论将大量借
助经济学中的外部效应概念,即人们的行为会给周围的人带来影响,并
加上各种形式的反馈以放大这种效应。这些现象是许多复杂系统的共同
特征:设定的条件便于描述和理解,但系统的特征和行为却可以非常丰
富。
我们的讨论还将远远超越个人的亲朋熟人的关系网,甚至涉及国家
之间的条约和银行之间的合同等关系。但我们考察的整个社会和经济往
来最终都属于“人类网络”,因为它们都会在某个层面涉及人与人的交
往。
[6]
本书的出发点是,你在网络中的位置如何决定你的权势和影响力,因为这将对后续的几乎一切讨论都产生作用。我们将分析你可能发挥影
响力的多种不同渠道,并逐一观察它们如何依赖于你的人际网络。
[1] 这句话广为传播,并经常被当成孔子的名言,但并没有证据表明是出自他的著述。邢亦
青告诉我,中文里最接近此说法的是来自1060年写成的《新唐书》:“世上本无事,庸人自扰
之。”但无论这句话源自何处,它还是揭示了这里要阐述的主题:简单的事情如何轻易变得很复
杂。
[2] 数学表达式为2435 ,大致相当于10131 。
[3] 我们已知的宇宙(大致在900亿光年范围内)中的所有原子的数量大致为2275 。
[4] 本书第5章将详细介绍这一学生网络。数据来自Add健康研究项目(Add Health Study,针对青春期到成人健康的一个国家长期研究项目),由Kathleen Mullan Harris主持,J.Richard
Udry、Peter S.Bearman与Kathleen Mullan Harris设计(University of North Carolina at Chapel
Hill),由尤妮丝·肯尼迪·施莱弗国家儿童健康与人类发展研究所(Eunice KennedyShriver,National Institute of Child Health and Human Development)提供资助(P01HD31921),以及来自23家其他联邦机构和基金会的联合资助。特别感谢Ronald R.Rindfuss与Barbara Entwisle
对初始研究设计的支持。该项目的网站上有如何获取数据资料的信息
(http:www.cpc.unc.eduaddhealth)。本书的分析并未接受该项目资金(P01-HD31921)的直接
支持。
[5] 由于人际网络涉及的范围极广,有各种来自不同视角的背景材料可参考。教材包括:
Wasserman and Faust(1994,社会学,统计学);Watts(1999,复杂系统,社会学);
Diestel(2000,图论);Bollabás(2001,随机图论);Goyal(2007,经济学);Vega
Redondo(2007,复杂系统,经济学);Jackson(2008a,经济学,社会学,图论,复杂系
统);Easley and Kleinberg(2010,经济学,计算机科学,复杂系统);Barabási(2016,物理
学,复杂系统);Borgatti,Everett,Johnson(2016,物理学,数据收集,分析)。还有几本面向
大众介绍人类网络对我们生活的重要性的出色作品,如Barabási(2003),Watts(2004),Christakis and Fowler(2009),Ferguson(2018)。本书将对这一广泛领域中的某些概念做综合
与提炼,另外也会涉及没有在上述著作中出现的若干主题和应用,以及其他重要的经济和社会
发展趋势。在此过程中将发展和强调某些新的理念。在本书的撰写中,我不可避免地要大量依
赖自己的研究,但重点还是大家对人类网络的集体认识。
[6] 学者用以描述人类交流网络的一个共同术语是“社交网络”(social networks)。这个词汇
同时还有着更为普及的通俗含义,意指网络平台及其相关的各类社交媒体。其实人类天然属于
互相交流与协作的物种,社交网络从史前便已出现,其内涵远远超过现代交流平台。因此,笔
者对于这两个说法——人类网络与社交网络——不做区别。第2章 权势和影响力:网络中的核心位置
导读
◎今天是人气度的时代。名入网红的关注度直接左右着大众的观
点、情感与抉择。
◎社交中的“友谊悖论”,让最受欢迎的人出现在很多人的朋友圈
中。时尚业以之推动潮流走向,中学生也容易由此“沾染恶习”……
◎拥有人脉广泛的朋友比拥有为数众多的朋友更重要——关键是你
认识谁。朋友的朋友,朋友的朋友的朋友……如何通过特征向量中心度
测算你的全部网络影响力——这正是谷歌搜索成功的秘密。
◎美第奇家族在文艺复兴时期的崛起,缘于他们在家族婚姻与商业
网络中的绝好位置,有着独一无二的“中介中心度”。
◎伟人不是生而伟大,而是越活越伟大。中心度带来更多中心度,朋友的数量会像复利那样增长。
有时候,富有理想的人会被整个业界圈子反感,被视为讨好卖乖和
追求个人私利。可是,默默无闻的美德只有在天堂才会得到回报。要在
这个世界上取得成功,你必须让人们知道你。
——索尼娅·索托马约尔(Sonia Sotomayor,美国最高法院大法
官),《我挚爱的世界》(My Beloved World )1930年,圣雄甘地动员了数万人参与反抗英国统治的“食盐进
军”(Salt March)。这是一场长度超过200英里
[1]
的步行运动,从甘地
的基地到生产食盐的沿海城市丹迪,目的是抗议盐税。在当地的炎热气
候下,食盐是必需品,消费量很大。高额的盐税于是成为英国殖民者给
印度带来的苦难的特定象征。从更宽广的视角看,食盐进军发起的非暴
力不合作运动最终结束了英国的统治。
如果你发现英国对殖民地的税收在之前遇到过类似抗议,那并不稀
奇。甘地同样注意到,一个多世纪前的波士顿茶党曾反抗英国的税收。
他讲道:“美国依靠苦难、英勇战斗和牺牲赢得了独立,而印度应该依
靠苦难、牺牲和非暴力在上帝眷顾下实现自由。”据说食盐进军后在伦
敦同印度总督欧文爵士会面时,甘地被问及希望在茶水中加糖还是奶
油,他回答说不,他希望加点盐,“好让我们回想起著名的波士顿茶
党”。
[2]
食盐进军让我们瞥见了甘地后来将完成的壮举的冰山一角,他在
1930年4月非法生产食盐的行动鼓励了数百人追随非暴力不合作运动。
马丁·路德·金曾提及第一次读到甘地向大海进军时的感动。我们很容易
看出这如何启发了他在发动民权运动与组织游行时的做法。
有大量的案例表明,个人有能力直接或间接地激发千百万人的行
动。极大的影响范围是甘地和马丁·路德·金最终成功改变世界的关键。
很自然地,一个人的位势和影响力可以通过他发动或激励的人数来判
断,因为这反映了他的作用范围。
人类网络能帮助我们认清和测量这种作用范围。对作用范围的第一
个测量指标是简单地数一个人认识多少人,或者有多少朋友或同事。在
当今世界,我们可能还会询问,他在社交媒体上有多少关注者。我们将
看到,一个人有多少朋友或关注者,对决定一个群体的认知和社交习俗
有着微妙的影响。当然,有许多直接的朋友或熟人只是个人发挥影响力的一种方式,而本章的很大部分将用来探讨权势的其他人类网络根源。无论甘地还是
马丁·路德·金,对于他们动员起来的民众都只直接认识其中很小一部
分,也不可能都有个人接触。他们有着重要的同盟和朋友,并通过其行
动产生的宣传影响更多人。食盐进军就是从少数追随者起步,随着运动
的发展和宣传的扩大,才变得声势浩大。
一个人的朋友或熟人可以很少,但如果这些朋友或熟人自身举足轻
重,他也可能具有相当的影响力。此类间接作用的范围往往就是权势所
在,我们能通过人类网络的概念非常清楚地看到这种影响力。借助显赫
的友人来获取影响力是一种有迭代性、循环式的说法,但在人类网络的
环境下,这很容易理解,并且带有许多启示。对权势和影响力的迭代
的、基于网络的测量方法可以帮助我们弄清楚如何最好地启动扩散效
应,以及是什么让谷歌成为极具创新性的搜索引擎。
提到对权势的衡量,这不是我们要讲的故事的结尾。人们还可以用
另一种方式变得更加重要——在网络中显得尤其突出——即成为关键的
连接点或者说协调人。某人可以成为相互不直接认识的人们之中的桥梁
或中介,使他处于协调其他人行动的独特位置,从而获取居间好处,强
化其权势。这类权势既反映在《教父》那样的故事中,也可以用于解释
美第奇家族通过人际网络在中世纪的佛罗伦萨的崛起。
在之后探讨金融传染、不平等和极端化等现象时,理解人际网络如
何赋予权势和影响力将非常有帮助。我们先从直接影响力入手。
[1] 英制单位。1英里约等于1.609公里。
[2] 参阅Adrija Roychowdhury,“How Mahatma Gandhi Drew Inspiration from the American
Independence Struggle,”The Indian Express ,2016年7月4日。人气度:中心度
迈克尔·乔丹没有像甘地那样动员民众参与游行,却激励了大家购
买球鞋。他对数量庞大的民众的影响力无与伦比。仅仅是在运动生涯阶
段,乔丹就从希望他帮忙推销产品的各家公司收获了5亿美元以上的报
酬,这绝非偶然。
[1]
而他从打篮球中获取的薪水才刚超过9000万美
元。从上述两个数字来看,乔丹在当时的市场营销价值远远高于他作为
运动员和娱乐明星的直接价值(今天依然如此)。这种令人难以置信的
受关注度使他可以直接影响全球千百万人的决策。
[2]
在网络术语中,某个人在特定网络中有多少联系或者链接(关系)
被称为此人的“度”(degree)。与之相关的反映某个人在网络中处于何
种中心程度的指标被称为“中心度”(degree centrality)。如果某人有200
个朋友,另一个人有100个朋友,则根据中心度指标,前者的中心位置
是后者的两倍。这一指标是符合直觉的,也是衡量影响力的显而易见的
第一种方法。
[3]
并不是只有在甘地、马丁·路德·金或乔丹那样的层次上,人们所能
影响的人数多寡才具有意义。你也经常受到自己的朋友和熟人的影响。
不过在无论规模多小的任何社群中,有着最高的度的人总是拥有超出比
例的存在感和影响力。
这里说的超出比例的存在感代表一种名为“友谊悖论”(friendship
paradox)的重要现象,由社会学家斯科特·菲尔德在1991年提出。
[4]
你是否有过这样的印象:其他人的朋友比你多得多?如果是的话,你不必感到孤独。我们的朋友平均拥有的朋友人数超出社群中的一般水
平,这正是所谓的友谊谬论。图2.1展示的是詹姆斯·科尔曼的一项经典研究介绍的某所高中的朋
友网络中的友谊悖论。
[5]
图中有14个女生,对其中9个而言,她们的朋
友平均拥有的朋友人数超过她们自己,另外2个的朋友人数与她们的朋
友的朋友人数相同,只有3个女生的朋友人数超过她们的朋友的朋友人
数。
[6]
图2.1 友谊悖论。数据来自科尔曼在1961年对高中学生朋友网络的研究。每个节点(圆圈)代
表一位女生,每条连线代表两位女生之间存在朋友关系。友谊悖论在于,大多数女生比自己的
朋友的交际更少。每位女生的圆圈中的前一个数字代表她有几个朋友,后一个数字代表她的朋
友平均有几个朋友。例如,左下角的女生有2个朋友,而那两个女生分别有2个和5个朋友,因此
平均数为3.5。这个圆圈里的两个数字2和3.5表明,该女生的朋友数少于自己朋友的平均朋友
数。在全部14位女生中有9位属于这种情况,有3位的朋友数多于自己朋友的平均值,有2位与自
己朋友的平均数相同。
友谊悖论不难理解。最受人喜欢的人会出现在很多人的友人名单
中,而朋友极少的人只会现身于少数人的名单。相对于在人群中的占
比,有众多朋友的人在大家的友人名单中会被过度代表,而朋友少的人则会代表不足。比起只有5个朋友的人,有10个朋友的人被计算为朋友
的次数是前者的两倍。
从数学角度看,这一悖论并不奇怪——大多数悖论同样如此。然而
该现象对我们的几乎所有交往都有着重要意义。任何做过家长(或学
童)的人都不会对下面的说法感到陌生,如“学校里其他所有人都
有”,“学校里其他所有人都能够……”。尽管这类陈述往往是错误的,却总是反映着我们的感知。最受欢迎的学生可能在孩子们的朋友中被过
度代表了,如果这些学生都在追随某种时尚潮流,孩子们就会认为所有
人都是如此。人气高的人在决定感知和行为标准方面发挥了超出比例的
作用。
为了最直观地看清友谊悖论的含义,我们先思考一个简单的例子,然后再分析它背后的有关数据。
我们来看一个班级的学生如何受朋友的影响。
[7]
从内心来说,这
些学生都是比较从众的性格。他们面临一个简单的选择:是穿纯色的衣
服,还是格子花纹的衣服?每个人对此有各自的偏好,在开学头一天,他们都根据自己的偏好选择服装,其结果如图2.2所示。
作为喜欢循规蹈矩的人,学生希望追随大多数人做事,只有在选择
每种风格的人数都相同时,他们才听从自身的偏好。如图2.2所示,有4
个学生喜欢纯色衣服,8个学生喜欢格子衣服。这样,由于三分之二的
学生喜欢格子衣服,而如果大家都能看到整个群体的喜好,到第二天上
学时,所有人都会穿上格子花纹的衣服。然而请注意,头一天选择纯色
衣服的是最受欢迎的4个学生,或许也是群体中最引人注目的一批学
生。图2.2 开学头一天,最受欢迎的4个学生选择纯色衣服,其余8个学生选择格子衣服。
学生看不见所有人的情况——他们主要是和有连线的朋友交流。
图2.3的(a)到(d)显示了之后每天发生的情况。最受欢迎的这批
学生看到了彼此的着装以及其他某些人的着装,其中大多数都是纯色衣
服,因此他们将继续穿纯色衣服。其他部分学生主要看到的是最受欢迎
的这批学生,他们将换成穿纯色衣服。我们从图2.3的(a)中看到,最
受欢迎的学生在第二天继续穿纯色衣服,另有4名学生加入他们,总共
有8名学生变成穿纯色衣服。从这里开始问题很快得到了解决,从图2.3
的(b)到(d),每天都有更多穿格子衣服的学生看到大多数朋友穿纯
色衣服,于是改变自己的风格。到第五天时,班上的每个学生都穿上了
纯色衣服,而事实上在开学时他们大多数更喜欢格子风格。
我们可以通过图2.4分析友谊悖论在这一服装风格流行变化中的作
用,该图根据学生在开学第一天看到的朋友的风格,显示他们如何错误
地感知了整个群体的偏好。虽然三分之二的人偏好格子衣服,但由于最受欢迎的学生在大家的朋友关系中被过度代表,最终使三分之二的学生
以为选择纯色衣服的人是大多数。图2.3 学生观察周围的情况,以迎合大多数朋友的选择。最受欢迎的4名学生彼此都是朋友
(形成小派系),都保留纯色服装。在全体学生的感知中,这批学生被重复计算了,引发了连
续改变着装的进程。图2.4 友谊悖论发挥作用。每名学生边上的分数代表他们对于纯色格子衣服流行度的感知,来自每个人看到的朋友的选择。大多数人都错误地以为纯色衣服是主流选择,只有右下方的少
数几个一开始感觉格子衣服占主导。而这些学生很快也会看到大多数朋友换上了纯色衣服。
这个例子的构造中有两方面的特点或许会让你留意。其一是最受欢
迎的学生有着同样的偏好,都喜欢纯色衣服,因而促使整个群体快速向
这批学生喜欢的风格统一。这个现象很重要,最受欢迎的学生为什么彼
此相似是有原因的,下文很快将展开讨论。其二是这批受欢迎的学生组
成了一个小圈子,彼此都是朋友,从而强化了他们的行为,维持了他们
对纯色衣服的选择,并最终让群体中的其他人接受。上述两个条件让我
们的案例变得更简洁明了,但即使没有这些,最受欢迎的人依然具有超
出比例的影响力。事实上,时尚设计师早就看清了让名人穿上他们的各
种新款设计走上奥斯卡奖红毯的重要性。
人气度与友谊悖论的作用在同辈间的影响或许是最纯粹的,比如学
生对于彼此的感知。有大量研究发现,学生容易高估他们中间吸烟、喝酒、滥用药物的人的比例以及频率,而且往往高出相当多。例如,有项
覆盖100所美国大学的大型研究发现,学生对11种不同物品的消费量有
系统性高估,包括香烟、酒类和大麻等。
[8]
具体而言,有项对酒类消
费的深入研究对比了学生自己报告的饮酒行为——上次参加聚会或交际
时喝了多少——与他们对该学校的一般学生上次参加聚会或交际时喝了
多少的感知。在该研究包含的130所大学的72000多名学生的信息之中,居于中位数的学生报告说自己喝了4杯酒——这真令人吃惊,尤其是四
分之一的学生说喝了5杯或者更多。然而更令人惊讶的是,尽管上面的
数字已经够高,仍有超过70%的学生在估计自己学校的一般学生的饮酒
量时高估了1杯甚至更多。
[9]
要解释这种错误感知,我们并不需要去深入探究学生的心理,友谊
悖论就能给出轻松解释。当学生参加欢聚或社交场合时,他们的交往更
多会集中在那些经常参与交际的人身上,因此他们对酒类消费的感知会
过分反映参加了很多聚会的人。这形成了另一种模式的友谊悖论:学生
在聚会中见到的人通常比一般的学生参加的聚会更多。学生的感知不但
受自己在聚会和其他社交场合的经历的影响,还取决于他们知道的自己
的亲密朋友的情况。友谊悖论在这里同样会产生作用。如果人气较高的
学生抽烟喝酒比较多,同样会扭曲学生的估计。而事实上确实有项研究
估算出,中学生的朋友人数每增加一个,他抽烟的概率就会提高5个百
分点。
[10]
在饮酒上面也有类似的结论,中学生的朋友增加5个,他喝
过酒的概率会提高30个百分点。
[11]
参与社交最活跃的学生更容易抽烟喝酒,有几方面的因素推动。原
因之一是对青少年来说,这些消费是一种社交活动。花更多时间跟其他
人交往的人,因此有更多喝酒的理由。也存在一种反向效应:有较高饮
酒倾向的学生喜欢找合适的机会去尝试以及与其他人分享。
[12]
最主要
的一个因素是,父母监督较少的学生有更多时间跟其他学生出去混,也
有更多机会尝试酒精、香烟和毒品。最后是社交行为本身具有的反馈性质,看到同伴喝酒会激励自己喝酒,由此让同伴的饮酒量增加,然后继
续在反馈回路中形成循环。
[13]
所以,考虑到学生对伙伴的行为的估计至少有部分(即使不是大部
分)是根据自身的观察,友谊悖论的影响,再加上大多数社交活跃的学
生经常有极端行为这一现实,自然会让学生系统性地高估伙伴的行为模
式。更普遍地看,由于许多行为会受到大家感知的习俗的影响,最终的
行为将受到参与社交活动最多的人的超出比例的推动,就此形成的习俗
也比不依赖人际网络时的感知更为极端。
友谊悖论会被社交媒体放大,那里产生的影响幅度可能非常惊人。
例如,有项关于推特的研究发现,[14]
超过98%的用户的关注者少于他
们关注的对象,通常来说,一位用户的“朋友”(friends)的关注者人数
是他的10倍以上。那些人气更高的用户更为活跃,尽管其数量较少,但
却在内容传播上扮演着关键角色。鉴于社交媒体的应用增加,尤其是在
青少年中,人群的感知被极少数最受欢迎的用户扭曲的可能性变得非常
大,特别是考虑到人气最高的社交媒体用户可能有相当特立独行的行为
时,就像我们看到的学生的人气度与较早和较多地抽烟喝酒之间存在关
联那样。参与聚会本身是一种社交行为,如果有喝酒吸毒等照片或故事
分享出来,可以进一步放大社交媒体的影响。相反,埋头读书那样的行
为往往是独自完成的,有关的信息也更少用于分享。因此青少年高估自
己伙伴消费的药物和酒精,而低估他们用于学习的时间,是很自然的结
果。
无论我们是否有所意识,与友谊悖论相伴的偏向性远远超出“友
谊”的范围。友谊偏差只是“选择性偏差”(selection bias)的情形之一,其含义是,我们的观察往往来自有偏向性的样本,取决于这些样本如何
选取。我们会过多地乘坐最满员的航班,在最火爆的餐厅吃饭,在最拥
挤的路段和时段开车,在人流最大的时候去公园和景点,参加最喧嚣的
音乐会,看最热门的电影,等等。这些经历扭曲了我们自己的感知以及我们对社会习俗的认识,而且其效应经常没有被我们意识到。正如肖恩
·弗里德里克(2012)在一项有关我们过高估计别人的付费意愿的研究
中所述:“比起那些躲在办公室里、不愿花4美元买咖啡的人来说,在星
巴克排队的顾客要显眼得多。”
[15]
[1] 仅耐克公司在当时就给他支付了4.8亿美元。
[2] 这里忽略了关系一个人为什么能影响以及动员那么多其他人的个性和其他因素。除在人
类网络中的位置外,还有许多特征可能使某人成为重要的意见领袖——这一课题在Katz and
Lazarsfeld(1955)的开创性成果后已得到广泛研究。可参阅:Rogers(1995),Valente and
Pumpuang(2007),Valente(2012)及其详细的参考文献,以及Gladwell(2000)。
[3] 尽管本章及之后各章并未强调,但应该明确指出,我们考察的联系和网络的类型会根据
环境发生变化。例如,一位政治家制定法律的能力取决于同其他议员的联系,而他动员选民的
能力则取决于同媒体、党派和职员的联系(及这些人的人际联系)。由于在人际网络中有联系
的两个人并不总是真正的“朋友”关系,在网络研究用语中经常称之为“邻居”,但本书中不做区
分。关于不同人际网络的区别和相互作用,可参阅Ferguson(2018)。
[4] 参阅Feld(1991)。
[5] 参阅Coleman(1961)。
[6] 该案例中的人际网络有两个(内部相连的)部分。没有在本书中展示的更大的网络部分
表现出了类似的现象:在146个女生的朋友关系网络中,80人拥有的朋友人数少于自己的朋友平
均拥有的朋友人数,25人的朋友人数与自己的朋友的朋友人数相同,41人的朋友人数超过其朋
友的朋友人数。
[7] 对人们的观点的估计出现偏差的类似案例,可参阅Lerman、Yan and Wu(2015)。我们
还可以从知名博客上看到类似现象(如Kevin Schaul2015年10月9日发表在Washington Post 上的
博客,“A Quick Puzzle to Tell Whether You Know What People Are Thinking”),以及参考有关的
实验结果(Kearns、Judd、Tan and Wortman,2009)。
[8] 参阅Perkins、Meilman、Leichliter、Cashin and Presley(1999)。
[9] 参阅Perkins、Haines and Rice(2005)的表2。
[10] 参阅Valente、Unger and Johnson(2005)。
[11] 参阅Tucker et al.(2013)。关于人气度与其他特征或行为存在相关的其他案例,参阅
Eom and Jo(2014)。
[12] 有关这两种效应的更广泛讨论,可参阅Jackson(2016)。
[13] 通过仔细观察,我们可以估计反馈效应的大小:某个人的行为在多大程度上因为发生
的社会环境的不同而出现差异。对若干受社会影响的行为来说,这类效应大于2(参阅Glaeser、Sacerdote and Scheinkman,2003)。本书第8章还将讨论此类效应对一系列行为的影响,从犯罪和
逃税,到坚持上学和寻找工作。
[14] 参阅Hodas、Kooti and Lerman(2013)。
[15] 参阅Frederick(2012)。对比
你只要反复拷问数据,大自然总会坦白。
——罗纳德·科斯,《经济学家该如何选择?》 [1]
我希望被视为在所有方面都表现最好的人,而不只是得分。
——迈克尔·乔丹,2003年NBA(美国职业篮球联赛)全明星赛
谁是历史上最伟大的篮球运动员,维尔特·张伯伦还是迈克尔·乔
丹?你或许会考虑勒布朗·詹姆斯。作为在芝加哥长大的人,我有自己
的答案。但列入比较的对象其实是在比赛中有着截然不同的风格与作用
的伟大运动员。
有太多不同的统计数字可用来总结他们的职业生涯。例如,乔丹和
张伯伦在几个方面有着惊人的相似:整个职业生涯的常规赛平均得分都
是30.1分;常规赛总得分都超过3万分,乔丹为32292分,张伯伦为
31419分;都多次获得最有价值球员奖项,乔丹为5次,张伯伦为4次。
可是也有些指标他们差异较大:乔丹带队夺得过6次NBA总冠军,张伯
伦仅有2次;张伯伦的场均篮板数则达到惊人的22.9个,远超过乔丹的
6.2个。
在其他某些维度上,别的球员则更胜一筹。斯蒂芬·库里的三分球
总命中数远远超过前人。卡里姆·贾巴尔维持顶尖水平的时间跨度无与
伦比,他打了20个赛季,总得分超过4万分,参加了19次全明星赛,之
前还以史无前例的方式征服过大学篮球赛场。詹姆斯的全面统治力则从
他作为高中二年级学生登上《体育画报》杂志封面就广为人知。但如果
真要衡量运动员的全方位贡献,我们得考虑“三双”的指标——得到至少10分、10个篮板、10次助攻,三项统计数据都达到两位数。这必须让人
回忆起奥斯卡·罗伯特森,他曾经在整个赛季实现了场均三双——该成
就只是在最近才被拉塞尔·威斯特布鲁克赶上——而且完成三双的比赛
次数令其他所有人望尘莫及,哪怕是“魔术师”约翰逊。
这里的要点不在于真要展开一场有关篮球技艺的“熊队还是牛队”的
争论,[2]
而是想强调如下几点:统计数字是用简洁的方式反映有用的
信息;不同的统计数字概括了不同的内容;即使有大量的统计指标也可
能难以反映它们所描述事物的所有细微之处。
如果对事物的测量总是能归结为一个单纯的统计指标,我们的生活
就会变得简单很多。可是让我们的人生如此有趣的部分原因正在于,对
于许多最重要的事情来说,实现这种单一维度的排名经常是不可能的:
各种排名最终会变得充满争议又令人着迷。人们该如何比较海顿、施特
劳斯和斯特拉文斯基的音乐创新呢?该如何比较埃莉诺·罗斯福、哈里
特·斯托与哈里特·塔布曼在人权领域的贡献?梅西和马拉多纳谁才是更
出色的足球运动员?我们能够对毕加索和达·芬奇的艺术评判高低吗?
还是说把毕加索与亨利·马蒂斯的作品做比较要容易些,不仅因为他们
是同时代的画家,而且是竞争对手?许多人或许会说,这种比较是无法
实现且毫无意义的。然而,它能迫使我们去认真思考对于上述人物所做
贡献的不同反映维度,以及为什么他们的贡献具有革命意义。
[3]
当我
们看到不同的篮球统计数据时,眼前会浮现不同的球员,每一位都有自
己的绝活。类似的是,当我们观察反映人们网络位置特征的不同统计数
据时,也会有不同的人浮现,成为最“中心”的人物。有些人在某些指标
下居于非常中心的位置,在其他指标下则不然。而哪些网络统计指标最
适用则取决于不同场合,好比你要给自己的篮球队引入一位顶级得分者
还是一位顶级防守者,也得根据情况而定。
我们已经看到,测量中心程度的一个指标——中心度——能帮助解
释为什么网络里中心度最高的人有超出比例的影响力。这是第一种“网络效应”。作为最基本和最浅显的反映网络中心位置的指标,中心度类
似于篮球比赛中的场均得分。然而,如果继续这个类比,不同的人可能
有不同的长处体现在网络中的位置上,因此根据我们提问题的方式,到
底谁是最核心的人可能会有所变化。正如张伯伦是统治级别的篮板好
手,乔丹能带队夺冠,而库里以全新的方式突破了防守一样,如果只根
据中心度来比较人际网络中的不同节点(人),可能完全错过权势和影
响力的某些最关键的方面。接下来让我们看看一些其他的概念。
[1] 这一引言有不同版本出自不同人物。例如,一个接近的说法是“如果足够长时间地拷问
数据,它会坦白一切”,源于Darrell Huff在1954年的著作《如何用统计数字撒谎》(How to Lie
with Statistics )。不管Huff有没有说过,那本书里其实没有这句话。不过该书的内容确实证明
了以上说法的真实性与重要性。对这里的论述而言,关键在于很多事情都具有多面性,从不同
角度看会有极大的不同。
[2] 这个典故来自喜剧节目《周六夜现场》(Saturday Night Live )中的若干小252品,其中
有典型的芝加哥体育迷在争论对不同项目的当地体育明星的崇拜。
[3] 有关这类比较的意义,我们可以看到马蒂斯的《蓝色的裸体(关于比斯克拉的回忆)》
[Blue Nude (Memory ofBiskra )]给毕加索带来了触动,并影响了他的作品《亚维农的少
女》。塞巴斯蒂安·斯密(Sebastian Smee)的《竞争的艺术》(The Art ofthe Rivalry )深入描述
了他们之间的竞争与艺术上的相互影响。关键是你认识谁——大海捞针
建立关系网是废话,交朋友才是正事儿。
——史蒂夫·温武德(Steve Winwood),英国音乐人
如果不是谢尔盖·布林在1995年偶然受命带拉里·佩奇参观斯坦福大
学校园——当时佩奇正在考虑到斯坦福读博士——谷歌公司或许就不会
存在。布林一家是在20世纪70年代后期从俄罗斯移民到美国,对数学和
编程长期着迷的他已经在斯坦福学习计算机。佩奇同样对计算机着迷,并一同回忆起了“爱读图书杂志,在家里把东西拆掉、搞清楚如何运
转”的童年。尽管这两人的强烈个性时有冲突,但布林与佩奇的共同爱
好和智慧却让他们结为挚友。对我们而言最重要的是,他们都对万维网
的构造有着日益浓厚的好奇心。
到1996年,布林和佩奇共同着手为网络设计搜索引擎。刚开始他们
在佩奇的宿舍放置一部用他们所能找到的部件拼凑出来的计算机,布林
的房间则作为开发创意和程序的办公室。在他们作为学生联合撰写的一
篇论文中,布林和佩奇描述了互联网将在20世纪90年代后期如何快速扩
张,搜索引擎将因此如何难以胜任。最早的搜索引擎之一,1994年
的“万维网虫”仅索引了超过10万个网页。到1997年,另一个搜索引擎
AltaVista号称每天收到数千万条查询,而互联网已经有数亿个网页需要
搜索和索引。需要索引的网页的巨大数量使我们不可能找到用户真正想
要的内容。借用布林和佩奇的话:“到1997年11月时,排名前四的商业
化搜索引擎中只有一个能够找到它自己——具体意思是指在该搜索引擎
查询它自己的名字时,能在前十个结果中显示自身的搜索页面。”
那么,我们如何能在这样的汪洋大海中找到正确的那根针呢?当用户输入某些关键词时,确实有某些明显的方法去识别他或许想看到的网
页,但问题是有太多的网页包含同样的关键词。某些网页频繁出现关键
词,并不能保证它们就是大多数用户寻找的内容。追踪过去的信息流向
并深入考察不同网页的内容,或许能提供帮助。在这方面做过许多不同
尝试,但似乎没有方法充分奏效。这很容易让人以为,互联网只是变得
太大了,为之提供任何合理的索引和导航都注定是不可能完成的任务。
布林和佩奇的突破源自他们对万维网的网络构造的兴趣:包含如此
丰富的有用信息,因为其构造并非源自意外。网页与它们视为重要的其
他网页相连。那么布林和佩奇是如何看待和利用这一信号的呢?他们的
关键发现是,找到搜索者可能最感兴趣的网页的一个有效办法,是分析
其他网页上面的链接指向哪个网页。如果其他重要网页指向某个网页,就表明这也是个重要网页。判断某个网页的地位并不是简单计算有多少
网页跟它有链接,而是看它是否与某些链接最广泛的网页相连。在许多
场合下,拥有“人脉广泛”的朋友比仅仅拥有人数众多的朋友更为重要。
这种定义是循环式的:某个网页很“重要”,是因为它在其他的“重
要”网页上有链接,而这些网页的重要性,又是来自被别的“重要”网页
链接。尽管有这种循环特性,但结果却表明它是漂亮的解决方案,在网
络环境下尤其适用。
假设我们希望散布一条可能会口口相传的消息,从图2.5显示的人
际网络中,我们将看到为什么对人气度的直接测量指标并不够用。很明
显能看出,南希和沃伦尽管都各有2位朋友,他们的位置却存在很大差
异。差异之处在于,他们的朋友的交际度不一样,以及与之相关的,他
们中谁在网络中所处的位置更为有利。沃伦的朋友每人只有2个朋友,而南希的朋友则分别有7个和6个朋友。于是,尽管沃伦和南希在他们自
己的“度”(朋友人数)上得分相同,但南希的朋友却有着比沃伦的朋友
更高的度。
我们可以暂停一下:不是只计算朋友的数量,而是计算每个朋友能带来的更多的朋友的数量,跟踪朋友的朋友——我们称其为“二度朋
友”(second-degree friends)。从直接的朋友扩大到计算朋友的朋友将
是个很好的开始,由此看来南希在传播消息方面比沃伦处于更好的位
置。但迭代为什么要止步于此?为什么不接着考虑“三度朋友”?虽然南
希的朋友艾拉没有给她带来多少三度朋友,但迈尔斯却带来了更多的联
系。从南希开始经过三步后,我们已经联系到了网络中除沃伦之外的所
有人。从沃伦开始经过三步后,我们只能联系到5个其他人,而南希却
是16个人。这使得南希在散布消息方面是个比沃伦好得多的候选人,尽
管他们本身有着相同的度数。
图2.5 南希和沃伦在网络中的度都是2。但他们各自的朋友的人际联系却大为不同,从而导致
他们在网络中的整体位置也相差悬殊。
在一个大型网络中我们该如何理解这点,是否可以永远持续下去?
对此有不同的处理办法,此处只介绍最核心的理念。我们首先可以计算
第一度朋友数,如图2.5所示,南希和沃伦各自的分值为2,因为他们各
有2个朋友。接下来加入二度朋友的数量,但这些人的重要性是否应该
同第一度朋友相同呢?例如,假如从南希开始散布消息,这条消息从南
希传到迈尔斯那里的概率,理应高于传到迈尔斯的某个朋友的概率——
因为消息必须首先从南希传给迈尔斯,然后还必须从迈尔斯传给其他
人。消息传递两步的概率可能会比只传递一步的概率低得多,例如只有
后者的一半。由此看来,我们可以把朋友的朋友的分值设置为朋友的分
值的一半。南希有11个二度朋友,由此得到的朋友的朋友的分值将为112。沃伦只有一个二度朋友,得分为12。把一度和二度朋友合计,南
希的得分为7.5,沃伦的得分仅为2.5。我们再看三度朋友,南希有3个,沃伦有2个。对这些朋友的分值再次缩小一半,每个为14,于是南希的
得分将增加34,总分为8.25,沃伦将增加24,总分为3。以此种方式迭
代,我们就能够量化南希在网络中的影响力比沃伦大多少。
南希和沃伦之间的对比还能为另一个问题提供解决方案。我们可以
把每个人的中心度定义为他的朋友的中心度总和的一定比例——类似于
刚才所做的计算。按照这一定义,南希将从艾拉和迈尔斯的得分中获得
一定比例,而艾拉和迈尔斯的得分又来自他们朋友的得分的一定比例,以此类推。迭代机制也相似,艾拉和迈尔斯的得分来自各自的朋友,这
些人算是南希的二度朋友,他们的得分又来自各自的朋友,可以算是南
希的三度朋友,并继续下去。
[1]
幸运的是,这种类型的方程组——每个人的中心度都是其朋友中心
度总和的一定比例——是非常自然且易于处理的数学问题。从18世纪到
20世纪,有若干大名鼎鼎的数学家为这一领域做出了贡献,其中包括:
欧拉、拉格朗日、柯西、傅立叶、拉普拉斯、魏尔斯特拉斯、施瓦茨、庞加莱、冯·米赛斯和希尔伯特等。希尔伯特将此类问题的求解命名
为“特征向量”(eigenvectors),成为现在的通用术语。特征向量出现在
各种研究领域的应用中,从量子力学(薛定谔的方程),到构成面部识
别技术基石的“特征脸”(eigenfaces)的定义,并不出人意料。通过求解
上述案例中的特征向量,我们会发现南希的分值约为沃伦的3倍,如图
2.6所示。
[2]
布林和佩奇的创新之处是利用他们所谓的“网页分级”(PageRank)
来给网页排名,这与以上的论述和特征向量的计算有关。尽管布林和佩
奇要解决的问题并不是通过网络来传播谣言,但却同样是基于另一个有
密切联系的迭代问题——随机游走问题(random surfer problem)。某
位用户从某个网页起步,跟随该网页的链接随机进入另一个网页,点击每个链接的概率都相等。该用户持续这一操作,以此模式在互联网上随
机游走。
[3]
积累一定时间后,如果我们要计算该用户登录每个页面的
相对时间比例,就是属于特征向量计算。在此情形下,每一步计算使用
的权重都与每个页面包含的链接的数量成比例。
图2.6 每个节点(人)的特征向量中心度。南希得到的分值约为沃伦的3倍,尽管他们有相同
的连接数。迈尔斯的此项得分最高,但中心度最高的则是艾拉。
布林和佩奇面临两个挑战。概念上的挑战是寻找最相关的网页,解
决办法是不用人气度来排名,而是用迭代方法、以特征向量来计算网页
的链接水平。更为现实的挑战则是如何在规模极为庞大的互联网上应
用,这需要漫游网络、建立网页索引、储存每个网页的内容和链接的数
据,然后对网络位置做上述的迭代计算。在小小的社群中计算南希和沃
伦的分值是一回事,将其套用到亿万个网页上则完全是另一回事,尤其
是网页的内容与链接还经常处于变化中。
布林和佩奇开发出了基于此类计算,并特别适用于庞大网络的一种
算法,称其为“BackRub”,开始在斯坦福大学的服务器上运行。
BackRub的名字来自寻找反向链接(backlinks),即把人们带到某个网
页的链接。该软件很快超出了布林和佩奇在斯坦福服务器上的学生账户
的权限,到1997年,他们把这一搜索引擎移走,更名为“Google”——这
是googol一词的变体,其含义是1后面加100个零的庞大数字,意指他们
的算法试图征服的互联网的天量规模。对早期在互联网上苦于搜索的所有人来说,谷歌引擎找到有效网页的能力令人难以置信。当时还有众多
搜索引擎对手,人们往往会尝试多个引擎,却仍经常无法找到自己真正
需要的网页。到1998年,《个人计算机》杂志(PC Magazine )报道说
谷歌“有着给出极其有效的搜索结果的神奇本领”,并将其加入最顶尖的
100家网站的行列。
[4]
之后的故事则成为世人熟知的历史。
[5]
[1] 这里有个细微的区别,我们可能做重复计算。例如艾拉的7个朋友中有一个是南希,这
样我们就把南希算成了她自己的二度朋友。重复计算实际上让数学处理变得更容易了一些,因
为我们只需要追踪每一步的联系数量,而无须考虑已经计算在内的人。重复计算造成的影响可
参阅Banerjee、Chan drasekhar、Duflo and Jackson(2013,2015)。
[2] 如果你对图中的数字感兴趣,可以提示下,中心度数值的平方之和为1,因此中心度数
字的向量在标准数学意义上是归一化的(L2或欧几里得范数)。
[3] 他们的算法还包括某些偶然的随机跳跃到新的节点,重新开始整个游走过程,以避免不
会长期陷入某些彼此指向的网页构成的局部区域。
[4] 随着计算力与互联网经验的进步,包括谷歌在内的搜索引擎一直在快速演进。这些引擎
如今包含了有关用户和不同网页的丰富得多的信息,以及对人们喜欢如何漫游网络和真正希望
搜寻何种内容的更为定制化的信息。此外,互联网在今天是个移动的靶标,内容经常发生改
变。但无论如何,网页分级的概念是个重要突破,很好地包含了网络信息。
[5] 除搜索引擎和信息传播外,追踪一度联系之外的更多联系在其他许多场景中同样重要。
对中心度的这类迭代计算和特征向量方法,在谷歌出现前几十年就已经在社交网络的研究中广
泛采用,20世纪50年代的先驱者是Leo Katz,70年代Phil Bonacich对此类方法做了规范。特征向
量中心度的多种版本被用于寻找犯罪活动网络中的“核心成员”,因为犯罪具有社交特征:人们
通过彼此交往了解到犯罪机会,并形成相互鼓励,这类网络中最核心的人对其他人的参与有着
最大的影响力(可参阅Lindquist and Zenou,2014)。此类中心度指标还用于对投资者之间的交流
的研究,以预测哪位投资者能在股市中获得最高回报(Ozsoylev、Walden、Yavuz and
Bildik,2014)。小额信贷的扩散
谷歌的历史表明,基于特征向量中心度的算法超越了其他对手,但
搜索引擎算法相当复杂,谷歌的成功或许还要归因于算法中的其他独特
之处。我们可以从更有说服力的证据来分析一个人的朋友的位置的重要
性。BackRub算法通过从他处到达某个网页的便利程度分析其地位,而
在许多情况下,我们感兴趣的是某个人在触及其他人方面有多大的影响
力。
带着这一疑问,我于2006年访问了麻省理工学院,与我的朋友、在
那里担任教授的阿比吉特·班纳吉讨论:在行动中测试影响力的差异会
多有意思。幸运的是,班纳吉那次恰好是我应该找的人(其实经常如
此)。从他那里得知,麻省理工学院另一位教授埃斯特·迪弗洛(Esther
Duflo)正通过她姐姐安妮联系印度南方的一家BSS(Baratha Swamukti
Samsthe)银行,该银行计划通过口碑的方式推广新的小额贷款计划
——从这个研究项目的启动中我们都能看到人际网络发挥的作用。该口
碑推广计划最终给我们提供了观察网络结构在信息传播中如何发挥作用
的绝好机会,并让我们可以测试何种中心度测量指标最能反映一个人的
信息传播能力。我与班纳吉、迪弗洛以及当时的麻省理工学院研究生阿
伦·钱德拉塞卡(Arun Chandrasekhar)——他的家庭正好来自要调查的
地区卡纳塔卡邦——于是启动了这项后来为期很长的研究项目。
小额贷款革命的先行者是穆罕默德·尤努斯。他于20世纪70年代在
孟加拉国创立格莱珉银行,从20世纪80年代开始广泛发放数额极小的贷
款。尤努斯与格莱珉银行的创新在2006年得到了诺贝尔和平奖的认可。
该创新很简单,却充满机智。全世界的许多贷款都要求以住房或汽车作
为抵押品,或者是给有就业记录的人提供预付工资,或者是通过信用卡
给有信用记录的人提供贷款,还有强悍的收款机构负责追究违约客户。尤努斯的小额贷款则是面向极端贫困的人群,他们工作不稳定,几乎没
有抵押品,所生活的环境的收款成本可能极高。那么,他对此的创新是
什么?
尤努斯的创新是,贷款是基于连带责任——如果某个人未偿还贷
款,更多的人也将为此负责。一个人的贷款违约,他的亲朋也会受到牵
连。这种小额贷款目前已有多种变体,其中一个典型模式正是我们的项
目跟踪的BSS银行采纳的,并能反映上述理念。BSS银行的贷款只发放
给18~58岁的女性,每个家庭只能发放一笔。妇女被分成五人一组的群
体,对贷款承担连带责任:某个女性的贷款违约,整个小组都将被视为
拖欠还款。违约将使借款人未来无法获得贷款,或者至少使违约者的借
款变得更加困难。在某些时候,这一机制的作用范围更广,连带责任跨
越到其他小组,出现太多的违约会使整个村子无法从贷款人那里获得资
源。让人们对还款承担连带责任,会给他们带来名誉和社会压力,从而
尽量不因为拖欠而让村里的同胞受害。同时还意味着组员有动力提供互
相帮助,在某人无法还款时施以援手。
另外,偿还一笔贷款通常让借款人可以获得后续的、规模更大的贷
款。根据当前的还款——本质上可以让人们逐步积累信用记录——做出
在未来发放更多贷款的承诺,也是对还款的一项重大激励。参与者往往
还会接受一些基本的财务培训,鼓励她们留下储蓄,教她们追踪收入、做计划以及简单记录支出项目等。这些培训看似初级,对村民来说却可
能很有效果。
[1]
在访问一个村庄时,有一位接受财务状况调查的当地
女性生动地向我讲述她如何增加了获得的贷款规模,保持着家庭现金收
支的会计记录,还建立了由穆斯林和印度教徒共同参加的多族群小组,以及把几笔贷款合并起来购买了一辆二手卡车,启动了一项生意。
虽然有些还款迟滞现象,但在我们开展研究的数年中,BSS银行在
这些村庄发放的贷款基本上没有出现违约。
[2]小额贷款的另一个重要特征是,贷款对象限定为女性会给家庭内部
的关系产生影响。虽然有部分资金(但不多)最后被这些村里的男性家
庭成员掌控,但贷款只能通过家庭中女性才能得到的事实,毕竟让妇女
在这些钱该如何投资或花费方面有了发言权。
[3]
BSS银行推广的小额贷款揭示了网络中心度的重要性,以及中心度
与特征向量中心度之间的差异。
我们研究的BSS银行面临一个问题:如何将提供小额贷款的消息散
布给计划进入的卡纳塔卡邦的75个村庄的潜在借款人。那些村里不安宁
的种姓制度政治气氛,加上腐败,使银行并不希望依靠村级政府来散布
消息。尽管某些村民能通过移动电话联系到,但他们已饱受垃圾信息之
苦,因此也不能利用手机做推广。其他宣传手段还包括邮寄宣传单,甚
至用汽车装载扩音器播报,但这些也已被过度使用了,而且主要是跟政
治竞选挂钩。因此,不论好坏,银行决定采用的办法是找到某些处
于“中心”位置的个人,让她们口头传播关于银行与提供小额贷款的消
息。
问题在于,银行对当地的朋友关系网一无所知。它如何能找到最中
心的村民呢?这能起作用吗?银行估计,最有利于传播消息的村民应该
是教师、店主和自助团体的带头人。
[4]
我们姑且把这些人称为“初始种
子”。银行当然希望这些种子处在中心的位置,它们考虑的是中心度,对特征向量中心度则毫无概念。
对我们的研究有用的地方在于,某些村里的初始种子有着较高的
度,而另一些村里的则较低。例如,某些村里的教师有很多人际往来,其他村里的教师则较为孤僻。更重要的是,还有些村子里的初始种子有
较高的特征向量中心度,但中心度较低,其他一些村子的情况则相反。
在某些村里,这种信息传播方式很奏效,而在其他颇为类似的村里则相
当失败:某些村里符合条件的家庭参与信贷的比率接近一半,某些村里则不到十分之一。于是,我们能从中看出哪种关于中心度的测量指标能
最好地预见信息从初始种子开始的传播结果。究竟是初始种子的哪种网
络中心度测量指标能解释信息传播在不同村庄之间表现出的6倍以上的
差异?
2007年——在BSS银行进入这些村庄之前——我们对当地的成年村
民开展了调查,并描绘出了他们的人际网络图像。这些小村子特别适合
做网络分析,因为大多数交往都是在本村里,并且是面对面进行。
[5]
根据我们之前讨论的人气高的人在决定其他人的感知和流行趋势方
面所起的重要作用,乍看上去,度数较高的人应该是传播小额贷款消息
的优质种子。但结果并不总是这样——初始种子的度与小额贷款在村里
的传播速度之间并没有关联关系。
[6]
我们对人气度的重要性的分析没有意义吗?显然不是。就像篮球运
动员的案例一样,人气可能是重要的,不过它只是更广阔的图景的一个
方面。人气较高的人在塑造人们对社会习俗与时尚的感知上很有用,并
能直接影响众人。然而我们的研究却表明,开展小额贷款的村子的主要
问题是让消息普遍传递给整个村里的人,而不是简单地影响大家的感
知。到2008年时,即使对生活在偏远村庄的人们来说,没听说过小额贷
款的人也很少,正如发达国家的大多数人知道信用卡及其对自己有用一
样。此时需要做的不是创造一种流行趋势,或影响村民对于有多少其他
村民获取了贷款的印象,而是要让尽可能多的村民知道,银行正在提供
这样的贷款。
[7]
事实上,有关小额贷款的消息的散布不只是初始种子能传递给多少
朋友,还包括他们能影响多少二度朋友、三度朋友,等等。
[8]
初始种
子的直接朋友通常只占整个群体中一小部分。虽然初始种子的度数似乎
完全没起作用,但初始种子的特征向量中心度较高的村子相比之下却有
着明显更高的参与率。把初始种子的特征向量中心度最低的村子同最高的村子进行对比,平均而言,后者的小额贷款参与率是前者的三倍。在
村子里广泛散布消息,要求其传播范围远远超出初始种子的直接朋友,到达他们的朋友的朋友的朋友的……
[1] 例如,关于简单的培训在这种情况下可能发挥的作用等,可参阅Karlan and
Valdivia(2011)。
[2] 这里需要小心,不能把情况描述得过于乐观。对任何运转良好的大型创新,同样能找到
糟糕的案例。全球各地都有相关的报道:某些人借了太多钱,因此毁掉了财务和人生,比如因
为太多的信用卡债务而宣布个人破产的情形。小额贷款的高偿还率已吸引许多公司进入这个业
务,某些带着很进取的策略,道德动机较少,与发达国家的信用卡和小额贷款差不多。对小额
贷款在多大程度上改善了借款人的生活,已经有人展开过讨论。生产率的显著提高可能需要多
年才能展现,并难以从其他趋势和项目中分解出来,因此尽管小额贷款在世界各国快速普及,获取这些服务的人的财富或收入是否有明显提高,证据却并不统一(Banerjee and
Duflo,2014;Crépon、Devoto、Duflo and Parienté,2015)。但总之,贷款的提供依然能帮助人们熨
平消费和支出,这对极端贫困的人群尤其具有意义。
[3] 参阅Schaner(2015),例如关于家庭资金收入的变化会如何影响其支出。
[4] 自助团体是这些村里的非正式群体,往往开设联合的银行账户,并经常向团体缴款,然
后从团体得到各种形式的轮流式付款或贷款。
[5] 相反,在纽约、伦敦、悉尼或北京这种大城市里,人们可能跟某些人面对面交流,跟其
他人通过社交媒体或电话交流,其熟人可能遍布整个城市乃至更大的世界。对如此大规模而多
样化的网络做较完整的描述几乎不可能,而在小村子里则是可行的。我们通过一系列有关居民
间彼此交流方式的问题来测量人际网络:资金借贷、提供建议、煤油的借贷(用于烹饪和取
暖)、紧急救助等。这些村庄平均有超过200个家庭,每个家庭以这些方式平均同15个其他家庭
交往,但彼此差异很大,度小于10或高于20的家庭数量都不少。
[6] 实际上,最终的小额贷款参与率同初始种子的中心度的直接关系图显示出不显著的轻微
负向关系特征。在控制各村庄的若干特征后,依然没有显著相关性。该研究的详细内容可以参
阅Banerjee、Chandrasekhar、Duflo and Jackson(2013)的补充资料表S3。
[7] 如果是有关人们不熟悉的某种新产品,他们在做决定前希望看其他人怎么做,那么这些
种子的人气度会重要得多。这方面的研究可参阅Cai、de Janvry and Sadoulet(2015),Kim et
al.(2015)。
[8] 还有许多其他因素可能影响参与率,包括朋友的参与决策。在统计数据分254析中,我
们仔细控制了这些因素的影响。有关细节和技术处理,可参阅Banerjee、Chandrasekhar、Duflo
and Jackson(2013)。传播中心度
这还不是小额贷款故事的结局。
对任何话题的兴趣最终都会随时间衰减。大多数新闻报道获得的主
要关注是来自最初的几小时或几天,很快会被后来的报道取代,不但是
在媒体上,也反映在人们的交谈与进一步传播上面。这意味着,特征向
量中心度可能过度测算了网络中的位置对散布消息的作用。一方面,只
看中心度忽视了消息传播不止一个环节的事实。另一方面,特征向量计
算方法把传播理解为在网络中无限循环的无休止的过程。现实其实是介
于这两种极端情形之间的。
考虑到这点后,我们在小额贷款案例的研究中定义了一种新的中心
度测量指标来反映实际传播过程。人们散布消息,但在一定数量的迭代
后将不再就某个话题继续交流。例如某个话题可能会被议论两三天,然
后大家就失去了兴趣。我们对小额贷款消息传播的估计是,通常会经过
大致三次迭代的传播,不怎么会超出“朋友的朋友的朋友”的范围。
还有,某些话题会激励人们去和所有认识的人谈论,其他话题就不
行。在小额贷款的案例中,我们估计在每次迭代中,一个家庭的人向某
个朋友谈及的频率大约为15。这好比在计算南希和沃伦的分值时,采
用15的权重,而非12,另外只传递到朋友的朋友的朋友的范围,而不
是无限迭代下去。
[1]
于是南希的得分依然会高于沃伦,但超出幅度会
缩小。
传播中心度(Diffusion centrality)介于中心度与特征向量中心度这
两种极端情形之间。如果让迭代次数以及从一个节点到另一个节点的信
息传播概率足够大,那么传播中心度就接近于特征向量中心度。如果只做一次迭代,或者信息传播概率很小,传播中心度将与中心度成比例。
在中间情形下,它反映着一个人在网络中的影响范围有限,并与传播内
容是否热门和持久有关。
在小额贷款信息的传播上,结果表明传播中心度是比特征向量中心
度还精确得多的预测指标。对于解释小额贷款信息在村子之间的传播,初始种子的传播中心度的解释力是他们特征向量中心度的好几倍。
[2]
这一故事的最终寓意是:可以用不同方式测量中心度,在不同情景
下,某些测量指标的预测表现会比其他指标更为出色。
至此,我们已经看到了用三种不同的思考方法测算一个人在网络中
的位置。中心度反映直接影响力,特征向量中心度反映一个人的朋友的
势力,传播中心度反映一个人在给定时间和兴趣程度下传播或接收信息
的范围。正如上文中篮球运动的例子,这些仍只是描述网络中位置重要
性的很多方法中的几种。尽管我们不需要把其他方法都罗列出来,但仍
有一种中心度测量指标与之前介绍的几种存在关键的区别。美第奇家族
的崛起这一迷人的历史事件,能够让我们从权力的视角揭示最有趣的中
心度测量指标之一。
[1] 有关的计算细节,可参阅Banerjee、Chandrasekhar、Duflo and Jackson(2015)。
[2] 这一指标在估计传播概率和迭代次数上更具灵活性,因此在预测上理应比其他指标更
好。但即使在分析消息传播前固定传播概率和迭代次数,该指标在这些村庄里的结果也表现更
好。为了限制传播中心度相对于其他指标的优势,我们根据某些基本网络特征固定了家庭之间
的交流频率(使得信息刚好能传播到网络中的所有人),根据研究中人们接触到小额贷款的时
间固定了迭代次数。即使如此,传播中心度的表现也超过其他指标[可参阅Banerjee、Chandrasekhar、Duflo and Jackson(2013)补充材料表S2的第10列]。更多的差异可比较该表底
部的R2(衡量不同村庄的小额贷款参与率有多大比例能被各种中心度指标解释)。事实表明,传播中心度增加的R2是特征变量中心度的3倍以上。美第奇家族的崛起:人际网络的早期案例
美第奇家族创造了我,同时也毁灭了我。
——达·芬奇
政治问题在科西莫的房子里解决。由他选的人出任职务……他才是
决定战争与和平的人……他是无冕之王。
——教皇庇护二世
公元1434年对佛罗伦萨是个关键的年份,自此形成的庇护环境孕育
了早期的文艺复兴。佛罗伦萨从多个富有的政治望族——如阿尔比齐和
斯特罗齐——的不同派系统治的寡头政体,转变为由一个家族——美第
奇家族——执掌的社会。这段时间前后,美第奇家族委托艺术家多纳泰
罗完成了独特而充满创意的著名的真人大小的大卫铜像,以纪念这位战
胜强大怪物的英雄,或许并非出于偶然。是什么让该家族的族长科西莫
·美第奇集中并巩固了权势?
美第奇家族尽管出身精英,但15世纪30年代之前在政治和金钱上都
并不出类拔萃。例如,斯特罗齐家族的财富更多,在地方议会中掌控着
更多席位,然而美第奇的崛起让他们黯然失色。
1434年以前,美第奇家族同其他寡头——包括斯特罗齐和阿尔比齐
家族在内的其他有财富和权势的银行业家族——展开了角逐。斗争在
1433年白热化,科西莫与美第奇家族的其他成员被逐出佛罗伦萨,斯特
罗齐和阿尔比齐这两个家族在其中扮演了关键角色。家族之间的对立不
只是因为对当前权力的争斗,以及同竞争城市卢卡的战争失利带来的经
济负担,还有更深的根源。美第奇家族,尤其是萨尔韦斯特罗·美第奇(科西莫的堂兄)是14世纪70—80年代反抗势力强大的行会的“梳毛工
与酒馆老板起义”的主要支持者。这场被称为“人民党”(Ciompi,其大
致含义是:“朋友,我们来喝一杯”)的起义是为了反对重税以及抗议贵
族阻止低阶层民众加入行会和掌握政治经济权力。起义虽然最终失败,但却带来了持久的变革,美第奇家族对起义的支持也让他们在之后几十
年获得了声誉。随着美第奇家族的银行帝国持续扩张,他们同其他寡头
家族的竞争在1433年进入高潮。当时,其他寡头家族占据了执政团
(Signoria)的多数位置,这是统治佛罗伦萨的有轮值特色的核心政治
实体,包含9位名为执政官(Priori)的公会成员。1433年9月,阿尔比
齐家族的密切盟友伯纳多·瓜达尼(Bernardo Guadagni)成为司法长官
——由执政官轮流担任的一个职位。里纳尔多·阿尔比齐联合斯特罗齐
家族及其他害怕美第奇的寡头家族,说服了伯纳多与执政团将科西莫·
美第奇及其部分家族成员逐出佛罗伦萨。这一决定是在阿尔比齐家族的
军队监视下,由执政团在同部分聚集起来的市民匆忙协商后做出的。
美第奇家族的流亡没有持续多久。反对美第奇家族的寡头们严重低
估了科西莫的势力。他和盟友设法将大量资本撤出了佛罗伦萨,由于同
卢卡的战争失利已经造成的沉重打击,导致了严重的金融危机。此外,通过美第奇家族与其他家族的许多盟友,科西莫还影响了新的执政团人
选,很快令局势彻底改观。科西莫于1434年秋在盛大游行中重返佛罗伦
萨。短短几天后,轮到里纳尔多·阿尔比齐被驱逐了——这次是永远。
科西莫靠什么权势召集众多的盟友,组织报复行动并改组政府?为
什么阿尔比齐家族没有能力反制?
首先,无须赘述的是科西莫必须非常有自知之明。能够在那样高度
激烈的竞争环境中巩固和支配权力需要极大的远见、极强的手腕和极高
的智慧。这种对人生的智慧与宽阔视野表现在:科西莫对哲学的浓厚兴
趣,委托学者对柏拉图的著作做了首次全文翻译;对艺术的广泛资助,不只是对多纳泰罗,还包括安杰利科、菲利波·利比、吉贝尔蒂、米开罗佐和布鲁内列斯基等;支持佛罗伦萨设立首家公共图书馆;以及作为
大使和在国际政治中扮演的角色等。科西莫是位真正的文艺复兴人士,他的慷慨,与他的商业、社会和政治活动,使大约一个世纪之后的尼科
洛·马基雅维利对其崇敬有加。马基雅维利写道:“科西莫是最为慎重的
人之一,有着严肃而谦卑的风度,又极端开明和仁慈。他从未尝试过反
对党派或统治者的任何事情,对所有人都慷慨大度;凭借这种不懈的大
度品性,他成为所有层级的公民的同路人。”(Book IV of History
ofFlorence )
其次,从我们的视角来看更关键的是,科西莫对佛罗伦萨的社会和
经济网络大拼图的深刻理解及其所处的幸运位置至关重要。这个位置使
他能建立和掌控一个早期的政治党派,而当时的其他主要家族的反应则
显得不知所措。
美第奇家族的网络涉及两组关键的联系:商业与婚姻。商业事务以
他们的银行为中心,包含整个大家族成员中的特许经营权。美第奇银行
不仅是佛罗伦萨的精英家族的主要资金来源,也为许多非精英家族提供
便利,甚至还服务于教皇和遍布当地的众多宗教领袖。除基本的银行和
贷款业务外,美第奇家族也参与了各类合伙企业、房地产交易与贸易。
在这些经济联系之外,还有同其他精英家族的联姻网络作为补充。
当时精英家族间的婚姻远没有浪漫可言。这种联姻可能安排某个家
族三十多岁的儿子迎娶另一个家族十多岁的小女儿。女孩充当某种社会
担保品,把新的家庭同自己的血亲捆绑起来,女婿则往往成为与对方家
族交往的重要商业联系人和政治帮手。
[1]
这类商业与婚姻纽带体现了巩固关系所需的同盟和担保,形成了有
利的合作环境。否则,政治联盟与经济合同都会难以执行,竞争可能过
于激烈。
从图2.7中可以看出,美第奇家族在佛罗伦萨部分关键精英家族间的婚姻和商业网络中处于独特地位。图中的每个节点代表一个家族,两
个家族之间的联系代表连接他们的婚姻,或者各种商业伙伴及其他交易
关系。
该网络揭示了美第奇家族地位的若干重要特征。最明显的一点是他
们的联系比其他任何家族都多,婚姻与商业联系的数量几乎是两个主要
竞争对手阿尔比齐家族和斯特罗齐家族各自的两倍。
图2.7 节点代表15世纪佛罗伦萨的部分关键家族。黑色实心节点的家族支持美第奇家族,格子
底纹节点的家族属于美第奇的对立派,灰色实心节点(萨尔维亚蒂家族与巴尔巴多里家族)与
双方均有结盟。家族之间的连线代表存在婚姻或商业联系。
除联系数量之外,美第奇家族还在他们同盟家族中起到关键联系人
的作用,而对立的家族中则没有这样独特的联系人。例如,阿齐亚奥
里、基诺里、帕齐和托纳布奥尼这几个家族相互之间均没有直接联系,都是通过美第奇家族联系在一起。在该图显示的15个家族之外,情形同
样如此:根据更为完整的包含92个精英家族的数据库,同美第奇家族联姻的家族中有超过半数同最多两个其他家族联姻,而同反对美第奇的家
族联姻的家族中,则有超过半数同四个以上的其他家族联姻。
[2]
因此,美第奇家族处于他们一派势力的核心,担当着关键联络人的
角色。从图上看他们似乎处于一个星形的中心。相比之下,图的另外一
侧没有这样的关键家族:各反对家族相互联系更密集,更分散化。为清
晰起见,我们把上面的网络拆分成两个部分,如图2.8所示。
[3]
这一网络位置的意义可以通过一个简单类比看清楚。假设你举办一
个小型聚会,大多数来宾只认识你(或许还认识另外一位)。聚会中的
谈话因此可能会围绕你展开,你会处在一个独特位置上,知道不同来宾
有哪些共同点,什么话题可能让人感兴趣。相反,如果小型聚会上的来
宾彼此都是朋友,交流就可能分散得多,并会分解为不同的谈话或群
组。用这个类比来思考文艺复兴早期佛罗伦萨的政治活动并不牵强,当
时的交流必须面对面展开或者利用书信。美第奇家族不只能协调与他们
有联系的家族的政治行动,而且处于独一无二的绝好位置。美第奇家族
不需要担心自己的支持者分散开,去讨论他们没有授权的话题。与之相
比,他们的主要对手阿尔比齐家族的位置就不够有利。反对美第奇的各
个家族没有一个领导家族,也未能在关键时刻采取协调行动。
[4]
美第奇家族关键的网络位置还能让我们明白,他们的财富和生意在
科西莫指挥下何以能够蒸蒸日上。他们被称为“文艺复兴时代的教父”,这不是偶然。美第奇家族在网络中的位置非但对协调政治行动至关重
要,也使他们成为许多商业交易的突出的中间人。要在各种交易中确保
安全感,家族联系或以前的生意往来能有所帮助,或者是通过与自己有
联系的某位中间人来交易。美第奇家族是许多对其他家族之间的关键连
接点,关系网中的很多路径要通过他们,其数量远超其他任何家族。例
如在这一联姻网络中,有超过一半的成对家族之间的最短连线通过美第
奇家族,而通过斯特罗齐家族的只有约十分之一,通过阿尔比齐家族的
数量也差不多。从该连接指标来看,得分仅次于美第奇的是瓜达尼家族,他们成为网络中超过四分之一的连线的关键联系人。网络学家将该
指标称为“中介中心度”(betweenness centrality),其变形在20世纪70年
代由雅克·安东尼斯(Jac Anthonisse)和林顿·弗里曼(Linton Freeman)
首次引入。
[5]
对网络中的每个节点,中介中心度反映了其他各对节点
之间的最短连线通过该节点的比例。图2.8 支持美第奇的各家族的网络与反对美第奇的各家族的网络。把美第奇家族从其群组中拿
走,会使图(a)中的整个网络解体,而图(b)中则没有哪个家族处于必不可少的位置。中介中心度包含我们刚刚分析的两个观念:如果某个节点的两个朋
友彼此没有直接联系,他们之间的最短连线就会通过该节点,即该节点
位于他们之间。这使得该节点不但能担任经纪人或中间人,而且可以成
为其他节点的行动的协调人。这就能解释美第奇家族一方面是商业中的
居间人,另一方面又是政治行动的核心组织者。他们的位置比其他家族
好得多,也非常聪明地利用了这一点。
[1] “政治帮手”(political lieutenant)这个说法来自Dale Kent(1978)。Kent在20世纪70年
代对数据的仔细整理给这里的人际网络分析奠定了基础。后来的研究(John Padgett and
Christopher Ansell,1993)对这些数据做了拓展,并对其中的网络深入分析。这里的图示中的数
据来自Ronald Breiger and Pip Pattison(1986),其中借鉴了Padgett的研究的数据,还包括
Padgett的研究中的另一个家族集合。我对引用的数据做了相应更新,包括在美第奇的对立派一
边的阿尔比齐家族与佩鲁齐家族及加斯科尼家族的婚姻和商业联系。
[2] 这个观点来自Padgett and Ansell(1993)。该研究认为:美第奇家族的政治控制力由精
英网络的分裂所致,只有该家族能够居间协调。另可参阅Burt(1992,2000,2005)。
[3] 普奇家族是美第奇的强烈支持者,尤其是给流亡中的科西莫及其家人提供了援助。因此
尽管有关数据没有包含他们之间的正式的商业或联姻联系,他们依然维持着稳固的联盟。另外
我在美第奇家族一边加入了萨尔维亚蒂家族和巴尔巴多里家族——由于他们在冲突中的最终站
位。如果放弃他们,而把普奇家族的联系加进来,会让美第奇的星形状态更为突出。
[4] 美第奇一派与对立寡头之间的差别在1434年9月底最终摊牌时表露无遗,也就是科西莫
返回佛罗伦萨之前。里纳尔多·阿尔比齐试图组织人马接管即将坚定地倒向美第奇家族的政府。
他呼吁包括斯特罗齐家族在内的其他家族派出武装力量,但由于这些家族之间要相互商议,反
应很混乱。相反,科西莫即使在流亡之中,也能借助自己的核心位置轻松聚集起武装力量保卫
新的执政团。
[5] 来自Jac Anthonisse(1971)和Linton Freeman(1977)。关于尼克松和福特的人际网络
的分析可参阅Ferguson(2018)。“教父效应”:中心度带来中心度
伟人不是生而伟大,而是越活越伟大。
——维托·柯里昂(《教父》中的黑帮老大)
凡有的,还要加给他,叫他有余;没有的,连他所有的也要夺过
来。圣经如是说,至今依然。
——比莉·荷莉黛(Billie Holiday)与小亚瑟·赫尔佐格
(Arthur Herzog Jr.)的歌曲《God Bless the Child》
我们不清楚科西莫在多大程度上有意识地设计了美第奇家族的网络
位置,以及他是否清楚成为其他家族的关键连接点的重要性。但无论如
何,婚姻是人为的安排,而非偶然的事件。此外,众所周知科西莫愿意
为因欠债而被禁止参与佛罗伦萨政治活动的家族还钱,由此积极地培育
了其他家族的联系和忠诚。这对于选举出支持美第奇家族的执政团、让
他从流亡中回归起到了关键作用。
然而,除构建网络的所有精心设计外(本书第5章和第9章对此还将
做更多讨论),网络形成中还存在反馈效应。这些效应能解释为什么某
些人的位置最终会远比其他人更接近中心。
中心度能带来更多中心度。如果人们新交到的朋友与他们已经有的
朋友数量成比例,则朋友的数量就会像复利那样增长。已经处于更中心
位置、朋友数更多的人,其中心度分值的增长将快于位置不够中心的
人。
在网络环境下,这一过程被称为“优先连接”(preferentialattachment)——新联系的形成与某个节点已经有的联系的数量成比
例。艾伯特-拉斯洛·巴拉巴西与雷卡·阿尔伯特研究过优先连接效应,发
现这会使网络中节点的联系数量出现高度悬殊。
[1]
可是为什么我们在网络环境下会看到优先连接或类似的复利倍增机
制?
假如你需要信息,那应该去联系在人际网络中交际广泛的人士。因
此,有更多联系的人在交往中更具吸引力。
[2]
不过复利效应还有另外
一方面。中心度的增长不仅来自与处于中心的人联系有多大吸引力,还
取决于是否容易联系到处于中心的人。对该课题,我与自己之前的学
生、经济学家布莱恩·罗杰斯曾开展过研究。
[3]
你是如何结识朋友的?有些是通过你的朋友——由某个朋友引见,或者在朋友组织的聚会上见面。友谊悖论在这里有潜在影响:你最容易
结识的是那些已经有最多朋友的人。由此会造成富者愈富的现象,居于
更中心位置的人更容易参与会面,也更容易结交新的朋友。
如果是通过老朋友结识新朋友,那么你见到某个人的概率就同他们
已经有的朋友的数量相关。假如某人的朋友人数是另一人的两倍,你见
到他的概率就是另一人的两倍,因为认识他的任何一位朋友,都会给你
一次见到他的机会。于是有更多朋友的人会以更快的速度结交新朋友。
有证据表明,此类效应在更为广泛的场景中同样存在,从研究人员如何
寻找合作者,到出口商如何开发新的商业合同。
[4]
如今这已成为互联
网社交平台上内置的机制,你之所以得到建立新联系的建议——“你认
识某某人吗”,恰恰是因为被推荐者已经是你的朋友的朋友。该算法表
明,新的联系是基于现已存在的网络。
我和罗杰斯的研究发现,网络本身在新的联系形成中作用越大,复
利效应就越明显,节点之间联系的不平等越突出。当人们通过现有联系去寻找其他人的时候,可以出现巨大的乘数效应。它不但会增加一个人
的度,还会影响特征向量中心度和传播中心度等指标,因为同其他联系
广泛的节点增加了联系。这在商业环境中尤其重要,处于较好的位置会
让人在相互联系中更具吸引力,也更容易被人找到,从而更便于建立关
键联系与形成滚雪球现象。
这种效应的程度以及由此导致的网络位置的不平等,在不同场景下
有巨大差异。某些网络相当平等,人们的中心度只有少数随机差异,某
些网络则有着极度的不平等。某所高中的学生之间朋友数目的差异也许
很随机,完全像扔硬币一样。相反,如果我们分析的是有多少链接指向
不同的网页,其差异则会非常不均等,而且发现某个网页似乎主要取决
于现有链接——通过现有链接越容易找到某网页,该网页就越能获得更
多的链接。相比高中生之间的朋友网络,互联网网页的度数之间的差异
程度要大得多。
[5]
[1] 参阅Barabási and Albert(1999),Price(1976),Krapivsky、Redner and
Leyvraz(2000),Mitzenmacher(2004),Jackson and Rogers(2007a),Clauset、Shalizi and
Newman(2009)。他们分析互联网上“Notre Dame”域名的不同网页有多少链接时已发现了该现
象。另外参阅Albert、Jeong and Barabási(1999)。
[2] 例如从专利数据看,与联系较多的人(在过去与多少人有过联合专利)联合申报专利,相对与联系较少的人联合申报专利,成功的概率更高。可参阅Akcigit、Caicedo、Miguelez、Stantcheva and Sterzi(2016)。
[3] 参阅Jackson and Rogers(2007a)。另一种可能性是,人们只是拷贝其他人的链接,或
把随机与喜好因素给混合了。有关研究可参阅Kleinberg、Kumar、Raghavan、Rajagopalan and
Tomkins(1999),Kumar、Raghavan、Rajagopalan、Sivakumar、Tomkins and Upfal(2000),Pennock、Flake、Lawrence、Glover and Giles(2002),Vázquez(2003)。这会导致类似的分
布结果,但在其他网络特征上存在差异。
[4] 可参阅Fafchamps、van der Leij and Goyal(2010),Chaney(2014),Jackson and
Rogers(2007a)。
[5] 参阅Jackson and Rogers(2007a)。网络中的影响力和权势的分类
我们已经看到,网络结构给财富和政治权力指标以外的影响力提供
了关键的解释。此外,网络结构的意义经常超出简单计算每个成员间各
自有多少联系。我们的分类法包含了四种人们发挥影响力的基本途径,以及与之相关的测算人们在其网络中的中心度的指标:
[1]
◎人气度——“中心度”:某人是否有很多朋友、熟人和关注者?
在社交媒体中把消息发送给数百万关注者的能力,让一个人拥有了影响
大量民众思考和了解什么的力量。人气度高的人受到超出比例的关注,由此可以扭曲人们对趋势和习俗的看法。
◎联系(你认识谁)——“特征向量中心度”:某人是否与其他交
际广泛的人有联系?朋友数量多可以有帮助,但拥有几个位置绝好的朋
友同样有用,甚至更加重要。
◎影响范围——“传播中心度”:某人所处的位置在多大程度上利
于传播消息或最早得知消息?能否通过网络中有限次数的传播影响很多
人? [2]
◎中介桥梁——“中介中心度”:某人是不是高能量的经纪人、关
键的中间人,或者处于协调他人的独特位置?其他人之间的相互联络是
否必须通过此人开展?某人是不是某个群体与其他群体之间的关键桥
梁,离开他就无法连接?
从一定意义上讲,人气度是个局部性的指标,我们只需要数清一个
人有多少朋友或熟人。而其他三个概念更具有全局性,包含更大范围的
网络的信息。哪一种中心度的概念更适用,人们如何发挥力量,则取决于场合。我们很快将会看到,这些概念在传染、不平等和极端化等现象
中起到了关键作用。
[1] 除这里提到的之外,还有许多其他测量中心度的指标。某些在概念上相似,但计算方法
略有不同,其他涉及另外的概念。对数学更感兴趣的读者可以参阅Borgatti(2005);
Jackson(2008a,2017);Bloch、Jackson and Tebaldi(2016);Jackson(2017)。
[2] 这同时涉及所谓“紧密中心度”(closeness centrality)的指标,反映某人同他人的密切程
度。第3章 扩散和传染
导读
◎黑死病杀死过亿万人口,但真正令人惊讶的是其蔓延的速度之慢
与有条不紊。
◎疾病的传播映射着人类的移动和交际范围。阻止传染的秘诀在于
控制“基本再生数”。但由于网络中的外部效应,个人激励并不等于社
会最优,根除任何疾病都极其困难,大多数传染病仍会周期性暴发。
◎人类网络中常见的“巨型分支”把绝大多数人绑在一起。无论是
流感、时尚或者热门消息,我们均无处可逃。
◎社交网络极为稀疏,但人与人之间的连接路径却非常短。我们今
天生活在“六度分隔”的小世界中——短短几次转发,你的信息便可以
抵达地球上的任何人。
多少勇敢无畏的男子、如花似玉的美人、活泼可爱的少年……早晨
还和亲朋好友一起享用茶点,夜里却和他们的祖先一起在冥界共进晚餐
了!
——乔万尼·薄伽丘,《十日谈》(1353)
1347—1352年前后,腺鼠疫(俗称黑死病)缓慢但持续地在欧洲蔓
延。罪魁祸首——鼠疫杆菌——是由跳蚤携带的病原体,在它们吸食感
染者的时候摄入。这种杆菌会堵塞跳蚤的消化道,使它们更加渴望营养
物,从而贪婪地继续觅食,将杆菌传染给更多宿主。跳蚤很适应寄生在
老鼠、人类和其他动物身上,某些抵抗力强的宿主充当细菌携带者,其
他一些则在被叮咬和感染后很快死亡。这种疾病非常可怕:开始像流感
那样令人衰弱和发烧,但很快转为大范围出血。坏死的组织呈现黑色,从而有了“黑死病”的名称。
当时的卫生条件、对传染病的认识不足,以及人类和许多动物接触
密切,共同导致这种疾病对中世纪的勃兴城市带来致命的打击。
[1]
它
使巴黎和佛罗伦萨的人口在两三年内减少了大约一半,汉堡和伦敦等城
市的死亡人数更多。现在我们认为,黑死病是从中国沿着丝绸之路传到
君士坦丁堡,然后在1347年随着热那亚的商船进入西西里岛,很快消灭
了岛上近一半的人口。此后疾病继续蔓延,冲击意大利部分地区,此后
是马赛,再扩展到整个法国和西班牙,最终在几年后进入北方的一些国
家。总体上,黑死病估计杀死了超过40%的欧洲人口,在抵达欧洲前还
在中国和印度夺去了约2500万人的生命。
从现代视角来看,真正令人惊讶的是这种疾病蔓延的速度缓慢但又
有条不紊。虽然黑死病的传播偶尔会出现远距离跳跃,例如沿着丝绸之
路等贸易路线或者通过航船,但它在整个欧洲的推进平均来说每天却只
有约两公里,即便以当时的徒步旅行标准看也相当缓慢。
[2]
尽管黑死
病很少在人与人之间直接传染,但却是随着人类活动而蔓延——通过寄
生在船舱的老鼠、农场牲畜和人类身上的,以及躲藏在衣服中的跳蚤
——因此这种瘟疫的传递是依赖人类网络以及人类周围的各种动物。
黑死病的缓慢传播告诉我们,中世纪时大多数人类的移动和交际范
围是多么有限。现代的传染病大不相同,传播极其迅猛,通常在几周甚
至几天之内就跨越不同的大陆。2014年通过在南加州一家美国主题公园
的接触而在未接种疫苗的成人和儿童中暴发的麻疹,几天后就出现在数百英里外的学校里。2015年暴发的埃博拉病,在一周内便由塞拉利昂的
医疗工作者带到欧洲和北美的城市。
本章我们将看到,传染和扩散如何受到网络结构的影响。除对于疾
病传染的深入探讨外,这方面的认识还将提供一个起点,以理解观念、金融情绪以及就业和工资的不平等性等更为复杂的传播现象——它们将
是后续各章的主题。
[1] Katharine Dean et al.(2010)认为,黑死病在中世纪的传播或许主要是通过256跳蚤和虱
子,它们的宿主以人类为主,不太依赖老鼠和其他动物。当时的卫生状况使得跳蚤和虱子十分
常见,并能轻易找到新的宿主。这一疾病在现代的病例较为罕见,更多是因为人与有跳蚤寄生
的动物接触,或人与人比较密切的接触所致。而身上经常带有跳蚤和虱子的人数大大减少,使
这些寄生虫更难以直接在人与人之间传播。
[2] 参阅Marvel、Martin、Doering、Lusseau and Newman(2013)。传染与网络结构
吕克斯:会传染吗?
普斯多鲁斯:你见过不传染的瘟疫吗?
——伯特·谢夫勒夫与拉里·吉尔巴特所著剧本《春光满古城》中
的对白
我们今天的许多网络与中世纪的人际网络当然有巨大差异,但从一
种特殊类型的现代网络中,我们仍能学到与黑死病缓慢而顽固的蔓延有
关的许多原理。
图3.1描述了美国一所高中青少年的浪漫关系(或者说性关系)网
络。学生记录的是18个月中的交往关系。
[1]
在该图描绘的网络中,典型的学生只有一个或两个交往对象,可是
该网络依然出现了一个“巨型分支”(giant component):图的左方的巨
大相连部分,包含通过一系列相互关系而连接起来的288名学生。图3.1 美国中西部一所高中里的人际网络,来自Add Health数据库。图中的节点代表各个学
生,颜色代表性别。每条连线代表在18个月的时间内存在恋爱或者性关系。某些分支旁边的数
字代表这类分支出现的次数,例如,有63对学生只在他们相互间存在关系。孤立的学生没有显
示在图中。有刚好超过一半的学生处于图左方的一个巨大分支中。对本图中的数据首先加以分
析和探讨的研究成果是Peter Bearman,James Moody and Katherine Stovel(2004)。
“分支”是一个网络的各个部分,其中的每个节点都能通过一条联系
路径到达彼此。
[2]
图3.1中有刚好超过一半的学生处于巨型分支中,其
余分属许多小型分支。
[3]
有超过四分之一的学生报告说没有恋爱关系
(大家应该都记得高中的寂寞时光),这些人并未显示在图中。
该图凸显了一个危险:尽管平均而言每个学生只有很少的交往对
象,但性传播疾病却可能蔓延到很大一部分群体。图中的每个连接都代
表疾病从一个人传染给另一个人的可能性。如果巨型分支中的某个人染
病(例如通过与校外的某人交往),疾病就可能在这一分支乃至整个学
校中广泛传播。
[4]
例如,HPV病毒(人乳头瘤病毒)就是通过性传播,可能导致宫颈
癌等几种癌症。HPV病毒的一个危险在于,它通常是无症状的,被感染
者没有理由认为自己染病,从而可能继续把病毒传染给其他人。据估计,大约有40%的美国成年人携带HPV病毒,其中许多人并无意识。
[5]
大多数被感染者对性关系的态度并不随意,他们只是碰巧成了巨型
分支的一部分。
从图3.1中,我们能一眼看出为什么疾病的传播可能比较慢,因为
每个人的连接数量较少。可是通过巨型分支,最终仍能达到很高的感染
率,正如当年的黑死病那样。
从图中还能看到,疾病的传播并不依赖有滥交者或性工作者的存
在。连接度较高的人可以放大和加快疾病的传播,但对于有着巨型分支
的网络而言他们并非必要条件,只需要每个人有一个以上的连接就足够
了。
这样的网络达到的连通性给广泛的传染提供了可能。
[1] 该图的数据来自Peter Bearman、James Moody and Katherine Stovel(2004),其中涉及
Add Health数据库(即本书第1章引用的the National Longitudinal Adolescent Health data set)。本
图与该研究中的图2略有差异。
[2] 具体而言,分支是指网络中的一个部分,其中的每个节点都能通过网络中的路径到达彼
此,其最大范围是指该分支中的所有节点的每个连接(也即分支中的节点的所有相邻节点)都
包含在该分支中。
[3] 人类网络通常只有一个巨型分支。有两个巨型分支要求每个分支里都有很多人,而这两
个分支如果要彼此分开,一个分支中的任何人都不能与另一分支中的任何人有连接。当人数较
多时,这是很难做到的。只需要一个跨越分支的连接,就能将两个分支合二为一。
[4] 这里忽略了时间因素。某些人际关系发生前,其他一些就结束了,因此对疾病在该网络
中的传播方向肯定有某些限制。若考虑时间因素可能迟滞传染过程,但未必能避免巨型分支中
的很多人依然被传染。更多研究可参阅Johansen(2004),Wu et al.(2010),Barabási(2011),Pfitzner、Scholtes、Tessone、Garras and Schweitzer(2013),Akbarpour and
Jackson(2018)。
[5] 根据人口样本以及检测和定义采用的技术,对该病毒普及程度的估计有很大悬殊,并由
于很多人对自己被感染一无所知而变得更复杂。性行为活跃人群中曾经被感染的比例估计远远
超过50%,有关研究可参阅Revzina and DiClemente(2005)。相变与基本再生数
“相变”(phase transition)这一术语经常用在热力学中,意思指物质
形态的改变。
[1]
例如当水变成冰或水蒸气时,我们就说发生了相变。
人类网络也在发生相变,从孤立节点和小型分支的聚集,到包含由
相当比例的节点构成的巨型分支,并最终形成所有节点都能通过网络路
径连接的形态。网络中的联系所占比例的增加,就好比随着温度的提
高,把冰变成水,再变成水蒸气。
相变的一个醒目特征是其发生可以非常突然。温度略低于冰点时,你还站在冰上,而提高1度之后,你就掉进了水里。类似的是,网络中
联系频率的微小改变可以对其组成结构产生巨大效应。图3.2描绘了这
种情况。随着每个人的平均朋友数从0.5人[图(a)]增加到1.5人[图
(b)],我们从一个基本没有连接的网络跨越到一个大多数人能相互
连通的网络。联系频率的进一步小幅提高[图(c)和图(d)]使之成
为“路径连通”(path-connected)或简称“连通”(connected)的网络:其
中的每个人都能通过网络路径实现彼此联系——图(c)处于近似连通
状态,还有两个节点未被连上。
网络的相变对疾病控制具有基础性的意义。与疾病及可能传播疾病
的网络有关的一个关键数字是疾病的“基本再生数”(basic reproduction
number)。其含义是一个典型的感染者会让多少其他人受到新的感染。
若基本再生数大于1,则疾病会蔓延,若小于1,则疾病会消亡。
基本再生数的临界值为1,对应图3.2所示的网络出现巨型分支的相
变情形。背后的原理极简单却很关键:每个感染者造成的新感染多于1
个,传染就会继续扩大,每个新感染会造成更多人被感染,使其不会停止。而低于临界值时,传染过程会走向衰减。用网络的术语讲,如果每
个人有1个以上的朋友,则这个分支会向外生长,扩展为一个巨型分
支。如果平均朋友数小于1,网络将成为大量互不连接的小型分支与孤
立节点的集合。这与物种繁殖(再生)有着明显的相似性:如果一个社
会中每个成年人的平均子女数多于1,如此循环,社会将成长壮大。如
果每个成年人的平均子女数小于1,社会将走向萎缩。图3.2 不同平均度数的网络对比。如图(a)所示,每个节点的连接少于1的网络处于零散状
态。一旦如图(b)那样,每个节点的平均连接数大于1,就会连接成一个巨型分支:图(b)右
下方通过路径能够彼此相连的很大一群节点。每个节点的平均连接数继续稍有增加,会使几乎
所有节点被联系起来,如图(c)所示。最终导致网络实现完全的路径连通,任意两个节点都有
路径能连接起来,如图(d)所示。
我们很容易找出某个种群的再生数由于环境的关系,降低到每个成
年个体的生存后代数量低于1,使其走向灭绝或接近灭绝的例子。美洲
野牛的数量在18世纪可能超过5000万头,到19世纪末只剩下约500头。
它们的再生数在南北战争后急剧减少,因为新建的铁路线带来了更多的
猎人,也更容易把兽皮运出去。枪支的改进让猎人可以在很远距离外杀
死一头野牛,并且不会惊扰整个兽群,例如19世纪70年代开发出的“大
50式”夏普斯步枪拥有四分之一英里(超过400米)的可靠射程。大平原
印第安人评价说:这种枪是“用在今天,毁了明天”。
[2]
猎人数量的增
加,枪支的改进,每人杀掉更多的野牛,更快地把战利品运出去,让野
牛的死亡速度远远超出了繁殖速度。北美野牛的再生数量快速下跌,原有的种群在几十年里几乎被消灭殆尽。
疾病的基本再生数取决于从一个人到另一个人的传播有多容易,以
及每个人有多少人际联系。因为不是每个联系都会传染疾病,基本再生
数通常低于网络中的平均度数。再生数根据不同的病种和地点存在差
异。
埃博拉病的基本再生数(在没有医疗干预时)据估计在几内亚和利
比里亚略高于1.5,在塞拉利昂则接近2.5。
[3]
这一差异源于人口密度的
不同,它影响了人们每天平均接触的其他人的数量,塞拉利昂的人口密
度比几内亚和利比里亚高出约60%。
相较之下,麻疹的再生数比埃博拉病高得多,因为它不是通过血液
和唾液,而是由悬浮颗粒传染。根据当地的人口密度与接触频率,再生
数可达到12~18。麻疹对于未接种疫苗的人群而言非常危险。白喉、流
行性腮腺炎、小儿麻痹症和风疹等疾病的再生数介于其间,为4~7。
[4]
疾病再生数的差异对应着不同的网络环境。艾滋病毒(HIV)要通
过亲密接触才能传染。而只需要一次握手,或者在汽车或飞机上坐在咳
嗽的人附近,就能让人们染上流感。由此导致在流感传播网络中存在太
多的人际连接,而艾滋病传播网络中的连接数较少。然而这并不意味着
艾滋病不会传播,它在世界上某些地区和某些人群中的再生数远远高于
1,因此在全球的许多社群中依然相当常见。
[5]
再生数是免疫政策的核心。疫苗并不需要完全有效,或者接种到每
个个体,才能阻止疾病的广泛传播,它只需要把再生数降低到1以下即
可。接种疫苗不仅能保证接种者的安全,而且阻断了他们在传播网络中
的联系,由此降低了社会中的疾病再生数,有利于保护其他人群。假如
开始时的疾病再生数为2,每个感染者平均会传染2个人,那么只需给略
超过一半的人口接种疫苗,就会使疾病再生数低于1,从而限制疾病的蔓延。
不幸的是,人们必须给自己接种疫苗的激励,这恰恰也是许多疾病
如此难以根除的部分原因。因为存在我们熟知的“外部效应”,人们的激
励往往处于次优的水平。
[1] 有关背景可参阅Stanley(1971)。
[2] 大50式步枪因为1874年的一次战斗变得声名狼藉,大约30名野牛猎人在得克萨斯州潘汉
德镇的阿多比墙(Adobe Walls)贸易站对抗几百名科曼奇族(Comanche)、夏安族
(Cheyenne)和基奥瓦族(Kiowa)的战士。战斗第三天,一位名为比利·迪克逊(Billy
Dixon)的猎人在大约1538码之外射杀了一位印第安首领(他自称是出于运气),从而迫使印第
安人结束了战斗。
[3] 参阅Althaus(2014)。
[4] 这类高阶计算结果是从人群中的大量异质性特征中抽象出来的,学校内的再生数可能远
高于普通人群。大致测算通常是根据对较大人群长期病例数的观察,而更详细的信息则可以用
于防疫政策的设计。对我们的讨论而言,高阶数字能反映本质信息。
[5] 疾病的再生数可能在某个人群或某些地方大于1,而在其他人群或地方则不同,这依然
可能导致其蔓延到很大部分人群,并跨越边界。更详细的讨论可参阅Jackson and López
Pintado(2013)。外部效应与疫苗接种
一烛燃千烛,一烛寿未减。欢乐与人共,欢乐亦如常。
——佛陀
很容易出现的一幕是,一座位置关键的灯塔带来的好处,必然被大
量的船只分享,但因此对它们收费则很不方便。
——亨利·西季威克(英国哲学家、经济学家),《政治经济学原
理》(1883)
哲学家亨利·西季威克于1838年,即维多利亚女王登基后的第二
年,生于英国约克郡,死于1900年,比维多利亚女王早一年。他生前因
许多成就而得名,而且是最早真正精确阐述了外部效应的人之一。
[1]
西季威克在揭穿通灵学(psychics)上发挥了关键作用——包括在今天
变得更加有名的灵媒欧萨皮亚·帕拉蒂诺(Eusapia Palladino)。西季威
克还是纽纳姆学院(Newnham College)——剑桥大学第二所招收女生
的学院——的创建者。他撰写过关于道德理论的论文,帮助该学科在维
多利亚时代奠定了基础。
但对我们而言,亨利·西季威克的遗产反映在前面的引文中,他揭
示了外部效应的概念:一个人的行为会影响其他人的福利状况。
[2]
西
季威克指出,是别人修建和看护的灯塔,让往来的船只获得了好处。
我们都感受过或大或小的外部效应:某个邻居在学习鼓乐,长途飞
行中有人踢自己的椅背,身处交通拥堵之中……还有像气候变化的例子
中,外部效应甚至可以延伸到尚未出生的人,未来几代人生活的气候环
境部分取决于我们今天的碳排放水平。在熟悉这一概念后,你会注意到外部效应无所不在。这使得人们的
交往变得更加有趣,自由市场也不再是解决一切麻烦的灵丹妙药。在许
多道德伦理困境以及最为紧迫的社会和经济问题的核心当中,我们都能
看到外部效应,从言论自由到枪支管控乃至气候变化等。外部效应是人
类网络的一个基本特征,并将在本书中反复现身。
[3]
一位在机场咖啡店工作的员工注射流感疫苗,不仅能够帮助他自己
保持健康,也会给众多乘客带来好处,防止他们因为这位员工染上流感
而受到扩大传染。这位员工对疫苗接种的决策产生的外部效应会影响其
他人是否得病,但他在做出决策的时候,或许没有充分考虑对于其他人
的所有潜在影响。斯坦福大学(与其他很多组织类似)认识到了这点,希望帮助人们做出正确的决策,因此给学校员工和学生提供了免费的流
感疫苗。即使只给社群中的部分人接种疫苗,也会让整个社群受益。各
国政府就特别重视给学校的儿童、教师、医务工作者和老年人接种疫
苗,此类人群不仅特别容易被感染,也容易传播疾病。
政府深入参与接种疫苗事务并不是偶然现象。当存在外部效应时,自由市场无法把个人激励同社会整体福利协调起来。父母在权衡子女接
种疫苗的成本收益时,并不总会考虑到这会给其他人带来的更广泛的后
果。在此类市场中,给人们的行为提供补贴或树立监管规范对大家都有
利。要求儿童在入学前接种疫苗不仅是为了给这个孩子提供保护,还缘
于每个孩子是否接种疫苗会影响其他人受到感染的可能性。少数人未接
种疫苗,就可能使某种疾病获得藏身之地,并能更广泛地传播。
根除一种疾病的最大挑战在于,外部效应是在全球范围内发挥影
响。中国曾经在2000年宣布消灭了小儿麻痹症,但是到2011年又再次暴
发,病源可能来自邻国。同这种疾病的斗争已取得了巨大进步,就在
1988年时,全球还有超过100个国家深受其苦。然而,即使只剩下一个
国家继续流行某种疾病,就足以使其保持活性,并可能卷土重来,蔓延
至其他地方。让民众对看似已经消失的某种疾病保持警惕是费时费力、难度极大的。只是由于区区两三个国家失职,致使某种疾病继续潜伏,就让全球的孩子们年复一年地接种相应疫苗,这或许是极其令人懊丧的
事情。
疫苗接种政策还有负面反馈效应:疫苗接种工作越成功,疾病的威
胁越小,民众对保持警惕的激励就越低。当某种疾病泛滥时,人们会高
度关注,主动给自己接种——不是因为关心外部效应和他人的健康,而
是吓得给自己保命。人类最早的接种就是因为天花的致命暴发:在疫苗
接种法正式发展起来的几个世纪之前,中国人就从病人身上刮下少量干
掉的痘疤,通过吞食或者用抓痕渗入皮肤来获取免疫力。不过疾病一旦
退潮,人们就不再害怕,接种率随之下降。这会使疾病的再生数提高,使其可能再次暴发。
因为许多人对疫苗接种抱有恐惧(本书第7章对此将详细讨论),在疾病退潮时回避接种,上述的反馈效应可能导致强烈的周期现象。接
种率的微小变化可能导致疾病再生数的剧烈相变,加上传染网络的全球
规模,造成要根除任何疾病都非常困难,大多数传染病会随时间呈现周
期性暴发。按照世界卫生组织的说法,天花是被正式根除的唯一一种人
类疾病。最后一个有记录的病例是发生在1977年的索马里,1980年世界
卫生组织宣布该疾病已被消灭。完全消灭天花是不可小看的成就,全球
各国花费了几十年的工夫对新发现的任何病例做出快速反应,隔离病
人,并迅速给当地的民众接种疫苗。
[1] 西季威克发现在设计对社会福利水平的测算时,外部效应不可回避。早期的哲学家,包
括约翰·穆勒和杰雷米·边沁等人,在设计测算社会福利的方法时试图处理外部效应,但没能给
出清晰的表述。亚当·斯密(1776)与阿尔弗雷德·马歇尔(1890)在讨论市场效率时涉及这类
问题,但基本回避了外部效应——尽管马歇尔对西季威克及其作品很熟悉。马歇尔似乎对政府
做任何事情的能力都不够信任,他回避外部效应的议题或许并不奇怪,因为克服外部效应往往
需要采取监管、税收或其他政府干预措施。庇古是许多经济学家熟悉的与外部效应有关的名
字,他在1920年的一篇文章里直接提出了该议题。有趣的是,这或许是他对阿林·杨的评论的答
复,杨在1913年指出庇古的早期著述(Wealth and Welfare ,by
A.C.Pigou,M.A.,London:Macmillan,1912)忽略了这类效应,并建议更全面地将其纳入理论思考
(参阅Young,第676页)——我还要感谢阿罗提示我注意杨的文章。但直到20世纪60年代,随着罗纳德·科斯以及布坎南和斯塔布尔宾(James Buchanan and Craig Stubblebine)的两篇文章发
表,外部效应才真正形成现代理论(Coase,1960;Buchanan and Stubblebine,1962)。涉及这类概
念的中间研究成果还包括Frank Knight(1924)、Tibor Scitovsky(1954)等。对此的精彩介绍
可参阅Kenneth Arrow(1969)。
[2] 外部效应的这一定义是较为广泛和现代版本的,并不要求某人的行为对其他人的影响是
有意而为,并适用于所有类型的行为,从抽烟到工厂排污等。既包括正面外部效应,如有人提
出了网络安全方面的公共密钥加密创意;也包括负面外部效应,如有人在体育竞赛中舞弊。很
多外部效应是偶然的,也并非初始行为的原因,例如抽烟造成的外部影响等。但也有些情况存
在258故意的外部效应,例如有人编写软件,让别人免费试用。这使定义有些模糊,例如有人击
打他人,就并非我们想用外部效应概念表达的意思,却符合这里的定义。本书将坚持采用范围
可能过于广泛的定义,以简化叙述,并覆盖网络中可能出现的各种类型的外部效应机制。
[3] 网络环境中有多种类型的外部效应,应注意不要与特定类型的所谓“网络外部效应”相混
淆。该术语是指,例如某个人使用某项新技术所能获得的消费价值,取决于有多少其他人也在
使用该技术。网络外部效应对网络而言当然很重要,但还有其他各种类型的外部效应需要我们
关注。连通却稀疏的联系
人类网络的好消息和坏消息都在于,许多人能够良好地连通:大多
数人处于一个巨型分支之中。尽管这种连通的网络给控制疾病的蔓延造
成了挑战,但它对传播有效信息而言却至关重要,例如某个国家的残暴
政府、振奋人心的新书或电影,以及高效的新科技等。
有趣的是,社交网络可以有很好的连通,同时联系却往往很稀疏。
这似乎互相矛盾,且看下面的解释。
以脸书网站为例。根据皮尤研究中心最近的一项调查,[1]
脸书在
美国的成人用户平均有338位好友,超过一半的成人用户的好友数超过
200位。十多岁的青少年用户的好友人数更多。这远远超出了让网络走
向连通的每人一个朋友的临界值,按此标准,脸书上的社交网络应该具
有高度的连通性。事实上,在脸书超过7亿的活跃用户中,99.9%都包含
在同一个巨型分支里。
[2]
因此除少数孤立的个人与小团体外,几乎所
有的全球脸书用户都可以通过该平台上的朋友路径获得几乎任何其他人
的信息。
既然网络中的几乎所有人都处于一个巨型分支里,脸书的社交网络
怎么会联系稀疏呢?这里的“稀疏性”(Sparsity)的含义是,按理说你可
以在脸书上有7.2亿个好友,但事实上并没有。我们都知道有人在脸书
上有几千位好友(别忘了友谊悖论),但没有任何人的好友数能达到理
论上最大值的哪怕百分之一。面对几亿个可能的选择,人们平均却只拥
有几百位好友,这意味着脸书上的潜在好友成为现实的比例不到一百万
分之一。脸书网络的潜在连接里只有极小比例真实存在,因此它是极其
稀疏的。但就是这个极小比例的真实连接,已足以把几乎全部用户纳入
一个巨型分支。除了将几乎全部用户包含在一个巨型分支外,尽管脸书网络极其稀
疏,用户之间的连接路径却非常短。或许令人震惊的是,任何两位活跃
用户之间的平均距离只有4.7个连接。
[3]
这被称为“小世界”现象
(small-world phenomenon),并配有通俗演义:从匈牙利作家福利杰
斯·卡林西于1929年撰写的短篇小说,到后来的约翰·格尔的剧本《六度
分隔》(Six Degrees of Separation )。小世界现象是若干数学家在20世
纪50年代发现的许多随机网络的强势特征之一,[4]
并且是邓肯·沃茨
(Duncan Watts)于1999年发表的重要著作《小世界》(Small Worlds )
中的主角。
小世界现象由心理学家斯坦利·米尔格拉姆于20世纪60年代中期通
过实验做了精美的描述。米尔格拉姆最开始的研究对象是生活在肯塔基
州威奇塔市和内布拉斯加州奥马哈市的一些人,他给这两个地方的居民
写信,邀请对方参与一项研究,实验对象就是回信的人。米尔格拉姆要
求实验对象设法把一个文件袋送给马萨诸塞州的某个目标人。那些目标
人是他挑选出来帮助开展实验的,其中一位是股票经纪人,另一位是某
个神学院的学生的妻子。实验对象会得知目标人的姓名、居住的市镇,以及其他一些背景。给他们的指令则是:“如果你不是亲自认识这位目
标人,那就不要尝试直接联络他,而是把这个文件袋寄给……某个比你
更有可能认识目标人的熟人……这位熟人必须跟你熟到可以直呼其名的
程度。”接下来,每个收到邮寄来的文件袋的人都会看到上述指令,然
后要把自己的个人信息加入其中,并继续上面的寄送过程。
有个文件袋从堪萨斯州的一家小麦农场寄出,农场主将其寄给他家
乡的一位牧师,牧师再寄给他认识的在马萨诸塞州坎布里奇镇的另一位
牧师,此人正好认识作为目标的股票经纪人。在此案例中,文件袋从堪
萨斯的始发人出发,只用了三步就抵达了半个美国之外的目标人。
从目标人那里收回文件袋后,米尔格拉姆可以分析有多少文件袋抵
达了最终目的地,以及每个文件袋经历了多少次传递。结果表明,在内布拉斯加州发出的160个文件袋中,有44个抵达最终目的地,比例为
27.5%。文件袋所花费的传递步骤的中位数为5,分布区间为2~10,传递
步骤的平均数略高于5。
[5]
考虑到在传递过程中收到文件袋的人并不都是该实验的自愿参加
人,而只是从某个熟人那里收到邮件,他们继续寄送这些文件袋的可能
性应该比较小。因此完成任务的文件袋所占的百分比还是相当不错的。
当然,自愿参与也意味着,文件袋抵达目标人的步骤较少或许部分缘于
实验中的偏差。如果某个文件袋必须经过更长的传递路径,需要10个人
来递送,那跟只需要5个人的情况相比,就必须有两倍的人参与才能最
后成功。这会造成需要较少中间人的传递路径更容易取得成功,并反映
在最终数据里,而需要更多中间人的传递路径更容易被中途搁浅。后来
的实验矫正了这一偏差,发现传递步骤平均为10,是米尔格拉姆的结果
的两倍,但依然是个较小的数字。
[6]
该实验的结果非比寻常,不仅因为花费的传递步骤之少,还表明尽
管人们并没有任何网络地图来指引自己如何递送,但依然有如此多的文
件袋被送达最终目的地。联系马萨诸塞州的一位股票经纪人,或者像后
来的实验那样,联系北京的一名学生、伦敦的一位水暖工……你正好知
道自己与目标人之间在网络中的最短路径的概率可谓微乎其微。因此,许多文件袋通过相当短的路径就能送达这一事实表明,不仅存在这些较
短的路径,而且在任意两个人之间很可能都存在许多条较短的路径,此
外人们很清楚该如何高效地实现传递。至于人们如何能够在网络空间中
顺利导航,我们将在第5章再深入探讨。
社交网络可以非常稀疏,仅实现了不到百万分之一的可能连接,却
依然只需要短短几个连接就能让任何人到达数亿用户中的其他任何人,这究竟是如何做到的?
[7]
我们依然用脸书的社交网络为例,选取一位
名为戴安娜的普通用户。由于普通用户有几百位好友,我们取平均数,假设与戴安娜至少有偶尔交流的大约有200位好友。
[8]
接下来我们计算她的二度朋友的人数,即通过两个连接可以到达的人。假设戴安娜的每
个朋友也各有200位好友,且都不在她自己的好友的行列。
[9]
那么仅走
出两个连接路径,我们就能够到达4万名用户(=200×200)。如果继续
下去,我们将在第三步到达800万人,在第四步到达16亿人,这已经超
出了脸书网站的全部人群的规模。还有,大多数用户是在后面几步抵达
——说明大多数用户之间的连接距离为4或5。这个简单推导能让我们明
白,为什么社交网络中人们的相互距离会如此之短。
[1] 参阅Pew Research Center Internet Project Survey,2013年8月7日到9月16日,http:www.pewresearch.orgfact-tank20140203what-people-likedislike-about-facebook。
[2] 参阅Ugander、Karrer、Backstrom and Marlow(2011)。
[3] 参阅Backstrom、Boldi、Rosa、Ugander and Vigna(2012)。
[4] 最早的数学研究是Ray Solomonoff and Anatol Rapoport(1951),继而在20世纪50年代
后期到60年代早期由数学家在奠定随机图理论时做了更深入的研究,参阅Paul Erd?s and Alfréd
Rényi(1959,1960)。另外的更不为人知的独立研究成果包括Edgar Gilbert(1959)。
[5] 更详细的后续研究参阅Travers and Milgram(1969)。
[6] 参阅Dodds、Muhamad and Watts(2003)。
[7] 这一问题的答案很重要,但此处只是介绍了其基本思想。更详细的讨论和数学细节,可
参阅Watts(1999)和Jackson(2008)。
[8] 更普遍地说,在脸书网站外,对某人认识的人(指在过去两年有过联系并能相互联络)
的数量的估计差异很大,根据估计采用的技术和样本,其上限约为数百人到数千人。可参阅
McCarty、Killworth、Bernard and Johnsen(2001),McCormick、Salganik and
Zheng(2010)。
[9] 如果考虑到友谊悖论,可能连接到更多的朋友。若考虑到戴安娜的朋友可能彼此也是朋
友的比率,则会降低连接到的人数。因此这里的估算基本上是正确的。对数学感兴趣的读者而
言,这种简化计算有两个问题。第一是我们高估了相邻点扩张的速率,因为不是每一步到达的
每一个朋友都是“新”朋友,有人在之前已经到达了。例如,某个用户的朋友的朋友也是该用户
的朋友。如果戴安娜与艾米丽和丽萨是朋友,那么在走出长度为2的连接路径时,如果艾米丽和
丽萨也是朋友,由于她们已经包含在戴安娜的200位朋友之中了,她们在第二步连接中就不应该
重复计算。所以,计算每个人每一步有200位朋友,通常会包含部分重复统计。但即使我们做个
较为保守的近似计算,把每一步连接到的新朋友的数量减半,降为100,那么在四步连接后依然
能得到:200×100×100×100=2亿。更准确的模拟可以假设开始阶段连接到的新朋友数量较多,之后减少,但通常大多数新朋友还是在最后一步出现,因为大多数人是在最后一步才能到达。
到第五步,我们能到达7.2亿人。由此可以理解为什么学者的研究发现任何两位活跃用户的平均距离为4.7(Ugander Karrer、Backstrom and Marlow,2011)。简化计算的第二个问题是假设每个
朋友在下一步会带来相同数量的新朋友,但人群中有着巨大异质性,有人可能有500位新朋友,有人几乎没有。在巨大网络和平均度的影响下,这种差异基本可以抵消。相关的网络模型研究
可参阅Erd?s and Rényi(1959,1960);Jackson(2008b)等。即使对于脸书网站这样丰富和全球
化的网络而言,大数定律依然适用,忽略个体差异的近似计算能得到非常准确的结果。我们不断缩小的世界
朝圣者并不知道,但他们正走进墓地。
——查尔斯·曼恩(美国记者、作家) [1]
我们把当今世界的社交网络同中世纪的社会做个对比。假设当时的
朋友数不是200人,而是5人,我们再来做与以上同样的计算。在四个连
接步骤后,我们将到达大约625人(5×5×5×5=625),而非16亿人。为
连接当时地球上的全部人口可能需要12步,而非4~5步。
[2]
不过,中世纪的世界依然是大致连通的——即使朋友数只有几个,也远远超出再生数为1的临界值。而且中世纪的社会也具有小世界特
征。从一个人到另一个人需要12步或者更多的连接,这大于现代社会的
4~5步,但与当时生活的数亿人口相比,仍然是个很小的数字。中世纪
时更远的网络距离,确实导致病菌或思想的传播比我们今天更为缓慢和
分散。然而那时的世界依然有足够好的连通性,能够实现远距离的传递
和感染。这点反映在一长串的疾病中,它们的不断暴发使人类的生存始
终处于应战状态。
[3]
一旦数十万人开始加入全球旅行,世界就会看到非常快速和致命的
传染病。这方面一个令人惊恐的例子是1918—1919年的流感季,那季暴
发的流感属于尤其恶劣的类型:对年轻人和原本较为健康的人群特别致
命,因为流感会造成过度的免疫系统反应,从而导致受感染者的死亡率
超过10%。这种疾病后来被称为“西班牙流感”,其实是污蔑了西班牙。
西班牙人在报告感染率和死亡率上做得很准确,而其他国家则是为了维
持1914—1918年的毁灭性世界大战后的斗志,而压制了流感的相关信
息。
[4]
它们的新闻报道让人以为传染病是来自西班牙,实际上在当时已经广为传播。流感在当年蔓延的关键与战争结束、导致全球范围出现
大量军队调动有关。许多士兵居住在拥挤的地方,并参与长途旅行。此
外,这次的疾病带有两个使其能通过人群快速和广泛传播的特点。其一
是该流感能通过很小的液滴传播,当某个人打喷嚏或咳嗽时,这些液滴
会形成空气传播,从一个人传到超过一米之外的其他人,也能残留在物
品表面,然后被别的人接触。其二是人们可以在一周以上保持传染性,有时始于症状出现之前,晚于症状消退之后。流感的毒性、疫苗的空缺
以及大量人员的全球移动结合起来,造成了历史上最大规模的流感暴发
之一以及非常致命的后果。这场流感大约传染了5亿人,约为全球人口
的三分之一,比欧洲的全部城市人口多得多,在各国总计夺走了5000万
~1亿人的生命。
这个案例还表明,人类网络的连通性不是固定不变的。当年的大规
模军队调动非比寻常,造成了比之前年份更强的小世界现象。除人类迁
移的偶然的剧烈变化以外,人与人之间如何交流还存在强烈的季节性特
征。例如学校的开学季会造成多种疾病的激增,对该现象的首次记录是
在1929年,由研究若干疾病随时间波动的统计学家赫伯特·索珀完成。
他注意到格拉斯哥的麻疹暴发模式或许可以用学季来解释。学校开学期
间,对各种疾病缺乏免疫力的许多孩子相互接触,造成当地的人际网络
的连通性很高。相反在学校放假期间,当地的连通性大幅下降。不过,休学期间的出行距离加长会导致远程的连通性提高。
[5]
因此,人际互
动网络根据季节可能发生多种变化。用于预测疾病传播(尤其是流感
等)的现代流行病学模型就考虑到了学季、旅行模式、同医务工作者的
往来,以及影响传播网络连通性的其他很多因素。
谈及传染病输入的致命性,莫过于天花、麻疹、斑疹伤寒以及流感
对美洲人的影响。据估计,这些疾病最终可能杀死了超过90%的土著人
口。
[6]
美洲本土人群的人口密度与交流程度各不相同,因此疾病的危
害用了较长时间传播。在墨西哥,天花随着一艘来自古巴的西班牙船只于1520年抵达,几
年内就摧毁了阿兹特克帝国的大多数人口。不到十年,天花又消灭了南
美洲的印加帝国的多数人口。各种传染病此后还将横扫北美洲,杀死东
海岸和中西部肥沃地带的居住密度较高的大量人群。而北美洲的某些更
边远、人口密度较低的地区,要在一个世纪之后才被传染上,但没有人
躲得过去。就在来自英国的清教徒移民抵达前几年,他们将登陆的新英
格兰沿岸部分地区的美洲印第安人遭到了疾病的重创,对土地和资源的
争夺大为减轻,朝圣者因此得到了好得多的生存机会,而不用面对几年
前还密集得多的本土人口。
最后一些被传染病杀死的人是夏威夷的本土人群,直至19世纪,他
们才最终被外人造访,然后遭到欧洲人的疾病的反复重击。卡美哈梅哈
二世国王与卡玛玛鲁王后前往伦敦去谈判条约的旅程导致了他们及大部
分随员的死亡。他们在参观到处是士兵子女的皇家军事庇护学校
(Royal Military Asylum)时染上了麻疹。
[7]
这一病魔最终将在1848年
搭乘来自墨西哥的美国海军护卫舰“独立号”(Independence)前往夏威
夷的希洛。
[8]
百日咳与流感也将在同年冬天来到夏威夷,与麻疹一起
掀起一系列流行病,最后杀死约四分之一的本土人口。在人口普查中,那年被称为“死亡之年”。当地社会尚未恢复,天花又在1853年随着从旧
金山来到火奴鲁鲁的另一艘船只“查尔斯·马洛里号”入侵。人们以为对
这艘船已做了有效的隔离检疫,然后才起航,却还是带来了疾病,在数
月内造成当地数千人死亡。当库克船长于1778年首次来到夏威夷时,有
人估计当地的人口超过30万。而在1900年人口普查中,本土夏威夷人已
不足4万。
现代医疗已极大提升了我们对传染病以及卫生和免疫重要性的认
识,并减轻了多种疾病的日常威胁。尽管距离消灭传染病尚有很长的
路,但在世界变得越来越密切相连时,人类仍能成功生存,这已是非凡
的成就。工业化社会典型个人交往的其他人的数量比几个世纪前高出若
干数量级,尤其是我们通常依赖其他许多人为自己提供食品和卫生服务。此外,现代旅行意味着许多交往是在远距离发生,任何一天,都有
数十万人在跨国旅行。因此许多疾病的潜在传染网络与图3.1所示的高
中生关系网相比有三个显著差异:更为密集,几乎所有节点都包含在巨
型分支中,节点之间的平均距离更短。这意味着许多传染病在今天的传
播可能会比几个世纪以前更迅速、更广泛,而它们曾在当时一再杀死过
千百万人。我们只能寄望于科学与新疫苗的发展速度继续快于新病种的
出现和人类网络连通性的增长。
[1] “A Few Things You(Probably)Don't Know About Thanksgiving,”Becky Little,National
Geographic ,2016年11月21日。
[2] 更多的对比可参阅Marvel、Martin、Doering、Lusseau and Newman(2013)。
[3] Cesaretti Lobo、Bettencourt、Ortman and Smith(2016)指出,中世纪城市在社会和空间
结构上同现代城市有许多共同特征。但中世纪的人口与现代相比城市化率低得多,旅行也少得
多。更多内容可参阅Ferguson(2018)。
[4] 参阅Valentine(2006)。
[5] 详细讨论可参阅Altizer et al.(2006)。
[6] 参阅Jared Diamond(1997)。
[7] 参阅Shulman、Shulman and Sims(2009)。
[8] 参阅Schmitt and Nordyke(2001)。中心度与传染:人气度的不利一面
我们在讨论测量中心度和影响力时提到的友谊悖论,对传染和扩散
也有影响。在人们的朋友名单中被过分代表不但能给你带来较高的影响
力,也伴随着较高的风险暴露。因此,如果你有时对某个朋友的高人气
感到嫉妒,其实也有可聊以自慰的地方。人气最高的人可能是首批听到
新消息的,但也可能是首批暴露给新的传染病的。
这方面一个声名狼藉的案例是加拿大的航班服务员盖尔坦·杜加
斯。美国疾病控制中心的一份研究发现截至1983年,在当时已知的248
名艾滋病毒感染者中,有40人曾与杜加斯发生过性接触。很多人认为杜
加斯是“零号病人”,纷纷指责他造成了艾滋病在后来的大流行。
[1]
但
根据更多数据从事后来看,我们弄清楚了艾滋病在20世纪60年代就已经
进入美国,很可能是来自海地——那里的病例则来自更早的发源地非
洲。所以即使没有这位私生活混乱的航班服务员,艾滋病也会在全球牢
牢扎根。但不管怎样,杜加斯促成了最引人注目的一场早期暴发。
与之类似,据估计在塞拉利昂的一次埃博拉病暴发中,有超过一半
的病例可能是由3%的感染者传播的。同样,即使没有这些联系广泛的
人,疾病依然可能暴发。只是这批人更容易暴露给疾病,并会加速传
播。
[2]
要弄清楚具有较高度数的人为什么对传染病并非必不可少,我们只
需看一个网络案例。再回到图3.1,我们看到有个庞大的巨型分支,但
网络中度数较高的人却非常少:只有一个人的度数为7,一个人的度数
为6,几个人的度数为5,绝大多数节点的度数都是1或2。
这点尤其需要强调,因为人们对此有个常见的误解。网络要实现连通、传染或扩散,枢纽和关键连接点并不总是必须的。这类节点更容易
被卷入,并可能导致早期的暴发,但在连接最多的节点未加入时,许多
传染也会发生。如果删除高中恋爱网络中几个度数最高的节点,我们可
能会把几个小分支从巨型分支中拆分出来,但总体图景依然大致完好。
在巨型分支中酝酿广泛传染的基本驱动力是网络总体的平均度。在许多
人际网络中,是大多数人的度数高于1的倾向使疾病传染和信息扩散变
得无所不在。
当然,度数较高的人更容易被感染,能够加速传播,在正处于相变
阶段的网络中可能造成重大影响。更重要的是,如果有人需要找到影响
最大的节点,他应该从最中心的节点开始。度数较高的人受感染的风险
较高,这一认识为分析疾病的自然传播提供了新的指导。
例如,斯蒂芬妮·戈弗雷同她在澳大利亚和新西兰的同行研究了壁
虱和螨虫在大蜥蜴——生活在新西兰的一种爬行动物——种群里的分布
情况。
[3]
大蜥蜴的原名来自毛利语,意指它们的背脊。这种动物非常
有意思,并非真正的蜥蜴,而是喙头目动物(Rhynchocephalia)留下的
后裔,而该目中的其他物种早在6000多万年前的白垩纪末期就与许多恐
龙一起灭绝了。大蜥蜴在头顶有第三只“眼睛”,并非用于视觉,而可能
是通过吸收紫外线来调节新陈代谢。这种动物的生活非常孤独,大多数
时间都在自己领地内进食昆虫,偶尔还有鸟蛋或青蛙,然后晒太阳。至
少就某些标准来看,日子过得还算不错。图3.3 大蜥蜴 [4]
尽管生性孤僻,大蜥蜴的领地还是存在重叠,偶尔会彼此接触——
当然它们的繁殖也要求有接触。大蜥蜴是一种壁虱的宿主,壁虱身上带
有一种对大蜥蜴有害的血液寄生虫。此外大蜥蜴还容易感染一种螨虫。
从网络视角看,有趣之处在于壁虱在离开宿主后不能长期存活,它在大
蜥蜴之间的传播要求宿主之间有密切接触,对交际网络有着很高的依赖
性。相反,螨虫则可以不依赖大蜥蜴而存活,不太依赖宿主的密切接触
来传播。
戈弗雷与她的同行跟踪了斯蒂芬斯岛上的许多大蜥蜴,描绘出了它
们的运动轨迹和领地。这些领地有着差异悬殊的分布模式,某些大蜥蜴
只与另外一只的领地有重叠,其他一些则居于更中心的位置,同十只甚
至更多同类的领地有重叠。这个指标反映着它们的中心度:每个个体有
机会与多少同类接触。戈弗雷与同行接下来要数清大蜥蜴身上有多少壁
虱(你的夏天是怎么度过的?),发现大蜥蜴的中心度与它身上有多少
壁虱以及相关的血液寄生虫的数量存在密切而显著的相关关系。由于壁
虱需要靠交际网络在大蜥蜴之间传播,有着较高度数的个体自然面临较
高的感染风险。有趣的是,研究者没有在能离开大蜥蜴存活的螨虫身上
发现类似的相关关系:网络对螨虫的传播并非必要,中心度对感染率不
起什么作用。
[5]学者对很多物种开展过此类分析,包括人类在内。
[6]
尼古拉斯·克
里斯塔基斯与詹姆斯·福勒分析过哈佛大学的哪些学生最早感染流感。
[7]
他们监控了两个群体:一个群体的数百名学生是从样本中随机挑
选,另一个样本的数百名学生则是由其他人提名的朋友。从友谊悖论可
以知道,比起随机挑选的学生,被别人作为朋友提名的学生应该有更高
的度数。事实上,研究者确实发现:被其他人作为朋友提名的学生染上
流感的时间比随机群体平均早两个星期。人气度的确有不好的一面。
[8]
[1] 参阅Randy Shilts的著作And the Band Played On (1987)。
[2] 参阅Lau et al.(2017)。
[3] 参阅Godfrey、Moore、Nelson and Bull(2010)。
[4] 图片来自BarbulatShutterstock.com(Vectorstock),有授权。
[5] 这里可能有其他因素与度存在关联,例如大蜥蜴的领地大小,或许与该动260物染上壁
虱的概率有关。在缺乏可控实验时,我们不能排除所有其他可能的解释,但螨虫感染与度不存
在相关,却与领地和身体大小存在相关的事实,能支持我们的解释。
[6] 参阅Godfrey(2013)。
[7] 参阅Christakis and Fowler(2010)。
[8] 度数较高并不总是对传染有害。Duboscq、Romano、Sueur and MacIntosh(2016)发
现,社会交往较多的日本猕猴身上的虱子数量较少,而且是一种季节现象。猕猴之间的一个重
要社会交往是彼此梳理毛发,帮助清除对方身上的虱子卵——真正的友谊不过如此。因此社会
交往不只会造成虱子传播,也会帮助将其清除。度数较高意味着让其他猴子梳理的次数更多,虱子数量因此下降。人类网络的变动与传导性
2009年,一种高致命性的新型流感——H1N1病毒——在世界上传
播,它是1918年给人类造成巨大生命损失的西班牙流感的近亲。
同那个夏天飞往北京的其他所有人一样,我抵达时需要通过一台体
温测量仪的检测。中国不是对旅客做筛查的唯一国家,还有几十个国家
也对旅客进行检查,并要求填写表格,报告所有的症状。被视为感染的
人将被拒绝入境或进行隔离,人类网络针对疾病做出了改变。
在某些情况下,旅行限制和警告会造成极其昂贵的成本。墨西哥在
2009年最早发现部分H1N1型流感病例后,当年春天发布的许多旅行警
告提及该国,这导致2009年春季后期进出墨西哥的旅行人数下降了约
40%。对于一个把旅游业作为重要产业的国家,如此剧烈而大幅的旅客
减少使其深受打击。
事后来看,通过仔细分析旅行网络以及流感病例在全球出现的时间
和地点,我们会发现旅行模式的改变对阻止流感传播收效甚微。旅行模
式改变让疾病传播推迟了几天。
[1]
但即使是对旅客筛查最严格的国家
也仅仅使流感在其境内的广泛传播推迟了7~12天,并没有阻止不可避免
的传染。
[2]
环球旅行在今天已极为普遍,即使削减其中很大一部分,并尽可能
地拦截感染者,对流感的传播也只有很小的改变。我们可以把这种策略
理解为在全球网络中砍掉部分(而非全部)数量众多的远距离连接,它
对于真正削减流感的再生数起不了多大作用。当然,这并不是说在流感
暴发期间人们不能通过回避旅行来维持健康。如果你愿意在流感季节躲
在遥远的山间小屋,你个人感染流感的机会基本可以消灭掉。但阻止较大人群的出行活动在经济上是不切实际的。
隔离检疫有时甚至会造成灾难性结果,尤其是在传染被深入了解之
前。早期对于小儿麻痹症暴发的应对能说明这一点。这种疾病至少在古
埃及时代就已出现了,历史上的被感染者包括许多著名人物,从罗马皇
帝克劳狄一世到沃尔特·司各特爵士(Sir Walter Scott)等,但其暴发是
相当随机性的。小儿麻痹症成为更大型的传染病是在1910年前后的欧
洲,然后在1916年夏季的纽约出现了大规模的剧烈暴发。当时对该疾病
的认识严重不足:儿童可能在晚上正常入睡,第二天早上醒来时就不能
走路了。
这种病非常可怕,很自然带来了恐慌。小儿麻痹症的传递路径是从
感染者的排泄物到其他人的口腔,因此靠近儿童的露天排污管是个致命
的组合。而当时关于该疾病的各种理论导致人们杀掉了约八万只猫和
狗,另外还归罪于蚊子、水银、臭虫和其他许多东西。纽约的首批病例
大部分碰巧是意大利人,于是某些意大利居民受到隔离。隔离导致卫生
状况恶化,更多的孩子受到感染,由于其他原因发烧的孩子与患上小儿
麻痹症的孩子被关在一起,后果极其致命。
[3]
这不是说改变网络中的接触模式从来不是有效策略。例如对于基本
再生数小得多的埃博拉病,在早期确认疾病暴发并限制人员进出,确实
起到了效果。还有个有利之处是,这些疾病往往是暴发在出行率比较低
的地区,限制塞拉利昂的某个村子周围的出行,与试图切断北京、伦
敦、纽约或墨西哥城的人员进出是完全不同的。多项研究认为,能有效
控制大型流感传染的办法只包括接种疫苗、隔离受感染者(确保他们留
在家中或诊所,直至不再具有传染性),以及在某些病例中使用抗病毒
药物,以缩短感染期,降低传播概率。
[4]
这些办法都能显著降低流感
的再生数,效果颇为突出。
关键之处在于,网络对于在其连接上传递的事物会做出改变和响应。在疾病或金融困境等危险传染物蔓延时,人们的反应是感到害怕,切断联系,孤立自己的节点,龟缩起来。与之相反,在听到某些重大消
息以后,人们会积极地相互联系,增加网络的稠密度,加快喜人信息或
猥琐流言的传播。充分理解网络的传染特征需要我们认识到网络是动态
的实体,并经常会对传染做出反应。本书第7章和第8章还将回到这方面
的概念上,探讨技术普及、教育投资决策以及社会学习等话题。在这些
过程中,人们的行为方式将取决于其他人的行为以及网络的状态。
[1] 参阅Bajardi et al.(2011)。
[2] 参阅Cowling et al.(2010)。
[3] 参阅Donald G.McNeil Jr.,“In Reaction to Zika Outbreak,Echoes of Polio Global Health,”The
New York Times ,2016年8月29日。
[4] 参阅Ferguson et al.(2006)。收集思想
在现代社会,我们的很多网络是连通的,而且无论好坏,你和大多
数人共同处在巨型分支当中。我们经常染上流感和其他传染病,也参与
最新消息和流言蜚语的传播。有些新闻想不知道都几乎不可能。
作为一种消遣方式,有群人给自己设立了一个挑战:保持极少的人
际往来,成为最后听说某条新闻的人。这项挑战的正式名称是“在美国
最后知道谁夺得了超级碗的人”,其参与者自称“消息躲避人”,因为他
们要尽量避免被人告知谁赢得了当年的超级碗。游戏是基于大家的信
任,目标是尽可能长时间地不要获知超级碗冠军的归属。
[1]
然而这条
信息的传播过程很难逃避,首先,有三分之一的美国人从一开始就
被“谁获得了超级碗”的消息“感染”了,因为他们直接观看了比赛。其
次,这是条热门消息,不仅是比赛后几天里热议的话题,还是许多新闻
媒体的头条报道。
避免听说热门消息其实是项艰巨的挑战:要求努力改变我们的习
惯,避免接触大量的媒体、谈话和人物。挑战的一个有趣之处在于,参 ......
您现在查看是摘要介绍页, 详见PDF附件(27641KB,403页)。




