“六度空间理论”(Six Degrees o fSeparation)是一个数学领域的猜想,又名“六度分割理论”,又称“小世界理论”。该理论指出:任何两个陌生人之间所间隔的人不会超过六个,也就是说,你最多通过六个人就能够认识任何一个陌生人。
当今流行的新浪微博、人人网、开心网等社交网络服务(简称SNS)的理论基础正是“六度空间理论”。人们通过社交网络服务提供的人际关系网,在找到老同学、老同事的同时,也可以继续结识新朋友,扩展自己的人脉。
这种现象并不是说任何人与其他人之间都必须通过六个间隔才会产生联系,而是表达了这样一个重要的概念:任何两个原本素不相识的人,通过一定的方式,总能够产生必然的联系或关系。
2011年12月5日,Facebook和意大利米兰大学Web算法实验室共同宣布了关于六度理论的研究成果:经过对7 亿多Facebook用户(相当于全球10%以上人口)的研究,确定任何两个独立用户之间平均所间隔的人数少于5人(4.75);而当把观察范围缩小到美国一个国家的时候,大部分用户之间的间隔只有三度。
在对高校大学生社交网络使用情况的研究过程中,发现六度空间实际上低估了社交网络中群体内人与人之间的距离之近。通过对人人网内上海交通大学用户的好友关系进行研究,发现其中任何两个独立用户之间平均所间隔的人数为1.82,也就是1.8度。
利用Python编写的爬虫,我们从若干个大学生用户节点出发,顺着他们的好友关系节点一步步深度爬行获得了海量的人际关系信息。在若干个爬行线程全部结束之后,对爬行得到的信息使用awk、grep、sort等Linux 脚本语言和数据库操作来消除重复信息并根据分析需要进行格式转换、存储和分析。
社交网站的核心资源是人际关系网,其为了避免被人为批量抓取也采取了一系列监控保护措施,但是手机人人网这方面的限制还不够到位,因此本次选择了模拟手机去访问手机人人网(http://3g.renren.com/)的接口来快速批量获取用户好友关系信息。
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。