复杂网络上的蠕虫研究之仿真平台.docx
《复杂网络上的蠕虫研究之仿真平台.docx》由会员分享,可在线阅读,更多相关《复杂网络上的蠕虫研究之仿真平台.docx(46页珍藏版)》请在冰豆网上搜索。
复杂网络上的蠕虫研究之仿真平台
摘要
近年来,关于复杂网络的研究蓬勃发展。
小世界网络、无尺度网络相继被发现,来自不同领域的学者在不同研究方向和应用领域进行了深入研究,促进了复杂网络研究的进展。
互联网上蠕虫的频繁暴发给全球造成了巨大的经济损失。
我们要用复杂网络的思想研究蠕虫在网络上的传播行为,研究如何在有限资源下防止蠕虫的大范围扩散,如何正确应对和确保最低损伤。
本文首先介绍了目前复杂网络的主要研究结果,接着对分析网络性质的各种静态几何量做了一个小结,然后文章给出了网络蠕虫的基本定义、功能结构及其扫描策略,并引入良性蠕虫的概念,接着讨论三种经典的传播模型,包括SI、SIS、SIR。
本文设计并实现了随机网络、小世界网络和无尺度网络拓扑结构的仿真,然后利用仿真结果分析了各种网络的静态几何量及其分布特征。
除了验证已有的研究结果,本文还对集聚程度的分布和点介数边介数及其分布进行了统计分析,发现了一些统计规律,并简要说明了这些规律的形成原因。
本文的仿真数据表明无尺度网络的点介数分布也符合幂律分布,无尺度网络的平均积聚程度很小,其分布与平均度数有关。
本文在仿真网络上进行了蠕虫传播的实验研究,仿真SI、SIS、SIR三种模型的蠕虫传播情况,在小世界网络和无尺度网络传播数据比较表明蠕虫在无尺度网络上的传播更快、范围更广。
SIS模型到达平衡态后的被感染比例与有效传染概率有关。
本文重点进行了无尺度网络上良性蠕虫传播免疫的实验,通过不同的设置免疫节点方法的比较,发现在度数最大的那些节点放置良性蠕虫是最有效的方法,而此方法在小世界网络中效果不佳。
关键词:
复杂网络,小世界,无尺度,幂律,蠕虫传播模型,良性蠕虫
Abstract
Inrecentyears,researchoncomplexnetworksisdevelopingquickly.Small-worldnetworksandscale-freenetworkshavebeenfoundoneaftertheother,scholarsfromdifferentfieldshavedonealotofresearchindifferentdirections,andtheirworkpromotestheresearchofcomplexnetworks.ThefrequentoutbreaksofInternetwormresultsinenormouseconomicdestruction.WeneedtousethethinkingofcomplexnetworkstoresearchInternetworm,studyhowtopreventwidespreadofwormandhowtocorrectlydealwiththemandensureminimumdamage.
Atfirst,thispaperintroducesthemainfindingsofcomplexnetworks,andmakesabriefofstaticgeometricdatawhichareusedtodescribedifferentnetworks,thenintroducesthebasicdefinition,structureandscanningstrategiesofInternetworm.WealsointroducetheconceptofanAntiworm.Insuccession,thispaperdiscussesthreeclassicmodelsofwormspread,includingSI,SISandSIR.
Thispaperdesignsandrealizesasimulatorofrandomnetworks,small-worldnetworksandscale-freenetworks,andthenanalysesthecharacteristicsofdifferentnetworks’staticgeometricdatawiththevarioussimulativeresults.Inadditiontovalidatingtheexistingfindings,thispaperalsopointsoutafewstatisticallawsofthedistributionofclusteringcoefficient,node’sandedge’sbetweennessbyanalyzingexperimentalresults.Theexperimentaldatashowsthatthedistributionofnode’sbetweennessalsofollowspower-law.Theaverageclusteringcoefficientofscale-freenetworksissmall,anditsdistributionisrelatedwithaveragedegree.
Wedosomeexperimentsonthesimulativenetworks.Theseexperimentssimulatethreemodels(SI、SIS、SIR)ofthewormspread.Bycomparingexperimentaldataofthesmall-worldnetworksandthescale-freenetworks,wefindthespreadofwormisfasterandbroaderinscale-freenetworks.ThepercentofinfectionofSISmodelbeinginabalancedpositionisrelatedtotheeffectiveratioofinfection.Thispaperfocusesontheantiwormimmunizationexperiments,comparesdifferentmethodsofimmunization,andfindsthatthegreatestmethodisimmunizingthenodeswhichhavethebiggestdegree.Butinthesmall-worldnetworks,itdoesnotshowgoodeffect.
Keywords:
complexnetworks,small-world,scale-free,power-law,wormspreadmodel,antiworm
目录
第1章引言1
1.1选题背景及意义1
1.2复杂网络仿真及蠕虫传播实验1
1.3本文的组织结构2
第2章复杂网络3
2.1复杂网络概述3
2.2描述网络特征的静态几何量3
2.2.1度及其分布特征4
2.2.2积聚程度4
2.2.3网络的平均距离4
2.2.4介数(Betweenness)和连通集团5
2.3网络机制模型5
2.3.1随机网络5
2.3.2SmallWorld网络6
2.3.3ScaleFree网络7
第3章网络蠕虫及其传播模型分析9
3.1网络蠕虫的定义9
3.2蠕虫的功能结构及扫描策略9
3.3良性蠕虫(Antiworm)11
3.4蠕虫的传播模型11
3.4.1SI模型11
3.4.2SIS模型12
3.4.3SIR模型12
第4章复杂网络仿真软件的实现14
4.1复杂网络生成及计算静态几何量的算法14
4.1.1网络拓扑的数据结构14
4.1.2随机网络的生成算法15
4.1.3小世界网络的生成算法16
4.1.4无尺度网络的生成算法16
4.1.4积聚程度的计算17
4.1.6介数的计算17
4.1.7团簇现象的发现21
4.2网络仿真的程序实现21
4.3仿真结果的分析22
4.3.1规则网络、随机网络和小世界网络比较分析22
4.3.2随机网络分析23
4.3.3小世界网络分析25
4.3.4无尺度网络分析27
4.3.5团簇现象分析29
第5章蠕虫传播仿真实验31
5.1蠕虫传播算法31
5.2SI、SIS、SIR传播模型在小世界和无尺度网络上的仿真结果32
5.2.1SI模型的仿真32
5.2.2SIS模型的仿真33
5.2.3SIR模型的仿真34
5.2.4分析比较两种网络传播行为的特征34
5.3引入良性蠕虫的传播模型实验数据分析35
5.3.1不同方法放置良性蠕虫的效果比较35
5.3.2不同的免疫比例对免疫效果的影响35
5.3.3两种良性蠕虫传播的比较36
结束语38
参考文献39
第1章引言
1.1选题背景及意义
近年来,关于复杂网络的研究正处于蓬勃发展的阶段。
来自图论、统计物理学、计算机网络、生态学、社会学以及经济学等各个不同领域的学者对复杂网络进行了研究分析并在理论和应用方面取得了新的进展。
网络可以用来描述人与人之间的社会关系,计算机之间的互联关系,科研文章的引用关系,企业之间的合作关系。
网络还可以作为现象的背景舞台,例如计算机病毒在Internet上的传播,科学家网络上科学家之间的相互影响。
我们生活的世界网络无处不在:
人际关系网络、食物链网络、Internet网络、电力网络、商业网络等等,研究这些网络的结构、稳定性、演化过程对我们认识客观世界,研究及应用有着较高的指导意义。
随着互联网应用的深入,网络在不断改变人们生产、生活方式,但与此同时网络蠕虫对计算机系统安全和网络安全的威胁日益增加。
多样化的传播途径和复杂的应用环境使网络蠕虫的发生频率不断增高,覆盖面增大,造成的损失也在加大。
1988年,著名的Morris蠕虫事件成为网络蠕虫攻击的先例[11],2001年7月的CodeRed,2001年9月的Nimda,2003年1月的Slammer,2003年8月的blaster,蠕虫爆发日渐频繁。
网络蠕虫,给全球造成了巨大的经济损失。
防范网络蠕虫给互联网带来的破坏成为网络安全工作者的首要任务。
理想的网络蠕虫传播模型能够充分反映蠕虫的传播行为,识别网络蠕虫传播链中存在的薄弱环节,同时可以预测网络蠕虫可能带来的威胁,所以研究蠕虫的传播模型对如何防范蠕虫扩散具有很大意义。
许多研究学者提出了SI、SIS、SIR传播模型,这些模型较好的刻画了蠕虫的传播行为。
但是这些模型建立在全连通的网络拓扑上,而且仅得到理论上数值分析的结果,所以本文以能够刻画现实网络的复杂网络为理论依据,实现了一个复杂网络仿真软件,并在其上进行蠕虫传播的仿真实验。
在仿真经典传播模型后又引入良性蠕虫这种新的防治蠕虫方案,通过实验观察如何放置良性蠕虫能够最好的起到保障网络安全,减少蠕虫攻击影响的方法。
1.2复杂网络仿真及蠕虫传播实验
要对蠕虫传播进行研究,需要有网络的支持,然而在现实Internet上作蠕虫传播的实验不现实,如果要建造一个实际的试验环境又耗费巨大。
因此,设计一个仿真的网络环境进行仿真试验就成为一种有效而实用的方法被普遍采用。
所以本文设计并实现了随机网络、小世界网络和无尺度网络拓扑结构的仿真,并分别分析了各种网络的静态几何量及其分布特征,本文发现与平均距离类似,规则网络的平均点介数和边介数都较大,而随机网络的这两个值很小,小世界网络是从规则网络到随机网络的过渡,随着重连概率p的增大,小世界网络由规则网络向随机网络靠近。
对随机网络和无尺度网络的积聚程度分布的实验数据表明,它主要与平均度数的大小有关,当平均度数较小时,绝大多数节点的积聚程度都为0,随着平均度数的增大,积聚程度的分布向泊松分布演进。
无尺度网络的点介数分布也符合“长尾”分布。
无尺度网络也具有“小世界”的特性,即平均距离小,但是按偏好依附性生成的无尺度网络的平均积聚程度较小,不能反映现实网络的大积聚程度特性。
本文在仿真网络上进行了蠕虫传播的研究实验,仿真SI、SIS、SIR三种模型的蠕虫传播情况,在小世界网络和无尺度网络传播数据比较表明蠕虫在无尺度网络上的传播更快、范围更广。
SIS模型到达平衡态后的被感染比例与有效传染概率有关。
本文重点进行了无尺度网络上良性蠕虫传播免疫的实验,通过不同设置免疫节点方法的比较,发现在度数最大的那些节点放置良性蠕虫是最有效的方法。
然而在小世界网络中,这种免疫方法没有起到较好的效果。
1.3本文的组织结构
第一章引言分为3个小节,第一小节介绍了研究工作的背景及选题意义,第二小节介绍了本文的主要工作和研究结果,第三小节说明了本文的章节安排。
本文的第2、3章为背景知识介绍及目前研究成果的总结。
第2章介绍了复杂网络的研究进程,并分析网络性质的各种静态几何量作了一个小结,然后分别详述了随机网络、小世界网路、无尺度网络的定义及其几何量的统计特征。
第3章介绍了网络蠕虫的基本定义,分析了蠕虫的功能结构及其传播方法,并引入良性蠕虫的概念,然后讨论三种经典的传播模型,包括SI、SIS、SIR。
第4、5章为本文所做研究工作的介绍及结果分析。
第4章在说明了仿真软件实现的各种算法之后介绍了软件的功能和使用,然后对软件仿真结果进行了详细分析,验证了已经得出的有关定律,同时总结出了一些其他几何量及其分布的统计规律,并分析了产生这些规律的原因。
第5章简介了实现蠕虫传播模型的算法,然后介绍了本文在仿真网络进行的各种实验,并对其结果进行了总结分析。
最后,在结束语中总结了本文完成的工作结果,并对未解决,有待进一步探讨的工作作了说明。
第2章复杂网络
本章首先对复杂网络进行了一个简要概述,然后介绍了复杂网络的研究进程,接着对分析网络性质的各种静态几何量作了一个小结,最后分别详述了随机网络、小世界网路、无尺度网络的定义及其几何量的统计特征。
2.1复杂网络概述
我们所生活的这个世界中网络无处不在,人际关系网络、食物链网络、Internet网络、科学家合作网络、电力网络、商业网络,还有微观世界的神经网络、生物细胞网络、DNA分子网络等等,网络不计其数,无处不在。
同时这些网络又具有相当的复杂性,他们由成千上万的节点构成,各个节点存在着长短不一的联系,他们在不断演变,增加新节点、新连接、老节点死去,由此我们称这些网络为复杂网络。
复杂网络是刻画和研究复杂系统的结构和行为的关键,近年来,它迅速成为了科学界的一个研究热点,与之相关的基础和应用研究已经渗入到物理学、生物学、计算机科学、管理学、社会学以及经济学等许多学科之中,在信息通信、网络搜索、信号传输、传染病控制以及社会学中对突发事件的预报和处理等方面都具有重要的意义。
复杂网络的研究进程:
网络最初属于图论的研究范围。
1736年欧拉(Euler)解决了著名的哥尼斯堡七桥问题,这标志着网络研究的开始。
图论为我们提供了一种网络的表示方法,比如对Internet而言,我们每一个结点就可以表示一个路由器,如果两个节点之间直接通过光纤连接,这两个节点间就有一条边。
至于对复杂网络的研究,真正意义上的开始,是二十世纪六十年代,由数学家Erdos和Renyi提出随机图理论[1]。
在ER的随机网络模型中,首先给定网络的点数,然后任意两点之间以相同的常数概率连接在一起完全随机地构成网络.该模型自提出以来一直在网络研究中扮演重要的角色,被广泛应用于社会学和生态学的研究中.但是随着计算机技术的发展以及对大量实际网络数据的采集和统计分析,人们研究发现真实网络的很多宏观性质不能被随机网络模型所刻画.1998年Watts和Strogatz在Nature上发表文章《Collectivedynamicsof‘small-world’networks》[2],引入了小世界(Small-world)网络模型,小世界网络很好的刻画了现实世界的许多网络所具有的小最短路径的特性,即任意两节点间只用通过较短的路径便可以向连接。
1999年Barabasi和Albert在Science上发《Emergenceofscalinginrandomnetworks》[3],指出许多现实世界中的复杂网络的度分布具有某种幂指数的性质。
由于幂律分布没有明显的特征长度,该类网络称为无尺(Scale-free)网络。
2.2描述网络特征的静态几何量
网络的静态几何量是研究不同网络的结构特征,分析各种网络的共性和特性的工具。
在本节我们将对网络的静态几何性质做一个小结,分别给出每个几何量的定义、公式及在不同的网络模型中这些几何量及其分布的特征。
2.2.1度及其分布特征
一个节点的度是指与此节点连接的边的数量。
对于有向图来说有入度和出度之分,一个节点的入度即指由其他节点指向它的连接数,反之出度指从该节点出发,指向其它节点的连接数。
度分布P(k)表明任意一个节点有多大的可能性与外界正好有k条连线。
P(k)=nk/N
(1)
其中nk表示度为k的节点个数,N为网络的总节点数。
对于规则网络,每个节点的度值都相同;对于随机图来说,因为每两个点都是随机相联系,所以大部分节点的度都会在某个值附近上下波动(这个值被称之为网络的特征值),那么在这样的网络中,度分布函数就是一个中间大两边小的泊松函数,峰值位于平均度数。
而近几年科学家们对复杂网络研究的一个重大发现[3]就是,在许多真实网络中,度分布往往不是泊松分布而是遵循某种幂指数的形势,直观的可以称之为“长尾”现象。
即,k值较小时,节点的度数为k的概率很大,而随k增大,P的衰减非常迅速,并且k在一个较大的范围内变化。
具有这样性质的网络,因为其没有像度分布为泊松分布的网络那样具有特征尺度,所以我们称之为“无尺度网络”。
包括Internet网络[4],科学家合作网络[5],蛋白质互作用网络[6],语言学网络[7]等都具有无尺度特性。
同时,还存在度分布为高斯型分布的网络,如蛋白质折叠网络[8],和指数衰减型的幂律分布,如电视剧演员合作网络[8]。
2.2.2积聚程度
积聚程度的意义是网络集团化的程度,即考察一个的节点的所有邻近节点,他们彼此又是邻近的比率。
通俗地说,在人际关系网中,就是在一个人的朋友圈当中,任意随机找两个人,看这两个人他们两个人之间也互相是朋友的概率是多大。
集聚程度的具体定义为:
对于每一个节点v,找到其邻近集合Nv,记n=|Nv|,Nv中存在的边数为(δlx当边一端节点为x时值为1,否则为0)
M=Σδlxδly{l∈E;x,y∈Nv}
(2)
则
Cv= M/Cn2(3)
Cv就是节点v的积聚程度。
积聚程度的统计分布是刻画网络的一个重要几何量,其平均值称为平均积聚程度C。
对于随机网络,由于两节点之间的连接是随机决定的,所以它的平均积聚程度较低。
实际的复杂网络,它并不是完全随机的,而是具有比完全随机网络高得多的聚类的特性,这是最近几年来人们通过对许多大型的实际的复杂网络的数据做统计分析得到的结论,许多网络具有高聚类效应,确实符合“物以类聚,人以群分”这一特性。
2.2.3网络的平均距离
网络中两个节点u,v之间的距离我们定义为从u到v所要经过的最小的边数,即两节点之间的最短路径。
整个网络所有节点最短路径的平均值即为网络的平均距离。
我们所研究的这些网络:
人际关系网、Internet网、蛋白质折叠网络等等,他们的总节点数N都非常大,但是实际上在二十世纪六十年代美国一个社会科学家就通过一系列的实验发现在我们地球上随机找两个人,这两个人从平均的意义上来讲,只用通过六层朋友关系就能联系上,这就是社会学上的所谓六度分割原理。
六度分离律说明了一个事实:
即无论整个网络有多么巨大多么复杂,其中任意两个节点之间总能找到一条相对短的联系路径。
这就是所谓的“小世界”(smallworld)理论。
2.2.4介数(Betweenness)和连通集团
节点和边都有介数的定义。
节点u的介数含义为网络中所有两节点的最短路径之中,经过u的数量。
它反映了节点u的影响力。
记(i,j)之间的最短路径的集合为Sij,节点u的介数定义为
Bu=
(4)
类似的,可以定义边的介数。
实证研究表明,实际网络的介数分布也拥有共同的统计特征。
在无尺度网络中,介数较大的节点往往就是度数较大的节点。
点介数的分布也符合幂律定律。
连通接团是指图G的一个子图,在这个子图中,任意两点之间都存在通路。
一个网络可能存在多个相互独立的连通集团。
Newman等人发现,边的介数可以用于分析顶点的聚类[9]。
其基本思想是在包含不同集团的网络中所有最短路径经过次数最多的边,也就是介数最大的边,必然是联接两个集团之间的边。
按此思想我们可以依次取掉介数最大的边,原来的一个连通图就会变成几个连通集团。
2.3网络机制模型
在上一节我们对网络的静态性质的总结研究之后,这一节我们接着讨论一下不同的网络模型会有怎样不同的统计性质。
这是研究网络上的动力学模型的基础,如在后面将研究的蠕虫在网络上的传播模型。
早期的研究工作都建立在规则网络或者完全随机的网络基础上,但是规则网络和随机网络没能较好的描述现实网络的几何性质,所以我们需要修改网络模型,本节我们将分别介绍随机网络、小世界网络(SmallWorld)和无尺度网络(ScaleFree)。
2.3.1随机网络
我们首先介绍规则网络,像环状链,正方体网络都称为规则网络。
规则网络的每一个节点的度数都相同。
随机网络是相对规则网络的另一个极端。
由N个顶点构成的图中,可以存在Cn2条边,我们从中随机连接M条边所构成的网络就叫随机网络。
还有一种生成随机网络的方法是,给一个概率p,对于Cn2中任何一个可能连接,我们都尝试一遍以概率p的连接。
规则网络与随机网络的典型几何性质包括:
度分布,平均集聚程度与平均最短距离。
规则网络所有顶点都相同,因此其度值相同,度分布为δ(k-k0),其平均集聚程度也只需要在一个点计算C=〈Cv〉=Cv,其最短距离可以也只从某一个顶点开始计算从它到所有其他顶点之间的距离之和L~N2,然后计算其平均值d=L×N/(2×Cn2)~N。
对于随机网络G(N,p),包含了从空图到完全图的所有可能情况,因此随机图的几何性质需要对每一种可能图做平均。
研究结果表明随机网络顶点的度值符合平均值为Np的泊松分布,其集聚程度约等于p,最短距离d~ln(N)。
对比规则网络与随机网络,可以看出平均集聚程度与平均最短距离,这两个静态几何量能够很好地反映规则网络与随机网络的性质及其差异。
规则网络的特征是平均集聚程度高而平均距离长,随机网络相反:
平均集聚程度低而平均最短距离小。
如图2-1所示的随机网络中,顶点数与边数都与规则网络相同,但集聚程度为仅为0.02,规则网络的为0.5。
然而正是由于其集聚程度非常地小,所以其平均最短距离小。
假设其近邻数为n,