〔摘 要〕文章首先将复杂网络研究方法引入到舆情网络信息分析之中,并介绍了该方法的基本研究步骤;重点介绍了目前比较成熟且与复杂网络结合紧密的网络病毒传播理论和舆情网络模型;最后,文章提出了基于复杂网络的舆情信息治理的具体办法,包括3种免疫策略和靴襻渗流模型策略。文章为搭建高效合理的舆情网络环境提供了一种研究新思路,进而可以帮助政府提升对网络舆情信息管理的水平。
〔关键词〕复杂网络;舆情信息;免疫预防;靴襻渗流 DOI:10.3969/j.issn.1008-0821.2016.04.005
〔中图分类号〕G250.7;TY391 〔文献标识码〕A 〔文章编号〕1008-0821(2016)04-0026-04
〔Abstract〕Firstly,the paper introduced the research methods of complex network into the analysis of public opinion network and describes its basic research steps;Next,it focused on the more mature of virus propagation network model theory and public opinion model which has a close connection with complex network;Finally,the paper proposed some specific measures of public opinion based on complex network
including three immunization strategy and bootstrap
percolation modeling strategy.The paper provided a new idea to build an efficient and rational public opinion network environment.And thus it enhanced the Governments overall management of the network of public opinion information. 〔Key words〕complex network;public opinion;immunity and prevention;bootstrap percolation
进入21世纪以来,我国大量的社会矛盾和经济矛盾叠加在一起,预示着我国已经进入到一个关键社会变革期,而伴随而来的就是一件件的群体性冲突事件。据报道,此类事件的总数已经多达6万起,参与人数陡然增加到300多万人,这些突发事件给国家带来的影响不光是经济损失,更多的是社会稳定根基问题。所以,对于这些事件的分析与对策研究已经显得十分迫切。通过我们的观察发现,伴随通信与交流方式的改变,网络舆情已经成为群体性事件发展演变的一大要素,许多谣言乃至群体性恶性事件的发生背后都有网络传播的推动。对于网络舆情信息的具体研究而言,首先是网络舆情研判的方式方法。简而言之,就是如何发现网络中的非正常舆论信息及倾向。目前,全世界对网络舆情的研究已经非常普遍,但还没有形成一套标准化的操作模式和规范。这其中最具代表的方法包括人海浏览法、关键词搜索法、多文档精选法、模板因子法及网络实验法[1]。这些方法基本上都
是建立在传统的人文领域,主要是阐述了信息在网络中传递的过程。这些方法的侧重点在于定性的衡量突发事件在网络中传播的规律和因果关系。这些方法的分析结果往往多是一级文本信息,而目前舆情分析更多的关注点在于网民在某一事件之后的情绪变化,特别是信息转发率与信息评论。这些内容如果单纯依靠人工收集和分析判断就显得心有余而力不足。另外,现在许多舆情传播预测及治理方法还在依靠舆情员进行分理,这极有可能造成有价值信息的流失。我们目前更需要的是准确分析传播信息网络结构的研究,及其能够详细到信息传播时机,以及传播的方式与途径及演化方式的模拟[6]。
1 复杂网络与舆情信息结合
近年来,复杂网络已逐渐成为研究复杂系统的一种重要方法,对复杂网络的研究正受到来自不同领域的越来越多的研究人员的关注,复杂网络已经成为一个跨学科的研究热点。复杂网络的理论及实证研究对网络安全、网络控制、计算机病毒传播的控制与防御等研究产生了重大影响。用图论的语言来描述,一个网络可以抽象为一个由节点的集合V和边集E组成的图G=(V,E)。节点数记为N=V,边数记为M=E。E中每条边都有V中一对点与之相对应。对于社会舆情网络而言,点集指的是在社会某一具体环境下的社会成员(如图1中U1~U4)与实际存在的信息页面(如图1中P1~P6),而
边集就是成员与发生在社会中某一具体话题之间的关系,这些关系可以是有向的,也可以是无向的,当我们将这些信息提取出来就构成了一个完整的复杂网络,如图1所示。我们尝试去发现呈现在这些表象之中的内在机制和模式,进而试图找寻出支配和影响网络舆情发生和演化的规律。 本文首先将复杂网络理论的研究方法与应用技术引入到网络舆情传播规律的研究之中,然后结合我国目前网络突发事件的具体特点,着重阐述了网络舆情传播研究中的网络传播模型。对于网络传播媒介模型的研究紧扣模型的真实性和应用性。在研究过程中,将网络舆情信息复杂网络化,也就是产生舆情信息网络的拓扑结构,观察在该结构上信息传播的特点以及形成特点和演化的规律。一旦掌握这些内容,将极大地帮助管理层开展事件的引导与危机处理。该研究内容对知识、预测和引导事件具有重要的理论意义和应用价值[2-3]。对于复杂网络与舆情信息结合的研究问题,需要定义两个复杂性的问题。一个是突发性群体性事件信息的传播复杂化;另一个是舆情信息传播网络拓扑结构的复杂化[4]。尝试在复杂化的舆情信息中找到扰动因子,寻找发现、引导与控制舆情信息传播的方法。我们将所有的研究内容定义为3个步骤,第一步:经过对舆情信息网络进行抽象和模拟,建立具有小世界特性和无标度性质的模拟复杂网络,然后比较这两种网络的异同。我们利用多种方法来建立网络,其中最
直接的方式就是来自城市中某一阶段的通话记录来建立网络,其中每位用户代表节点,存在的通话用连线代表,由此构成了一个巨大的模拟网络。第二步:对于舆情复杂网络的研究起始于基本的复杂网络研究参数,具体包括了聚集系数,平均度和度分布特征。尝试发现这些参数与模拟网络的关系,这就是建立舆情信息网络生长模型的过程。这一过程的特点规律与网络疾病的传播非常相似,网络节点在整个复杂网络中表现出的状态包括正面认知、负面认知和不确定认知。不同个体对同一信息所表现出的状态各不相同。我们要尝试求解这3种认知的传播概率。这3种状态的迁移伴随着信息的冲突,个人处理时间的延续等一系列问题。第三步:该步骤就是系统仿真的过程,将上一步得到的模拟图进行验证,运用随机分析和统计技术的手段改变参数,去揭示模型与实际舆情信息传播的契合度,进而验证出一个合理且有效的模型框架,并试图以时间变化为基准,尝试去预测舆情信息可能发展的范围。 2 基于复杂网络信息传播预测研究 2.1 舆情传播预测
舆情信息的传播与网络的生命力直接相关。而英特网上的谣言导致的群体事件已经给社会稳定带来了巨大的威胁,我们必须采用一系列的对策来解决它。通过实际舆情信息传播的分析,我们需要利用现有的网络的特定状况,来推测出网络演化过程。这一问题,现在学术界引入了一种简单而且
有效的网络疾病传播概率预测方法[6]。其中最实用的传染病模型分别是SIR和SIS模型,还有SI与SIRS模型如表1所示。经典的病毒传播理论与复杂网络分析相结合发现,对于一个均匀网络,往往存在一个临界值,当传染强度大于该临界值时,病毒会在网络中长期存在,并且大量传播开去。而小于该临界值的话,病毒会逐渐以指数强度消失。而对于一个无标度网络,不存在这样的一个临界值,该结构中病毒会长期存在,但是不会大量爆发。这和舆情信息中的突发性谣言病毒的发作原理是完全一样的。临界值与网络拓扑结构的界定,对于舆情信息的引导具有指导意义和现实价值。
在网络传播的SIR模型之中,我们可以将网络信息中传播的节点分为3类,第一种节点表现在具体现实中为一般的受众,他们不会去传播谣言信息,但却容易受到谣言信息的感染,我们称其为易染节点(S)。第二类节点代表为信息传播中接收谣言并信任接下来进行传播信息的节点,他们对于舆情事件的发展具有决定性影响,我们称其为感染节点(I);第三类节点代表为网络中的可信节点,对于谣言信息具有鉴别能力,不会被传染也不会被影响,我们称之为免疫节点(R)。在网络病毒传播模型中,我们用V代表被感染的概率,用U代表被治愈的概率,将λ=V/U定义为有效感染率,一些书籍中将感染节点占总节点数的比例,称之为稳态传染概率。把稳态感染率从零向正实数变化的那个点对应的值称为传播
临界值。其感染密度的时间化方程式ρ[-1+λ〈κ〉(1-ρ)]=0,其传播临界值为λc=〈κ〉-1,也就是 ρ=0 (if?\"λ<λc) ρ≈λ-λc (if?\"λ≥λc)
现在存在的许多网络其网络拓扑结构是均匀的泊松分布,其最大的特点是网络节点的平均度与各节点的度趋向于一致,网络拓扑结构如图2(a)所示,根据我们实验得出,一般的网络谣言的病毒传播临界值在P=0.16%,当整个网络中1 000个节点中有16个节点被谣言感染时,该谣言就会在整个网络中快速传播,产生爆发之式,产生群体性事件的可能也会激增。
网络中的第二种模型是我们称之为SIS模型。它将网络中所有的节点也划分为3类:第一类节点是易感染节点(S),在整个网络中表现为可能被谣言影响,但不会主动参与到信息传播中去;第二类节点是染病节点(I),在整个网络中的表现是轻信谣言并且去传播谣言,是网络中极具破坏性的节点部分;第三类是免疫节点(S),他们表现为对谣言信息具有一定的判断力,但不是绝对性的,还有可能轻信谣言再次被感染。该种网络中单个感染节点产生的新感染节点的平均密度,它与有效传播率λ,节点的平均度〈k〉,健康节点相连概率1-ρ(t)成比例。在均匀网络中存在一个有限的正值传播临界值λc。如果有效传播率λ>λc,则病毒可以在网络
中传播开来,并最终稳定于ρ=1-λc/λ,此时为激活相态。如果有效传播率λ<λc,病毒呈现指数衰减,无法大范围传播,最终不能传播,此时网络为吸收相态。这种节点也称之为幂率分布的无标度网络,其最大的特点和我们目前的微信与微博中的大V类似,很多随意的节点更倾向于去联结有影响力的节点,一旦这种大V节点被谣言感染或者就是谣言源头的话,它的谣言传播速度比SIR模型更快,网络拓扑结构如图2(b)所示。我们将其中的传播临界值定义为λc=〈k〉/〈k2〉。通过我们的研究发现,这种拓扑结构的网络,谣言信息会长期在这种结构中存在,永远无法根除,甚至在传染几率很小的情况下,也可能造成大爆发[7-8]。 2.2 舆情谣言治理
目前,针对网络舆情信息传播进行防护提出了一种基于复杂网络病毒预防的新办法,该方法主要基于网络的基本拓扑结构,能够从最大限度上防范网络舆情信息导致的群体性事件的发生,其中的办法主要包括3种:(1)随机免疫(均匀免疫);(2)目标免疫(选择免疫);(3)熟人免疫[7]。基于复杂网络的舆情信息的第一种免疫策略我们采用随机免疫策略,其主要内容是随机的选取一部分节点进行免疫保护。所有网络中的节点都一视同仁,而无论它的度的大小区别。换个说法,该免疫策略很难达到谣言信息的彻底消灭。该种免疫方式对于节点较少的网络比较容易使用,而且效果较好。
随机免疫策略对于幂律分布的无标度网络的效果有限,而对于泊松分布的均匀网络则显示出非常好的效果。第二种免疫策略我们将使用目标免疫方法,它特别针对幂律分布的网络,在实际的操作过程中,即选取网络中个别度最大的节点进行控制免疫,抓住这些节点也就是抓住了整个网络谣言传播的重要通道,这样就可以最大程度上的减少谣言传播的可能途径。目标免疫的前提条件是必须了解整个网络的结构,对于小型网络是适用的,而对于大型网站来说实现是不可能的。第三种免疫策略我们称之为熟人免疫,其基本思想是从已知的节点中随机选取一定比例的节点,如5%或者10%,再从选中的节点中找到一个邻居节点进行免疫。该种免疫策略的最大特点在于计算机操作性强,工作效率高,同时不需要对每个节点进行免疫。
另外,针对网络舆情信息传播治理还有一种比较成熟的补充方法,我们称之为复杂网络靴襻渗流研究。该理论最早于1979年提出,主要研究对象是磁铁由于非磁性杂质致磁有序的降低并最终消失的现象[9]。该理论的基本模型如下:在网络空间中所有的节点都存在两种状态:一种是活跃状态;另一种是非活跃状态,而且各个节点是独立的。在初始时刻,各个节点都处于非活跃状态,并以一定的概率值变为活跃状态。而且,当其中一个节点周围的活跃节点达到一定系数时,该节点由非活跃节点变成活跃节点并一直保持下去。该模型
的描述与网络舆情中谣言的病毒性传播特性具有绝对的一致性[10-11]。目前该研究始发于两个方面:一个是临界概率的发现;另一个是最大活跃子图的发现。如图3所示,在我们对于泊松分布网络的实证研究中,发现该类型网络随初始活跃节点的变化,存在一个非常明显的跳跃,这个变化点恰恰是网络谣言大面积爆发的初始临界点。该值会伴随节点平均度k的变小而逐步消失。这就说明用户相互连通较少的网络出现谣言爆发的可能性就小一点。给我们的实际指导意义在于要适当控制网络的规模及其连通度,适当调节网络的活跃度。图4所示的幂率分布的无标度网络,它的连通能力直接与幂指数a相关。正如图中的实验数据结果所示,当幂指数a在[-5,-4]之间时,有明显的相变点出现,也就是出现所谓的网络谣言大爆发概率变大,需给予足够的关注。而当幂指数在[-3,-2]之间时,无明显的相变点出现,也就是不会出现所谓的网络谣言大爆发[11]。 3 结束语
目前,基于传统人文领域的研究方法对于网络舆情的研究越来越显示出局限性,其主要原因在于对网络信息传播的成因、流程和规律无法定量的加以研究。基于复杂网络的舆情研究提供了一条新的思路,其核心内容发自对网络核心架构的搭建,以及演化机理的阐述,尝试从结构方面进行趋势的研究,从而引导网络舆情信息发展的趋势,加强对社会群
体事件的管理。 参考文献
[1]王兰成.网络舆情分析技术[M].北京:国防工业出版社,2014.
[2]李维杰,刘晖,吴世忠.互联网舆情理论分析[M].北京:科学出版社,2015.
[3]杨兴坤.舆情引导与危机处理[M].北京:中国传媒大学出版社,2015.
[4]何大韧,刘宗华,汪秉宏.复杂系统与复杂网络[M].北京:高等教育出版社,2009.
[5]郭雷,许晓鸣.复杂网络[M].上海:上海科技教育出版社,2006.
[6]燕道成.群体事件中的网络舆情研究[M].北京:新华出版社,2013.
[7]林敏.网络拓扑结构对自组织临界行为影响的研究[D].天津:南开大学,2005.
[8]韩定定.复杂网络的拓扑、动力学行为及其实证研究[D].上海:华东师范大学,2008.
[9]陈小龙.复杂网络爆炸渗流研究综述[J].电子科技大学学报,2015,27(1):12-21.
[10]万宝惠,张鹏,张晶,等.二分网上的靴襻渗流[J].物理学报,2012,61(16):369-374.
[11]张.渗流相变现象的行为特征与演化机制研究[D].北京:北京航空航天大学,2014. (本文责任编辑:孙国雷)
因篇幅问题不能全部显示,请点此查看更多更全内容