网络信息老化实证研究以新浪新闻为例.docx

上传人:b****5 文档编号:11749235 上传时间:2023-03-31 格式:DOCX 页数:13 大小:1.07MB
下载 相关 举报
网络信息老化实证研究以新浪新闻为例.docx_第1页
第1页 / 共13页
网络信息老化实证研究以新浪新闻为例.docx_第2页
第2页 / 共13页
网络信息老化实证研究以新浪新闻为例.docx_第3页
第3页 / 共13页
网络信息老化实证研究以新浪新闻为例.docx_第4页
第4页 / 共13页
网络信息老化实证研究以新浪新闻为例.docx_第5页
第5页 / 共13页
点击查看更多>>
下载资源
资源描述

网络信息老化实证研究以新浪新闻为例.docx

《网络信息老化实证研究以新浪新闻为例.docx》由会员分享,可在线阅读,更多相关《网络信息老化实证研究以新浪新闻为例.docx(13页珍藏版)》请在冰豆网上搜索。

网络信息老化实证研究以新浪新闻为例.docx

网络信息老化实证研究以新浪新闻为例

网络信息老化实证研究——以新浪新闻为例

鞠菲

2012-9-2814:

36:

48  来源:

《情报杂志》(西安)2010年10期

  【英文标题】TheEmpiricalStudyofNetworkInformationAging:

WiththeNewsonasanExample

  【作者简介】鞠菲(1988-),女,硕士研究生,研究方向为信息源管理与网络计量学。

华东师范大学商学院信息学系上海200241

  【内容提要】网络信息以网络为载体,网络信息老化产生了与传统文献信息不同的老化特点。

受传统文献老化研究中通过引文数量衡量信息价值的影响,已有的实证研究大多通过链接数量衡量信息的价值,但是由于网络的特殊性,链接分析存在较多的干扰因素。

以新浪网站中的国内新闻为研究对象,通过评论量量化信息的价值,通过对新浪新闻的抽样调查,统计网络新闻信息在发布后每小时评论量的增长,分析网络信息价值的衰减。

由分析可知,在单一网站内部,网络信息的老化符合负指数变化的规律,即y=e[0.35t+4.502],与传统的文献信息老化表现为相同的规律,但是速度要快得多,半衰期小于一天。

同时网络信息的老化还受到其他因素的影响呈现波动性。

掌握了网络信息老化的规律将为网站建设者指明一条更加清晰的道路,使其更好地服务于用户。

  【关键词】网络信息/文献老化定律/信息计量学

  信息资源数字化、网络化以及网上文献信息数量激增,不仅为网络信息计量学的产生提供了必要的基础和条件,而且产生了迫切的实际需求。

从网络信息计量学的研究对象、方法、内容和目标等方面来看,网络信息计量学是采用数学、统计学等定量分析方法,对网上信息的组织、存储、分布、传递、相互印证和开发利用进行描述和统计分析,以解释其数量特征和内在规律的一门新兴分支学科,是信息计量学的一个新的发展方向和重要的研究领域,具有广阔的应用前景[1]。

  网络信息的老化研究是网络信息计量学研究的重要组成部分,一方面对于网络信息计量学的学科体系的完善与发展具有重要的意义;另一方面,截至2009年12月31日,中国域名综述为1682万,中国网民规模达到3.84亿人,普及率达到28.9%,其中网络新闻在网络使用率中占80.1%[2]。

网络发展迅速,同时也带来了信息量的爆炸性增长。

对网络信息老化规律的研究也可以对网络信息的更新进行研究,追踪网络信息被利用的过程,指导网络信息资源的建设。

  1、网络信息老化研究现状

  网络信息一般指以数字化形式记录,以多媒体形式表达,通过计算机网络通信方式进行传输、识别、利用,在一定时间内可稳定获取和固定访问的信息单元。

网络信息时刻都在增长,同时新的信息代替老的信息,信息的效用价值随着时间而改变,有的信息可能还会最后被销毁,或者无法访问,这就是信息的老化现象。

延用文献信息老化的概念,网络信息老化就是网络信息价值丧失的过程,同时也是一种客观的社会现象。

  传统的文献老化研究主要指科学文献随其“年龄”的增长,其内容日益变得陈旧过时,作为情报员的价值不断减小,甚至完全丧失其利用价值,文献老化既是一种客观的社会现象,又是一个复杂的动态过程。

随着研究的深化,逐渐形成了以半衰期(half-life)和普莱斯(priceindex)指数为主要研究指标,通过文献管理统计数据分析、引文分析、数学分析和综合分析的方法,用负指数模型、巴尔顿·开普勒(Burton-Kebler)老化方程、布鲁克斯(Brookes)积累指数模型、阿弗拉米司库(A.Avaramescu)方程等数学模型来描述文献老化规律的体系。

网络信息老化的研究大多脱胎于传统的文献老化研究,但是又因为网络信息自身的特点,产生了新的研究领域。

  网络信息的价值在于网络信息传递给了用户,并且满足了用户某方面的需求。

关于网络信息老化的研究主要集中在以下三个方面:

  1.1可访问性可访问性即网络信息依赖的载体是可以被访问的。

如果信息储存的介质损坏消失,或者虽然信息本身存在,但是没有有效的url,不能够被访问的网络信息是没有价值的。

  1999年JuditBar-lan和BlumaC.Peritz在Scientometrics上发文《TheLifeSpanofaSpecialTopicontheWeb》,研究了从1998年1月3日到1998年7月7日这段时间中关于信息计量学的网络文档。

他们发现了三种变化趋势:

文档消失了;文档的内容发生了改变;增加了新来的文档[3]。

表明68%的文献在一年之内会被从网上移除,文献[4]表明12.2%的网站和20.5%的网页6个月之后不能再被访问。

这些网页或者网站中的信息都逐渐丧失了其价值。

同一年,WallaceKoehler随机提取了361个网址,以周为时间间隔,进行了为期一年的跟踪研究,研究结果显示,6个月后有12.2%的网站和20.5%的网页不能访问,97%的网站和98.3%的网页发生了变化。

他得出结论,网络信息交流有别于以往的信息交流方式,介于产生后永久存在和产生后立即消失之间[4]。

2000年5月,SteveLawrence对从Researchlndex数据库收录的文献中的67577个URL引文的有效性进行了跟踪,发现一年前发表的文献引用的URL已经有23%无效,1994年发表的文献引用的URL无效的比率高达53%[5]。

Koehler将半衰期引入网络信息老化研究;他将网络信息半衰期定为一定范围内一半的网络文献消失所需要的时间,他的研究表明这个时间大约为2年,由于域名以及文档类型的不同、半衰期不同,文档产生之后内容趋于稳定[6]。

而在2007年DionHoe-LianGoh和PengKinNg历时7年(1997~2003)的研究中发现网络引用链接半衰期约为5年,网上31%的链接无法适用,主要是由于无法找到网页,在edu域名下的链接的失效率更是高达36%,提出链接老化是一个无法忽略的问题[7]。

  1.2吸引性网络信息虽然存在,也可以被访问,但是没有访问者的信息也是没有实现其价值的。

美国学者卡尔·夏皮罗和哈尔·瓦里安在《信息规则》一书中指出了信息产品的特点,其中之一就是信息的丰富产生注意力的贫乏,注意力是稀缺资源[8]。

在浩如烟海的网络信息中,吸引到用户的注意力不仅仅是实现网络信息价值的必要条件,在很大程度上还将决定网络信息价值的大小。

用户对信息的敏感度越大,网络信息的价值也越大,信息传播的效率越高,网络信息的价值也越大。

  2005年,段宇峰在分析了网络信息资源老化的原因及其特征的基础上提出衡量网络信息资源的老化状况应该从网络信息的生命周期和被利用情况两方面考虑。

提出以静态半衰期、动态半衰期和生存期作为衡量网络信息资源滋生生命周期的指标,以宏观网络信息资源半衰期和微观网络信息资源半衰期作为衡量网络信息资源被利用情况的指标[9]。

并且在从网络信息的更新、生存期和可存取性三个方面针对不同类型的网络文献类型对网络信息循序状态进行了为期4个月的实证研究[10]。

2009年,马费成和夏永红对网络信息的生命周期进行了实证研究,他们将网络信息的生命周期定义为网络信息从产生到失去价值所经历的各个阶段和整个过程。

基于假设:

网络信息被利用的越多,说明人们对它越感兴趣,其效用价值就越高;被利用的越少,说明人们对它失去了兴趣,其效用价值就越低,他们以中国期刊网、WileyInterScience平台、人民网强国论坛、网易新闻中心和Alexa排名前50的网站为研究对象,对不同类型的网络信息的周期态势进行误差、记录和分析,揭示了网络信息成长、成熟、衰退的三个阶段[11]。

  注意力主要由信息的内容决定,爆炸性的新闻往往能够在极短的时间里引起极大的轰动,这样的轰动又将进一步吸引更多的注意力,网络信息的价值也随之增长。

同时,能否吸引注意力也与信息的类型、转播渠道、储存介质、推广方式等相关。

由于网络信息极为丰富,既有即刻引爆网络的信息,也有信息完全没有人注意,如在天涯这样的知名论坛中有些帖子日回复量就可以有几十页,但是也有一些帖子的阅读量为零。

  1.3网络信息传播的价值垃圾信息或者无用的信息是没有价值的。

例如垃圾邮件,或者是太阳从东方升起这样人人都知道的信息是没有价值的。

一般认为有价值的网络信息满足了网民不同层次的个人需求。

不同的人上网都有不同的诉求,通过第25次互联网发展报告可以看到,人们使用网络的方式是多种多样的,不论是满足了的娱乐需求、信息需求、交流沟通的需求还是满足了商务交易的需求,都实现了网络信息的价值(见表1)。

  2009年,邱均平、陈远、倪超群共同探讨了网络信息传播的价值,提出了网络信息传播的价值内涵以及影响网络信息传播价值的因素。

文中指出网络信息传播的价值通过其使用价值最终表现为商业价值,由网络信息的内容、信息的用户、信息传播的技术和信息传播的社会关系共同来实现。

“动力圈”、交流情景、价值寿命、质量向量、效率成本等因素构成影响网络信息传播价值的主要因素。

网络信息价值的大小与对受众有用和投合的程度成正比。

可以从传播信息的来源、组织、内容、环境、网民体验5个方面设计评价网络信息传播的基本指标[12]。

同时也提出要注意不是所有的网络信息都是有价值的,甚至有的信息是有负价值的,有学者提出了网络信息的经济悖论现象[13]:

网络传播的信息量越来越多,可利用率却越来越低;信息传播效率高,效益价值低。

究其原因类似于经济学中的“公地悲剧”,任何一个传播者增加一定信息的正效用几乎完全归己,而负效用却由网络上所有传播者和广大受众共同承担。

陈京莲发现了信息价值寿命与信息传播之间密不可分的关系[14]:

受众对信息的敏感度越大,信息传播的增益也越大;信息传播的效率越高,信息传播的增益也越高;网络信息价值的平均寿命越大,单位信息的价值再传播就丢失得越少;信息传播速度越大,信息传播后剩余的价值就越小,此信息传递到最后将只剩下信息的社会价值,即这种信息最后变成了社会知识而其经济价值将可以忽略不计。

  2、网络信息老化研究内涵

  国外关于网络信息老化研究的起步较早。

国内有关的研究起步比较晚。

2004年,王宏鑫和邱均平在《关于网络信息老化研究的若干问题》中指出,网络信息老化研究的主要任务是围绕研究目标,寻找网络信息老化的测度指标,采用数学、统计学等各种定量方法对网络信息老化进行定量描述和统计分析,以便解释网络信息老化数量特征和内在规律,建立相应的数学模型并提出理论解释体系。

因而包括:

网络信息老化测度研究;网络信息老化规律研究;网络信息老化规律的应用研究等内容[15]。

现存关于网络信息老化的研究大多使用链接分析的方式揭示网络文献存在状况的变化。

本文试图通过对新浪网站的实证研究,以评论量标示信息的价值,揭示网络信息老化的规律,并探讨这种规律对于网站建设的指导性作用。

  由于网络信息以网络为载体,网络信息老化产生了与传统文献信息不同的老化特点,例如快速性、动态性、载体与内容分离性等,为网络信息的老化研究带来了新的挑战。

鉴于这种复杂性,可以从不同的角度分析网络信息的老化规律。

从计量方法上来看,有静态网络信息老化和动态网络信息老化,静态地看待网络信息老化即不计算网络信息的增长因素影响;从时间上看,有历时老化与共时老化,历时老化研究是某站点某一时间被引或链接次数随时间而减少的情况,共时老化是某站点或某些站点在不同时间被引或链接次数减少的情况;从范围上看,分为局部信息老化与普遍信息老化。

  从研究现状上看,网络信息老化研究还是传承于传统的文献老化研究,通过链接量或者点击量代替传统文献的引用来量化网络信息的价值,以整个互联网范围内信息价值的衰减为目标。

但是以往的研究存在两个问题:

网络链接具有复杂性,传统文献中引用基本上能够表明对被引用文献价值的认可,但是网络链接可能是处于商业目的等其他的原因。

点击既不能表明用户对内容产生了兴趣,也不能表明这些网络信息对用户是有价值的。

因此,点击量或者链接的数量能否反映网络信息的价值是存在疑问的,缺乏对某一领域细分范围内网络信息价值的研究。

不同的信息受众是不一样的,因此也可能产生不一样的变化规律,一概而论是不合适的。

  本文以新浪网站中的国内新闻为研究对象,通过评论量量化信息的价值,正是针对以上情况提出的研究方式。

一方面,评论量能够比链接和点击更加准确地反映信息的价值。

新浪网站会删除无关的言论,因此可以认为留下了评论的人都是认认真真看过新闻的人,而且对这个新闻有兴趣,并且产生了自己的看法。

另一方面,新浪网站的新闻有比较固定的受众,新闻也是比较正式,普遍具有一定价值的网络信息,因此可以在比较小的范围内产生较为准确的结果。

  3、网络信息老化实证研究

  3.1研究方法本文从新浪国内新闻板块2009年的专题报道中随机抽取50条新闻,统计在新闻发布后每一天的评论数量。

连续统计13天,13天之后的评论数量归为一类。

以评论量代表新闻信息的价值,通过评论量的变化分析网络信息老化的规律。

  本文选取新浪网站作为数据来源,主要是基于以下原因:

由表2可知,2009年87.9%的网民上网是要看新闻的,新闻类信息量大,网页多[2]。

新浪作为中国最早的门户网站之一,规模较大,具有为数众多的用户[3]。

新浪网站运营正规,对于评论管理严格,能够及时删除垃圾信息影响。

  选取专题报道的评论量来代表网络信息的价值主要是基于对网络信息价值的认识。

网络信息中有大量的没有价值的信息,这样的信息本身价值为零,也就没有研究其老化的必要。

如果有用户浏览新闻并且留下了自己的看法,可以认为该信息吸引了用户的注意力并且满足了用户的某种需求,或者反对或者支持,都表明用户重视这条新闻。

因此本文选择了本身就比较受关注的专题类新闻,统计其评论量的变化。

  3.2数据抽取2009年两会专题及相关的网页,顺次编号,每天的评论增量如表2所示(最后一列标示的是在网页发表的第14天及14天以后出现的评论。

  3.3讨论

  3.3.1半衰期小于一天。

由表2中不难看出第一天的评论量最多,往往超过50%,之后评论量不断减少直至为零,计算其平均值得到:

平均第一天评论量为597条,占总评论量的82.4%。

说明该网页信息在新浪网上逐渐失去了人们的关注,信息的价值不断减少。

这也与网络舆论监督中处理突发事件的“黄金24小时”原则相符,也就是说当突发事件发生时,最关键的就是在24小时内在网络上作出回应,引导舆论走向。

在2010年2月2日,由人民网舆情监测室首次提出的“黄金4小时媒体”概念,刷新了以往处置突发事件的“黄金24小时”法则。

文章认为,随着QQ、BBS、微博客等新兴网络技术和应用的普及,政府发布信息、引导舆论的速度应该由24小时提升为4小时。

由于本文的计量是以天为单位,无法进一步证实网络信息老化半衰期的具体时间。

  3.3.2设评论量为y。

lny随t的增加而减少。

  得出评论量的变化符合负指数方程。

SPSS分析的结果如表3所示。

  

=0.705,即回归平方和占总平方和的70.5%,lny与t的拟合度较高。

SignificanceF<0.05,说明两变量之间线性关系显著。

  Significantt<0.05,说明时间确实对评论量有显著的影响。

且计算除了相关性程度,lny=-0.35t+4.502,即

,评论量随时间呈现负指数变化,在某种程度上与贝尔纳在1958年提出的文献信息老化模型

,相符。

  图1评论量变化

  3.3.3

=0.705<1。

时间变量对于网络信息评论量的减少的影响达到了70.5%,也就是说网络新闻信息的老化与时间有极为显著的关系。

但是另一方面也反映出网络信息的价值随时间衰减之外可能与其他因素也有关系,而这一部分的影响虽然远远不及时间变量,也接近30%。

例如娱乐新闻与社会新闻,不同的新闻属性面对不同的受众群体可能会影响网络信息的衰减;视频新闻与文字新闻,不同的新闻表现形式也可能会对网络信息的衰减产生不同程度的影响;凌晨发布的与中午发布的新闻由于时间不同也可能会对网络信息产生不同的影响。

本文只选取了50个样本,样本较少,难以谈论到以上因素,但这些都是值得深入研究的。

  3.3.4网络信息的价值具有波动性。

从14天及第14天以后的评论量可以看出,由于网络信息基本不存在储存的成本,会长期存在于网络上,本来已经随着时间而失去价值的信息也可能由于别的关联信息而再次得到注意,重新获得价值。

如2008年的汶川地震,随着灾难的过去相关的网页也逐渐变得无人问津,但是2009年新浪做了一个汶川地震一周年的专题,2008年报道的某些感人事迹可能再次得到人们的关注,重新获得价值,开始新一轮信息衰减过程。

这一点与传统的文献信息老化有较大的区别,值得深入研究。

  4、结论

  由本文的实证分析可知在单一网站内部,网络信息的老化符合负指数变化的规律,即

,与传统的文献信息老化(

)表现为相同的规律,但是速度要快得多。

除此之外还有别的因素会影响网络信息的衰减,网络信息的价值有时会出现较大的波动。

  通过对网络信息老化规律的研究可以在一定程度上指导网站建设。

  a.通过对网站一系列指标的测度,可以更清晰地展现该网站自身信息老化的状况,有助于网站建设者对已失去使用价值的网页或信息进行删除或更改优化网站自身建设,扩大网站的影响力。

  b.掌握网络信息老化规律可以知道网站首页的更新。

网站的首页,特别的新闻网站的首页对网站有着至关重要的作用,首页上往往放置最为重要的新闻,以求最大限度地吸引读者。

掌握了网络信息老化规律,就可以科学地度量网络新闻经过多长时间会失去它的效用,应当在什么时间将其撤下首页。

如就本文分析,新浪网的新闻效用持续不超过一天,那么该新闻在首页上所占用的时间不应当超过一天,在效用逐渐丧失后就应当使用更新的新闻替代,这样才能保持网站的整体活力。

  c.通过对网络信息老化规律的进一步研究可以指导网站科学地决定网络信息更新的时间,以更加吻合目标读者的需求。

由于网络信息老化的极为迅速,以网络新闻为例,很快就会被铺天盖地的其他信息所覆盖,所以网络新闻的发布时间极为重要,在发布的最初几个小时中能否得到关注,很大程度上决定了该新闻能否充分体现价值,了解了网络信息老化的规律,再结合目标读者浏览网站的习惯性时间段,网站建设者可以更加准确地把握信息发布的时机。

  如果能够对影响网络信息老化的其他因素作出进一步的研究,对于相关网络信息之间的关联、对于网络信息老化的影响有更深入的探讨,会对网站的建设产生更为重大的影响。

  【参考文献】

  [1]邱均平.信息计量学[M].武汉:

武汉大学出版社,2007:

561

  [2]第25次中国互联网络发展状况调查统计报告[ES].[2009-02-19].

  [3]JuditBar-lan,BlumaCPeritz.TheLifeSpanofaSpecificTopicontheWeb:

theCaseof"Informatrics"aQuantitativeAnalysis[J].Scientmetrics,1999,46(3):

371-382

  [4]WallaceKoehler.AnAnalysisofWebPageandWebSiteConstancyandPermanence[J].JournaloftheAmericanSocietyforInformationScience,1999,50

(2):

162-180

  [5]Steve,etal.PersistenceofWebinScientificResearch[EB].[2008-07-14].http:

//www.searchlores,org/library/persistence-computer01.pelf

  [6]KoehlerW.WebPageChangeandPersistence-Afour-yearLongitudinalStudy[J].JournaloftheAmericanSocietyforInformationScienceandTechnology,2000,53

(2):

162-171

  [7]GohDH,NgPK.LinkDecayinLeadingInformationScienceJournals[J].JournaloftheAmericanSocietyforInformationScienceandTechnology,58(t):

15-24

  [8]卡尔.夏皮罗,哈尔·瓦里安.信息规则[M].北京:

人民大学出版社,2000:

2-23

  [9]段宇峰.网络信息资源老化规律研究[J].图书情报知识,2005(4):

28-31

  [10]段宇峰.网络信息存续状态研究[J].情报科学,2008,26(8):

1232-1243

  [11]马费成,夏永红,网络信息的生命周期的实证研究[J].情报理论与实践,2009(6):

1-7

  [12]邱均平,陈远,倪超群.论网络信息传播的价值[J].山东社会科学,2009

(1):

58-61

  [13]康轶捷,代恩献.网络传播的经济悖论[J].中国传媒科技,2006(9):

33-35

  [14]陈京莲.信息传播的增益、信息选择的价值判断和信息价值的传递[J].井冈山学报(自然学科),2006(4):

38-39

  [15]王宏鑫,邱均平.关于网络信息老化研究的若干问题[J].情报理论与实践,2004(4):

433-435

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 成人教育 > 成考

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1