ImageVerifierCode 换一换
格式:DOCX , 页数:13 ,大小:1.07MB ,
资源ID:11749235      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/11749235.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(网络信息老化实证研究以新浪新闻为例.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

网络信息老化实证研究以新浪新闻为例.docx

1、网络信息老化实证研究以新浪新闻为例网络信息老化实证研究以新浪新闻为例鞠菲2012-9-28 14:36:48来源:情报杂志(西安)2010年10期【英文标题】The Empirical Study of Network Information Aging:With the News on as an Example【作者简介】鞠菲(1988-),女,硕士研究生,研究方向为信息源管理与网络计量学。华东师范大学商学院信息学系上海200241【内容提要】网络信息以网络为载体,网络信息老化产生了与传统文献信息不同的老化特点。受传统文献老化研究中通过引文数量衡量信息价值的影响,已有的实证研究大多通过链接

2、数量衡量信息的价值,但是由于网络的特殊性,链接分析存在较多的干扰因素。以新浪网站中的国内新闻为研究对象,通过评论量量化信息的价值,通过对新浪新闻的抽样调查,统计网络新闻信息在发布后每小时评论量的增长,分析网络信息价值的衰减。由分析可知,在单一网站内部,网络信息的老化符合负指数变化的规律,即y=e0.35t+4.502,与传统的文献信息老化表现为相同的规律,但是速度要快得多,半衰期小于一天。同时网络信息的老化还受到其他因素的影响呈现波动性。掌握了网络信息老化的规律将为网站建设者指明一条更加清晰的道路,使其更好地服务于用户。【关 键 词】网络信息/文献老化定律/信息计量学信息资源数字化、网络化以及

3、网上文献信息数量激增,不仅为网络信息计量学的产生提供了必要的基础和条件,而且产生了迫切的实际需求。从网络信息计量学的研究对象、方法、内容和目标等方面来看,网络信息计量学是采用数学、统计学等定量分析方法,对网上信息的组织、存储、分布、传递、相互印证和开发利用进行描述和统计分析,以解释其数量特征和内在规律的一门新兴分支学科,是信息计量学的一个新的发展方向和重要的研究领域,具有广阔的应用前景1。网络信息的老化研究是网络信息计量学研究的重要组成部分,一方面对于网络信息计量学的学科体系的完善与发展具有重要的意义;另一方面,截至2009年12月31日,中国域名综述为1 682万,中国网民规模达到3.84亿

4、人,普及率达到28.9%,其中网络新闻在网络使用率中占80.1%2。网络发展迅速,同时也带来了信息量的爆炸性增长。对网络信息老化规律的研究也可以对网络信息的更新进行研究,追踪网络信息被利用的过程,指导网络信息资源的建设。1、网络信息老化研究现状网络信息一般指以数字化形式记录,以多媒体形式表达,通过计算机网络通信方式进行传输、识别、利用,在一定时间内可稳定获取和固定访问的信息单元。网络信息时刻都在增长,同时新的信息代替老的信息,信息的效用价值随着时间而改变,有的信息可能还会最后被销毁,或者无法访问,这就是信息的老化现象。延用文献信息老化的概念,网络信息老化就是网络信息价值丧失的过程,同时也是一种

5、客观的社会现象。传统的文献老化研究主要指科学文献随其“年龄”的增长,其内容日益变得陈旧过时,作为情报员的价值不断减小,甚至完全丧失其利用价值,文献老化既是一种客观的社会现象,又是一个复杂的动态过程。随着研究的深化,逐渐形成了以半衰期(half-life)和普莱斯(price index)指数为主要研究指标,通过文献管理统计数据分析、引文分析、数学分析和综合分析的方法,用负指数模型、巴尔顿开普勒(Burton-Kebler)老化方程、布鲁克斯(Brookes)积累指数模型、阿弗拉米司库(A. Avaramescu)方程等数学模型来描述文献老化规律的体系。网络信息老化的研究大多脱胎于传统的文献老化

6、研究,但是又因为网络信息自身的特点,产生了新的研究领域。网络信息的价值在于网络信息传递给了用户,并且满足了用户某方面的需求。关于网络信息老化的研究主要集中在以下三个方面:1.1可访问性可访问性即网络信息依赖的载体是可以被访问的。如果信息储存的介质损坏消失,或者虽然信息本身存在,但是没有有效的url,不能够被访问的网络信息是没有价值的。1999年Judit Bar-lan和Bluma C.Peritz在Scientometrics上发文The Life Span of a Special Topic on the Web,研究了从1998年1月3日到1998年7月7日这段时间中关于信息计量学的网

7、络文档。他们发现了三种变化趋势:文档消失了;文档的内容发生了改变;增加了新来的文档3。表明68%的文献在一年之内会被从网上移除,文献4表明12.2%的网站和20.5%的网页6个月之后不能再被访问。这些网页或者网站中的信息都逐渐丧失了其价值。同一年,Wallace Koehler随机提取了361个网址,以周为时间间隔,进行了为期一年的跟踪研究,研究结果显示,6个月后有12.2%的网站和20.5%的网页不能访问,97%的网站和98.3%的网页发生了变化。他得出结论,网络信息交流有别于以往的信息交流方式,介于产生后永久存在和产生后立即消失之间4。2000年5月,Steve Lawrence对从Res

8、earch lndex数据库收录的文献中的67 577个URL引文的有效性进行了跟踪,发现一年前发表的文献引用的URL已经有23%无效,1994年发表的文献引用的URL无效的比率高达53%5。Koehler将半衰期引入网络信息老化研究;他将网络信息半衰期定为一定范围内一半的网络文献消失所需要的时间,他的研究表明这个时间大约为2年,由于域名以及文档类型的不同、半衰期不同,文档产生之后内容趋于稳定6。而在2007年Dion Hoe-Lian Goh和Peng Kin Ng历时7年(19972003)的研究中发现网络引用链接半衰期约为5年,网上31%的链接无法适用,主要是由于无法找到网页,在edu域

9、名下的链接的失效率更是高达36%,提出链接老化是一个无法忽略的问题7。1.2吸引性网络信息虽然存在,也可以被访问,但是没有访问者的信息也是没有实现其价值的。美国学者卡尔夏皮罗和哈尔瓦里安在信息规则一书中指出了信息产品的特点,其中之一就是信息的丰富产生注意力的贫乏,注意力是稀缺资源8。在浩如烟海的网络信息中,吸引到用户的注意力不仅仅是实现网络信息价值的必要条件,在很大程度上还将决定网络信息价值的大小。用户对信息的敏感度越大,网络信息的价值也越大,信息传播的效率越高,网络信息的价值也越大。2005年,段宇峰在分析了网络信息资源老化的原因及其特征的基础上提出衡量网络信息资源的老化状况应该从网络信息的

10、生命周期和被利用情况两方面考虑。提出以静态半衰期、动态半衰期和生存期作为衡量网络信息资源滋生生命周期的指标,以宏观网络信息资源半衰期和微观网络信息资源半衰期作为衡量网络信息资源被利用情况的指标9。并且在从网络信息的更新、生存期和可存取性三个方面针对不同类型的网络文献类型对网络信息循序状态进行了为期4个月的实证研究10。2009年,马费成和夏永红对网络信息的生命周期进行了实证研究,他们将网络信息的生命周期定义为网络信息从产生到失去价值所经历的各个阶段和整个过程。基于假设:网络信息被利用的越多,说明人们对它越感兴趣,其效用价值就越高;被利用的越少,说明人们对它失去了兴趣,其效用价值就越低,他们以中

11、国期刊网、Wiley InterScience平台、人民网强国论坛、网易新闻中心和Alexa排名前50的网站为研究对象,对不同类型的网络信息的周期态势进行误差、记录和分析,揭示了网络信息成长、成熟、衰退的三个阶段11。注意力主要由信息的内容决定,爆炸性的新闻往往能够在极短的时间里引起极大的轰动,这样的轰动又将进一步吸引更多的注意力,网络信息的价值也随之增长。同时,能否吸引注意力也与信息的类型、转播渠道、储存介质、推广方式等相关。由于网络信息极为丰富,既有即刻引爆网络的信息,也有信息完全没有人注意,如在天涯这样的知名论坛中有些帖子日回复量就可以有几十页,但是也有一些帖子的阅读量为零。1.3网络信

12、息传播的价值垃圾信息或者无用的信息是没有价值的。例如垃圾邮件,或者是太阳从东方升起这样人人都知道的信息是没有价值的。一般认为有价值的网络信息满足了网民不同层次的个人需求。不同的人上网都有不同的诉求,通过第25次互联网发展报告可以看到,人们使用网络的方式是多种多样的,不论是满足了的娱乐需求、信息需求、交流沟通的需求还是满足了商务交易的需求,都实现了网络信息的价值(见表1)。 2009年,邱均平、陈远、倪超群共同探讨了网络信息传播的价值,提出了网络信息传播的价值内涵以及影响网络信息传播价值的因素。文中指出网络信息传播的价值通过其使用价值最终表现为商业价值,由网络信息的内容、信息的用户、信息传播的技

13、术和信息传播的社会关系共同来实现。“动力圈”、交流情景、价值寿命、质量向量、效率成本等因素构成影响网络信息传播价值的主要因素。网络信息价值的大小与对受众有用和投合的程度成正比。可以从传播信息的来源、组织、内容、环境、网民体验5个方面设计评价网络信息传播的基本指标12。同时也提出要注意不是所有的网络信息都是有价值的,甚至有的信息是有负价值的,有学者提出了网络信息的经济悖论现象13:网络传播的信息量越来越多,可利用率却越来越低;信息传播效率高,效益价值低。究其原因类似于经济学中的“公地悲剧”,任何一个传播者增加一定信息的正效用几乎完全归己,而负效用却由网络上所有传播者和广大受众共同承担。陈京莲发现

14、了信息价值寿命与信息传播之间密不可分的关系14:受众对信息的敏感度越大,信息传播的增益也越大;信息传播的效率越高,信息传播的增益也越高;网络信息价值的平均寿命越大,单位信息的价值再传播就丢失得越少;信息传播速度越大,信息传播后剩余的价值就越小,此信息传递到最后将只剩下信息的社会价值,即这种信息最后变成了社会知识而其经济价值将可以忽略不计。2、网络信息老化研究内涵国外关于网络信息老化研究的起步较早。国内有关的研究起步比较晚。2004年,王宏鑫和邱均平在关于网络信息老化研究的若干问题中指出,网络信息老化研究的主要任务是围绕研究目标,寻找网络信息老化的测度指标,采用数学、统计学等各种定量方法对网络信

15、息老化进行定量描述和统计分析,以便解释网络信息老化数量特征和内在规律,建立相应的数学模型并提出理论解释体系。因而包括:网络信息老化测度研究;网络信息老化规律研究;网络信息老化规律的应用研究等内容15。现存关于网络信息老化的研究大多使用链接分析的方式揭示网络文献存在状况的变化。本文试图通过对新浪网站的实证研究,以评论量标示信息的价值,揭示网络信息老化的规律,并探讨这种规律对于网站建设的指导性作用。由于网络信息以网络为载体,网络信息老化产生了与传统文献信息不同的老化特点,例如快速性、动态性、载体与内容分离性等,为网络信息的老化研究带来了新的挑战。鉴于这种复杂性,可以从不同的角度分析网络信息的老化规

16、律。从计量方法上来看,有静态网络信息老化和动态网络信息老化,静态地看待网络信息老化即不计算网络信息的增长因素影响;从时间上看,有历时老化与共时老化,历时老化研究是某站点某一时间被引或链接次数随时间而减少的情况,共时老化是某站点或某些站点在不同时间被引或链接次数减少的情况;从范围上看,分为局部信息老化与普遍信息老化。从研究现状上看,网络信息老化研究还是传承于传统的文献老化研究,通过链接量或者点击量代替传统文献的引用来量化网络信息的价值,以整个互联网范围内信息价值的衰减为目标。但是以往的研究存在两个问题:网络链接具有复杂性,传统文献中引用基本上能够表明对被引用文献价值的认可,但是网络链接可能是处于

17、商业目的等其他的原因。点击既不能表明用户对内容产生了兴趣,也不能表明这些网络信息对用户是有价值的。因此,点击量或者链接的数量能否反映网络信息的价值是存在疑问的,缺乏对某一领域细分范围内网络信息价值的研究。不同的信息受众是不一样的,因此也可能产生不一样的变化规律,一概而论是不合适的。本文以新浪网站中的国内新闻为研究对象,通过评论量量化信息的价值,正是针对以上情况提出的研究方式。一方面,评论量能够比链接和点击更加准确地反映信息的价值。新浪网站会删除无关的言论,因此可以认为留下了评论的人都是认认真真看过新闻的人,而且对这个新闻有兴趣,并且产生了自己的看法。另一方面,新浪网站的新闻有比较固定的受众,新

18、闻也是比较正式,普遍具有一定价值的网络信息,因此可以在比较小的范围内产生较为准确的结果。3、网络信息老化实证研究3.1研究方法本文从新浪国内新闻板块2009年的专题报道中随机抽取50条新闻,统计在新闻发布后每一天的评论数量。连续统计13天,13天之后的评论数量归为一类。以评论量代表新闻信息的价值,通过评论量的变化分析网络信息老化的规律。本文选取新浪网站作为数据来源,主要是基于以下原因:由表2可知,2009年87.9%的网民上网是要看新闻的,新闻类信息量大,网页多2。新浪作为中国最早的门户网站之一,规模较大,具有为数众多的用户3。新浪网站运营正规,对于评论管理严格,能够及时删除垃圾信息影响。选取

19、专题报道的评论量来代表网络信息的价值主要是基于对网络信息价值的认识。网络信息中有大量的没有价值的信息,这样的信息本身价值为零,也就没有研究其老化的必要。如果有用户浏览新闻并且留下了自己的看法,可以认为该信息吸引了用户的注意力并且满足了用户的某种需求,或者反对或者支持,都表明用户重视这条新闻。因此本文选择了本身就比较受关注的专题类新闻,统计其评论量的变化。3.2数据抽取2009年两会专题及相关的网页,顺次编号,每天的评论增量如表2所示(最后一列标示的是在网页发表的第14天及14天以后出现的评论。3.3讨论3.3.1半衰期小于一天。由表2中不难看出第一天的评论量最多,往往超过50%,之后评论量不断

20、减少直至为零,计算其平均值得到:平均第一天评论量为597条,占总评论量的82.4%。说明该网页信息在新浪网上逐渐失去了人们的关注,信息的价值不断减少。这也与网络舆论监督中处理突发事件的“黄金24小时”原则相符,也就是说当突发事件发生时,最关键的就是在24小时内在网络上作出回应,引导舆论走向。在2010年2月2日,由人民网舆情监测室首次提出的“黄金4小时媒体”概念,刷新了以往处置突发事件的“黄金24小时”法则。文章认为,随着QQ、BBS、微博客等新兴网络技术和应用的普及,政府发布信息、引导舆论的速度应该由24小时提升为4小时。由于本文的计量是以天为单位,无法进一步证实网络信息老化半衰期的具体时间

21、。3.3.2设评论量为y。lny随t的增加而减少。得出评论量的变化符合负指数方程。SPSS分析的结果如表3所示。=0.705,即回归平方和占总平方和的70.5%,lny与t的拟合度较高。Significance F0.05,说明两变量之间线性关系显著。Significant t0.05,说明时间确实对评论量有显著的影响。且计算除了相关性程度,lny=-0.35t+4.502,即,评论量随时间呈现负指数变化,在某种程度上与贝尔纳在1958年提出的文献信息老化模型,相符。图1评论量变化3.3.3 =0.7051。时间变量对于网络信息评论量的减少的影响达到了70.5%,也就是说网络新闻信息的老化与时

22、间有极为显著的关系。但是另一方面也反映出网络信息的价值随时间衰减之外可能与其他因素也有关系,而这一部分的影响虽然远远不及时间变量,也接近30%。例如娱乐新闻与社会新闻,不同的新闻属性面对不同的受众群体可能会影响网络信息的衰减;视频新闻与文字新闻,不同的新闻表现形式也可能会对网络信息的衰减产生不同程度的影响;凌晨发布的与中午发布的新闻由于时间不同也可能会对网络信息产生不同的影响。本文只选取了50个样本,样本较少,难以谈论到以上因素,但这些都是值得深入研究的。3.3.4网络信息的价值具有波动性。从14天及第14天以后的评论量可以看出,由于网络信息基本不存在储存的成本,会长期存在于网络上,本来已经随

23、着时间而失去价值的信息也可能由于别的关联信息而再次得到注意,重新获得价值。如2008年的汶川地震,随着灾难的过去相关的网页也逐渐变得无人问津,但是2009年新浪做了一个汶川地震一周年的专题,2008年报道的某些感人事迹可能再次得到人们的关注,重新获得价值,开始新一轮信息衰减过程。这一点与传统的文献信息老化有较大的区别,值得深入研究。4、结论由本文的实证分析可知在单一网站内部,网络信息的老化符合负指数变化的规律,即,与传统的文献信息老化()表现为相同的规律,但是速度要快得多。除此之外还有别的因素会影响网络信息的衰减,网络信息的价值有时会出现较大的波动。通过对网络信息老化规律的研究可以在一定程度上

24、指导网站建设。a.通过对网站一系列指标的测度,可以更清晰地展现该网站自身信息老化的状况,有助于网站建设者对已失去使用价值的网页或信息进行删除或更改优化网站自身建设,扩大网站的影响力。b.掌握网络信息老化规律可以知道网站首页的更新。网站的首页,特别的新闻网站的首页对网站有着至关重要的作用,首页上往往放置最为重要的新闻,以求最大限度地吸引读者。掌握了网络信息老化规律,就可以科学地度量网络新闻经过多长时间会失去它的效用,应当在什么时间将其撤下首页。如就本文分析,新浪网的新闻效用持续不超过一天,那么该新闻在首页上所占用的时间不应当超过一天,在效用逐渐丧失后就应当使用更新的新闻替代,这样才能保持网站的整

25、体活力。c.通过对网络信息老化规律的进一步研究可以指导网站科学地决定网络信息更新的时间,以更加吻合目标读者的需求。由于网络信息老化的极为迅速,以网络新闻为例,很快就会被铺天盖地的其他信息所覆盖,所以网络新闻的发布时间极为重要,在发布的最初几个小时中能否得到关注,很大程度上决定了该新闻能否充分体现价值,了解了网络信息老化的规律,再结合目标读者浏览网站的习惯性时间段,网站建设者可以更加准确地把握信息发布的时机。如果能够对影响网络信息老化的其他因素作出进一步的研究,对于相关网络信息之间的关联、对于网络信息老化的影响有更深入的探讨,会对网站的建设产生更为重大的影响。【参考文献】1邱均平.信息计量学M.

26、武汉:武汉大学出版社,2007:5612第25次中国互联网络发展状况调查统计报告ES.2009-02-19.3Judit Bar-lan, Bluma C Peritz. The Life Span of a Specific Topic on the Web: the Case of Informatrics a Quantitative AnalysisJ. Scientmetrics, 1999, 46 (3):371-3824Wallace Koehler. An Analysis of Web Page and Web Site Con stancy and PermanenceJ.

27、 Journal of the American Society for Information Science, 1999,50 (2):162-1805Steve, et al. Persistence of Web in Scientific Research EB.2008-07-14. http :/www. searchlores, org/library/persistence-computer01. pelf6Koehler W. Web Page Change and Persistence-A four-year Longitudinal StudyJ. Journal o

28、f the American Society for Information Science and Technology,2000,53 (2):162-1717Goh D H, Ng P K. Link Decay in Leading Information Science JournalsJ. Journal of the American Society for Information Science and Technology, 58 (t) :15-248卡尔.夏皮罗,哈尔瓦里安.信息规则M.北京:人民大学出版社,2000:2-239段宇峰.网络信息资源老化规律研究J.图书情报知识,2005(4):28-3110段宇峰.网络信息存续状态研究J.情报科学,2008,26(8):1232-124311马费成,夏永红,网络信息的生命周期的实证研究J.情报理论与实践,2009(6):1-712邱均平,陈远,倪超群.论网络信息传播的价值J.山东社会科学,2009(1):58-6113康轶捷,代恩献.网络传播的经济悖论J.中国传媒科技,2006(9):33-3514陈京莲.信息传播的增益、信息选择的价值判断和信息价值的传递J.井冈山学报(自然学科),2006(4):38-3915王宏鑫,邱均平.关于网络信息老化研究的若干问题J.情报理论与实践,2004(4):433-435

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1