1、完整版信息管理学笔记第三章 信息分布一、简析马太效应的作用和表现形式。(06) 试以实例说明信息生产和分布中的马太效应(08)2.马太效应的负面影响 请简述马太效应在信息工作中的优缺点。优点:马太效应导致的信息分布的富集现象积极意义显而易见:在实际的信息管理工作中,它帮助我们突出重点、摒弃平均,为信息源的选择、获取、评价和利用提供依据,为降低信息管理成本,提高信息利用效益提供指导和方法。在理论上,它帮助我们认识信息的集中与分散特征、趋势和规律,发现信息管理学的基础性规律。缺点:马太效应描述的信息对象的优势和劣势过度积累,容易使信息工作者按简单的优劣进行信息的选择、评价、传播和利用,走入极端,使
2、信息工作者因循守旧、不思进取、不求变革创新,按经验和简单的规则从事复杂多变的信息工作。马太效应形成的信息富集有时仅仅是表面的、外在的。有的优势积累过程带有突发性和受统计学因素的影响,使得信息价值失真。如果过分注重核心信息源,就会忽略分布在其他信息源中有价值的信息。青睐名人、拒绝新人的习惯势力限制了新思想、新知识和新信息的产生及传播。 二、信息生产者的分布规律1.洛特卡定律洛特卡定律的图形描述统计学家洛特卡经过大量统计和研究,发表了一篇题名为“科学生产率的频率分布”的论文,旨在通过对发表论著的统计来探明科技工作者的生产能力及对科技进步和社会发展所作的贡献。他得出结论: (C0.607960.79
3、%)即平方反比分布规律:所有生产一篇论文的著者的比例刚刚超过60。例如在物理学史一览表数据中,共有1325名作者,写一篇论文的为784人,占总数的59.2%。如果取绝对数,则可表述为:生产2篇论文的作者大约是生产1篇论文作者数的;生产3篇论文的作者大约是生产1篇论文作者数的;生产n篇论文的作者大约是生产1篇论文作者数的。2.普赖斯定律(07)三、信息离散分布规律1.布拉德福定律(相等载文量的期刊分区)信息离散分布规律(04)说明信息离散分布的基本规律(05)2.齐夫定律(词频分布)齐夫分布曲线(06)四、信息对时间的分布规律1指数增长率普赖斯曲线:a如果我们以文献量为纵轴,以历史年代为横轴,把
4、各不同年代的文献量在坐标图上逐点描绘出来,然后以一光滑曲线连接各点,则可十分近似地表征文献随时间增长的规律。这就是著名的普赖斯曲线。 b通过对曲线分析,普赖斯最先注意到文献增长与时间成指数函数关系。如果用F(t)表示时刻t的文献量,则指数定律可表为下式: 式中:a是统计的初始时刻(t=0)的文献量;e = 2.718;b表示持续增长率。人们还常常用文献量翻一倍的时间来衡量文献的增长速度,即 式中:t为文献量翻倍时间,b为持续增长率。生长曲线: 普赖斯指出,考虑物质的、经济的、智力的及时间的影响和限制,文献信息的增长更趋近于生物的生长曲线(Logistic Curve),即最初生长或繁殖很快,随
5、着时间推移,其生长速度越来越慢,以致几乎不增加了。其方程为: 式中:F(t)代表时刻t的文献量,k为文献增长的最大值。一般说来,对不同的领域,描述其文献增长的生长曲线中各个常数(a,b,k)也是不相同的。统计规律表明:在不同的阶段科学文献增长的态势是不同的。a学科处于诞生和发展阶段,文献量指数增长,文献的寿命较短。b学科进入相对成熟阶段,文献增长就不能总保持原有的指数速率,增长率变小,曲线变得平缓,文献寿命相对变长。c某一知识领域的研究取得重大进展后进入相对成熟的阶段。内容上更新的文献又将进入一个新的急剧增长时期(如指数增长)。然后又进入一个稳定时期。d文献的增长往往会出现几个急剧增长时期和几
6、个相对稳定时期,呈现出错综复杂的格局。2逐渐过时律半衰期(05)普赖斯指数(04)可以用哪些指标来衡量和评价文献信息老化?(07)简述文献老化的影响因素答:文献老化受许多因素的影响,归纳起来主要有如下几点: a文献增长。文献的增长和老化是一个事物的两个方面,它们从不同的侧面来描述科学的发展,阐明科学知识的修正率。 b学科差异。世界上93%98%的科学杂志引用寿命为20年左右,但并不是所有这些学科的文献老化速率都大体一致,相反,彼此之间差异甚大。 c学科发展阶段的差异。即使是同一学科,不同的时期或阶段,文献的半衰期不尽完全相同。 d信息环境和需求。不同信息用户对文献的需求是不同的,因而信息利用者
7、的需求及所处的信息环境的研究十分必要。第四章 信息获取一、信息源及其特点1.信息源:是人们在科研活动、生产经营活动和其他一切活动中所产生的成果和各种原始记录,以及对这些成果和原始记录加工整理得到的成品都是借以获得信息的源泉。联合国教科文组织出版的文献术语把其定义为:个人为满足其信息需要而获得信息的来源,称为“信息源”。 2.简析信息源的分类及其特点。答:从便于对信息进行管理的角度可以将信息源划分为记录型、智力型、实物型、零次型,具体内容如下:记录型信息源包括由传统介质(纸张、竹、帛等)和各种现代介质(如磁盘、光盘、缩微胶卷、胶片等)记录和存贮的知识信息。记录型信息源的特点是传播信息系统,便于保
8、存,便于积累,便于利用。实物型信息源是由实物携带和存贮的知识信息,如某种生物的样品、产品样机、工艺品等。实物信息源直观生动,含有丰富的信息,易于理解和吸收。许多技术信息是通过实物来保存和传递的,在技术引进和产品开发中发挥重要作用,是反求工程的基础。智力型信息源主要指由人脑存贮的知识信息,包括人们掌握的各类知识、诀窍、技能和经验,有的可以用语言和文字明确表达和记录,有的则难以明确表达和记录,故又被称为隐性知识(tacit knowledge)。这类信息源主要由人脑携带,绝大多数内容难以扑捉,管理起来难度很大,在实际操作中,可借助人力资源管理的理论方法。零次信息源是指各种渠道中由人的口头传播的信息
9、。零次信息是人们通过直接交流获得的信息,是信息客体的内容直接作用于人的感觉(包括听、视、嗅、味、触觉)的结果,而不像记录型信息和实物型信息那样通过物质载体的记录形式发生作用。零次信息具有直接性、及时性、新颖性、随机性、非存贮性等典型特征。3.简析记录型信息源及其分类。答:定义按不同载体的类型,记录型信息源可分为: a印刷型。包括铅印、油印、胶印、木版印刷等等。其缺点是体积大,分量重,收藏要占很大空间,管理较为困难。b缩微型。一般指以感光材料为载体,利用光学记录技术,使印刷型文献按比例缩小的文献资料,包括缩微胶卷、缩微胶片(平片)和缩微卡片等缩微品。c计算机阅读型。它是将文字和图像转换成二进制数
10、字代码,记录在磁带、磁盘或光盘等载体上。d网络型。它直接在网上产生、发布、存贮和传播,如各类网络书刊、网络新闻、网站信息等等,可以下载存贮在其他载体上。e视听资料。又称声像资料或直感资料,它是运用录音、录像和摄影技术直接记录声音与图像的文献形式,包括唱片、录音带、录像带、电影、幻灯片等。 按信息加工的程度,可以分为: a一次信息。凡是在科研、生产、经营、文化及其他各类活动中生产的原始信息,称为一次信息。如期刊论文、研究报告、市场调查报告、专利说明书及各种网络信息。b 二次信息。是对一次信息进行加工整理后产生的一类信息,如书目、题录、简介、文摘等形式的检索工具。二次信息的重要作用,不仅在于报道,
11、更重要的是为查找一次信息提供线索。c三次信息。是在一、二次信息的基础上,经过分析、综合而产生的信息。人们常把这类信息称为信息分析研究的成果,如综述、述评、学科年度总结、文献指南、书目之书目等。按编辑出版形式的不同特点,可分为:图书、期刊、会议资料、专门报告、专利资料、政府出版物、学位论文、产品样本、档案、标准、新闻报纸等。4.反求工程:综合性很强的术语,它是以设计方法学为指导,以现代设计理论、方法、技术为基础,运用各种专业人员的工程设计经验、知识和创新思维,对已有新产品进行解剖、深化和再创造,是已有设计的设计,特别强调再创造是反求的灵魂。 5.简析零次信息的特征。(08) 答:零次信息源是指各
12、种渠道中由人的口头传播的信息。零次信息是人们通过直接交流获得的信息,是信息客体的内容直接作用于人的感觉(包括听、视、嗅、味、触觉)的结果,而不像记录型信息和实物型信息那样通过物质载体的记录形式发生作用。零次信息具有直接性、及时性、新颖性、随机性、非存贮性等典型特征。零次信息对经济活动和科技活动具有不可忽视的作用。零次信息的存在形式、传播渠道具有较大的随意性,难以存贮和系统积累,给这类信息的管理带来了很大困难,需要采用特殊的方法搜集、记录、整理和存贮。6.简析零次信息源在经济活动和科技活动中的作用。答:定义、零次信息对经济活动和科技活动具有不可忽视的作用:新知识、新概念、新术语、新数据常常通过非
13、正式渠道以零次信息的形式传播,获取零次可以补充信息和正规渠道的不足。如果组织机构信息系统不健全,信息工作者水平低,不能提供有价值的信息,或者信息渠道不畅,也可以通过捕捉零次信息加以弥补。在市场环境中,零次信息占有较大比例,反映市场供求、价格、竞争状态的变化,是市场调查和分析的依据。在现代咨询服务中,用户的需求通过零次信息反映出来,咨询人员所提供的知识经验正是他们携带的零次信息。随着网络的兴起和普及,零次信息的传递超越了时空限制,传播量、速度和影响面越来越大。二、信息的选择与评价1.什么是有价值的信息,怎样评价和判断信息是否有价值?(05)2.1简述信息源的评价与选择的方法答:目前,对信息源的评
14、价一般采用两种方法:直接评价法和间接评价法。直接评价法就是按照前述有价值的信息应当具备的一般条件或标准,从不同角度和侧面对信息源的价值给予评分评价。现采用五项指标、十分制对常见的信息源进行评价。各种信息源的该五项指标得分相加,便是该信息源所得的总分(还可按重要性一个权值,得分*权值再相加);按总分多少可对信息源进行排序。 总的说来,这种评定方法还是十分粗浅的,不能准确地揭示信息源的真正价值。(评分带有极大的主观性,完全取决于信息工作者个人;不考虑信息在实际应用中的真正动态;五项指标不完备)间接评价法是通过信息用户来评价信息源。以调查表的方式调查用户对信息源的需求和利用情况,然后由信息工作者对调
15、查所得到的数据进行统计分析和对比,对信息源的价值做出评定。这种方法的特点是需要信息用户密切配合,工作量较大,但评价结果较为客观。2.2请简析间接评价信息源的四种重要指标。 答:评分平均值:用被调查者(指有效的被调查人)的人数去除这些被调查者给某一信息源的评分之和。 信息源j的平均评分; 被调查人数; 被调查人i给信息源j的评分。 评分比重 某一信息源所得全体被调查者的评分和,在全体被调查者给所有信息源的评分总和中所占的比重 。 信息源j的评分比重; 信息源数; 与(4-1)式中的相同。 最高评分频度 全体被调查者给某一信息源的全部评分中评最高分数的人数所占的比例,称为最高评分频度。 最高评分频
16、度; 给最高评分的被调查者数; 同前。 平均名次指标 将全部信息源分别就各个被调查者的评分排队,列出名次,然后用被调查者总数去除名次的数值和,便是相应项目的平均名次。 信息源j的平均名次 被调查i给信息源j的评分排队名次 同前3.如何评价信息的准确度。(04)4.1请简述信息的经济性评价方法。答:为了经济有效地搜集信息,可以从下述要点来评价信息:所需信息存在率的评价。首先调查有关的信息源、载体、实物是否存在,如果存在,要用什么方法获得,评价获取的难易程度。所需信息适合率的评价。评价获取的信息和所需信息的内容吻合程度。所需信息可靠性的评价。对于二次和三次信息,应评价其性质、加工深度、是否能获得证
17、明性信息、其所处的位置等以确认其可靠性。4.2信息的再现率与适合率4.3简述信息利用和评价错误的原因及其内容。三、信息获取的途径1.1请简述信息获取的效率指标答:采全率:来衡量切题信息搜集的完整程度,指某一信息系统(信息库)所含的全部切题性信息(对该系统全体用户而言)在当时系统内外所有切题信息中所占的比例。如果用P表示采全率,r表示该信息系统中切题的信息,R表示当时系统内外全部切题的信息,信息采全率可表示为:P = r / R 采准率:来衡量信息搜集的针对性,指某一信息系统(信息库)所含的全部切题信息(对该系统全体用户而言)在当时该系统所有信息中所占的比例。如果用E表示采准率,r表示该系统中切
18、题的信息,Q表示系统内所有的信息,信息采准率可表示为:E = r / Q 及时率:来衡量信息搜集的速度,即在最短的时间内完成信息搜集过程的能力。它由搜集过程的每一环节(从信息的产生到其被输入到信息库)所花费的总时间来计算,表示为: 式中,i=1,2,n,表示搜集过程的环节数。 费用率:来衡量信息搜集的资金效率,指用于信息库中单位信息的费用的最低能力。如果C表示单位信息的费用率,F表示年度搜集信息的总花费,G表示年搜集到的信息量(总件数),费用率可表示为:C = F / G劳动耗费率:指信息系统搜集到的单位信息所耗费的最低劳动量,可用搜集过程所有环节的劳动消耗总数来计算。如果L表示搜集信息的工作
19、量, (i=1,2,,n)表示单位(件)信息在每一环节中的劳动耗费(可用人、时等单位表示),劳动耗费率可表示为:1.2采准率(06)1.3怎样评价信息获取的效率(06)2. 请简述信息搜集的原则 答:针对性:任何信息服务机构必须根据本机构的性质、任务和服务对象有针对性地确定信息搜集的范围和重点。 系统性:需要追踪科学技术和国民经济发展进程,了解和掌握信息源的动态变化,系统地、连续地搜集和积累有关的信息。 预见性:信息搜集中要着眼未来,预见可能产生的新的信息源和信息渠道。提高信息服务的主动性。 科学性:采用科学方法研究信息源的分布规律,选择和确定信息密度大,信息含量多的信息源。 计划性:事先制定
20、比较周密详尽的信息搜集计划,以便按计划有目的、有步骤地搜集信息。 3. 请简述信息搜集的方法与途径答:采购:采购是一种经常性的、稳定的、系统的搜集和获取信息的有效方式。采购包括订购、现购、邮购、委托代购等具体方式,可以根据采购规模和自己的需要进行选择。 调查:现场调查、访问调查、问卷调查和样品搜集等。 交换:交换的信息源多属于内部资料、非卖品,不能通过采购或其他方式获得 。 索取:还不够详细、完备和全面的信息源,根据需要与可能,可以通过通讯联系或直接派人联系取得。检索:手工检索、脱机检索、联机检索 和网络检索。 上述信息搜集和获取方法不仅适用于信息机构,而且也适合于个人用户,而且个人在适用时更
21、具有灵活性和针对性。第五章 信息组织一、信息组织的基本原理1.请简述信息组织的概念与基本内容。答:信息组织,也叫信息整序,是利用一定的规则、方法和技术对信息的外部特征和内容特征进行揭示和描述,并按给定的参数和序列公式排列,使信息从无序集合转换为有序集合的过程。信息组织的基本内容包括:信息选择:从采集到的无序的信息流中甄别出有用的信息,剔除无用的信息。(第一步)信息分析:按一定逻辑关系从语义、语用和语法上对选择过的信息内、外部特征进行细化、挖掘、加工整理并归类。(前提和基础)信息描述和揭示:根据信息组织和检索的需要,对信息的主题内容、形式特征、物质形态等进行分析和记录。(至关重要)信息存储:将经
22、过加工整理序化后的信息按一定格式与顺序存储在特定的载体中。(终结、开始)2.请简述信息组织的类型。答:按信息表现形式划分:文字信息组织(文字、各种编码)、图像信息组织(GIF、JPEG、PNG)、声音信息组织(AD转换)、视频信息组织(图像+音频)按信息加工程度划分:一次信息组织、二次信息组织、三次信息组织按信息的传播载体划分:文献信息组织(记录型)、非文献信息组织(网络信息组织)3.请简述信息组织的特性。具体来说,信息组织具有以下特性:渗透性:信息组织存在于各种信息揭示、存贮和检索活动之中。依附性:信息组织无法独立存在,它要以信息的识别、揭示等活动为前提。信息组织离不开具体的信息揭示、传播、
23、存贮、检索过程,也无法与各种信息记录和信息实体相互分离。增效性:信息组织可以增加信息传播、检索、利用的效率,是其他信息加工和利用信息的保障。综上所述,信息的组织与排列,可以使信息概念、信息记录、信息实体在特定集合中的不确定分布状态减少到最低限制,增大信息的密度和强度,从而为认识、揭示、传播、存贮、检索、利用信息创造良好的条件。4.请简述信息组织的原则。答:无论对社会信息流的宏观信息组织还是微观信息组织,为充分发挥信息组织的功能和效用,都必须遵循以下一些科学原则:客观性原则:信息描述和揭示的信息来源必须是客观存在的信息本身,在信息组织中,要完整、全面、精确地反映信息的客观特征,并且跟踪信息源和信
24、息组织技术的发展变化。系统性原则:没有系统性的信息组织工作是不可能实现其整体目标的,为了实现信息组织的系统性,我们必须把握四个关系:宏观信息组织与微观、信息组织部门与其他、信息组织工作各个环节之间、不同信息处理方法之间。目的性原则:必须围绕用户的信息需求开展工作,注意信息机构的目标市场的需求状态及其变化特征,满足成本收益的原则。现代化原则:a思想挂念现代化集中体现在信息组织标准化上,主要包括基本术语标准、有关信息技术标准、其他相关标准;b技术手段现代化,包括自动标引、二次信息自动生成和数据库建设等。5.请简述信息组织的理论基础答:语言学:组织符号系统(语法、词汇)逻辑学:演绎推理、归纳推理、综
25、合、分析知识分类:知识体系结构(体系分类法) 系统论、耗散结构理论、协同学理论和自组织理论二、信息的描述与揭示1.元数据(08):关于数据的数据(data about data),关于信息的信息(information about information),或描述数据的数据(data that describe data)。它是专门用来描述数据的特征和属性,也是描述和组织信息资源、发现信息资源的语言工具。元数据是组织数据、各种数据域以及它们之间的相互关系的信息。2.请简述元数据的作用.识别:确认并对要进行组织的信息资源进行个别化描述,使用户能识别被组织的资源对象。定位:提供信息资源位置的信息,
26、以便用户访问时使用。检索:通过在描述数据中提供检索点,便于用户对资源的检索和利用。 选择:通过记录信息资源的特征,供用户对信息资源的使用价值进行判断,决定是否使用该资源。3.信息著录与标引著录:编制文献目录时,对文献内容和形式特征进行分析、选择和记录的过程。著录的结果是款目,它是反映文献内容和形式特征的著录项目的组合。将一批款目按照一定的次序编排而成的一种文献报道和检索工具是目录。款目是一种文献的缩影,目录是一批文献的缩影。标目:是从文献内容和形式的某一特征指引排检线索的著录项目。由于标引一般居于款目之首,并独居一行,故也称为款目的领头。标引:指分析文献的内容属性及相关外表属性,并用特定语言表
27、达分析出的属性或特征,从而赋予文献检索标识的过程。文献标引过程的两个环节:a主题分析,即把外表属性概括为主题,用自然语言表述,同时分析主题、概念之间结构关系:b转换标识(用特定检索标识揭示文献内容)。标引语言的类型:a依据构成原理:分类语言:用分类号表达主题概念,依据知识分类将主题概念组织、排列成类目体系,主要以类目体系的自身结构显示概念之间关系的标引语言。主题语言:由受控的自然语言直接表达主题概念,按语词字顺排列主题概念,主要用参照显示概念之间关系的标引语言。b依据组合时间的先后:先祖式语言、后组式语言、散组式语言。4.网络信息资源描述的相关标准MARC(Machine Readable C
28、atalogue):器可读目录,是一种计算机能够识别和阅读的目录。MARC格式伸缩性强,适应面广,具有如下特点:a共包括001999个字段;b字段内容著录详尽;c字段作用强化,可检索的字段多;d每条MARC记录可分为头标区、目次区、数据区。 Dublin Core(都柏林核心集):描述网络信息资源的一种简单元数据,是文献链接的客体。其目的是提供一种Internet资源的描述规范,以便发掘西文电子资源,包括15个数据单元(element) 主要优点:通俗易懂,运用灵活,国际通用,可扩展性VRA核心类目格式5.通用标记语言及相关标准 SGML(06):全称Standard Generalized Markup Language,通用置标语言标准.它是一种元语言,是用来描述置标语言的语言,适用于电子文档交换、文档管理和文档发布。它从结构和内容两个层次来描述文献,其核心是文档类型定义DTD(Document Type Definition) HTML(08):全称Hyper-text Markup Language,超文本置标语言.它是经过简化的SG
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1