信息检索资料.docx

上传人:b****4 文档编号:11932495 上传时间:2023-04-16 格式:DOCX 页数:68 大小:1.53MB
下载 相关 举报
信息检索资料.docx_第1页
第1页 / 共68页
信息检索资料.docx_第2页
第2页 / 共68页
信息检索资料.docx_第3页
第3页 / 共68页
信息检索资料.docx_第4页
第4页 / 共68页
信息检索资料.docx_第5页
第5页 / 共68页
点击查看更多>>
下载资源
资源描述

信息检索资料.docx

《信息检索资料.docx》由会员分享,可在线阅读,更多相关《信息检索资料.docx(68页珍藏版)》请在冰豆网上搜索。

信息检索资料.docx

信息检索资料

第一章 绪论

“信息”已成为今天使用频率最高的词汇之一。

搜索引擎“搜狐”上查到的32217个网站,2444525张网页;Inforseek上71418个网站,13376974张网页。

获取信息、评价信息、使用信息的能力,已经是信息社会劳动者必须掌握的终身技能。

教育专家们在20年前就宣布,面向21世纪的学生,除了要接受传统的阅读、写作教育外,还必须具备一定的信息素质。

为此,美国“信息素质全国论坛”将45项评价标准列为全国教育总目标的评价内容。

  理解信息的涵义,知道信息资源,掌握信息获取技巧,懂得如何利用信息服务是今天的大学生应有的最基本的知识之一。

  一、信息、信息意识与创新能力

   1、信息的基本含义及其特征

   2、知识、学习与信息

   3、创新能力、信息检索与信息意识

  二、各种信息源及其特征

   1、信息源

   2、文献信息源

   3、电子信息源

   4、实物及口头信息源

  三、信息服务业及其利用

   1、信息服务业概述

   2、政府信息系统

   3、信息咨询、中介及调查服务业

   4、文献服务系统

  四、信息素质资源教育的利用

   1、信息素质教育概述

   2、图书馆学、情报学知识的查询

   3、图书馆、情报类专业文献检索工具

   4、网上用户教育资源

一信息、信息意识与创新能力

1.信息的基本含义及其特征

  信息无处不在,无时不有,无人不用,今天它已成为使用频率最高的词汇之一。

对信息的利用越广泛,对信息的研究越深入,人们对信息的认识和理解也就越多样化、越深刻。

2.知识、学习与信息

  知识,是人类对于客观世界的认识。

信息是知识的重要组成部分,但只有将反映自然现象和社会现象的信息经过加工,上升为对自然和社会发展客观规律的认识,这种再生信息才构成知识。

3.创新能力、信息检索与信息意识

∙知识创新与信息检索

∙信息技能

∙信息意识 

  能否进行知识创新、技术创新,与有没有能力获取创新所需要的大量信息有关。

换言之,一个人的信息素质是其创新能力的重要组成部分。

同样重要的信息,有的人善于抓住,有的人却漠然视之。

这是由于各人的信息意识强弱不同。

一信息、信息意识与创新能力

1.信息的基本含义及其特征

  信息无处不在,无时不有,无人不用,今天它已成为使用频率最高的词汇之一。

对信息的利用越广泛,对信息的研究越深入,人们对信息的认识和理解也就越多样化、越深刻。

☆信息的定义 

  不同的学科,从不同的角度对信息这个概念有不同的解释。

经济学、心理学、新闻学和哲学的定义不同于图书情报学科对信息的定义.控制论专家N.维纳从信息自身具有的内容属性给信息下定义被许多研究所引用。

国内在这方面也有许多争论。

信息的定义

(一)

  不同的学科,从不同的角度对信息这个概念有不同的解释。

  在经济学家眼中,信息是与物质、能量相并列的客观世界的三大要素之一,是为管理和决策提供依据的有效数据。

    对心理学家而言,信息是存在于意识之外的东西,它存在于自然界、印刷品、硬盘以及空气之中。

   在新闻界,信息被普遍认为是对事物运动状态的陈述,是物与物、物与人、人与人之间的特征传输。

而新闻则是信息的一种,是具有新闻价值的信息。

   哲学家们从产生信息的客体来定义信息,认为事物的特征通过一定的媒介或传递形式使其它事物感知。

这些能被其它事物感知的、表征该事物特征的信号内容即为该事物向其它事物传递的信息。

所以,信息是事物本质、特征、运动规律的反映。

不同的事物有不同的本质、特征、运动规律,人们就是通过事物发出的信息来认识该事物,或区别于其它事物。

 

信息的定义

(二)

  

在图书馆学和情报学领域,信息被定义为事物(thing)或记录(record)。

美国学者巴克兰德(M.Buckland,1991)认为,许多事物都可以是信息,如文本、图片、录音磁带、博物馆陈列品、自然物体、实验、事件等。

但这一定义过于宽泛,未能将信息、信息载体和信息资源区分开来。

另一位美国学者萨克利夫(J.Tague-Sutcliff)则认为,信息是依赖于人类的概念化和理解能力的无形的东西,对于记录而言,它所包含的有形的字与图片等是绝对的,但它所包含的信息对于读者(或用户)则是相对的。

信息是读者通过阅读或其他认知方法处理记录所理解的东西,它不能脱离外在的事物或读者而独立存在,它是与文本和读者以及记录和用户之间的交互行为相关的,是与读者大脑的认知结构相对应的东西。

  

情报报学界引述最多的,是系统工程学家的看法。

信息论的创始人申农(右图)从通信系统理论的角度把信息定义为用来减少随机不确定性(uncertainty)的东西。

也就是说,信宿(信息接受方)未收到消息前不知道信源(信息产生方)发出什么信息,只有在收到消息后才能消除信源的不确定性。

如果没有干扰,信宿得到的信息量与信源的不确定性相等。

申农的看法,被认为是对信息的认识的重大进展,因为他推导出了信息测度数学公式,标志着信息科学进入了定量研究阶段。

信息的定义(三)

  控制论专家N.维纳(右图)的信息概念是从信息发送、传输、接收的过程中,客体和接收(认识)主体之间的相互作用来定义的。

他说,“信息既不是物质,又不是能量,信息就是信息。

”根据维纳的说法,物质、能量和信息是相互有区别的,是人类社会赖以生存、发展的三大基础——世界由物质组成,能量是一切物质运动的动力,信息是人类了解自然及人类社会的凭据。

信息对于物质而言具有相对独立性:

信息不遵循质量守恒定律,其性质和内容与物质载体的变换无关;同样,信息在传递和转换过程中也不服从能量守恒定律,信息可以共享而能量不能共享,信息效用的大小并不由其消耗来决定。

然而,信息与物质、能量又存在着密切的相互依存关系:

物质、能量和信息这三者中,能量和信息皆源于物质,任何信息的产生、表述、存储和传递都要以物质为基础,也离不开能量。

从另一方面来说,物质运动的状态和方式需要借助信息来表现和描述,能量的转换与驾驭也同样离不开信息。

维纳把信息的定义引入了控制论,他在《人有人的用处——控制论和社会》中说:

“信息这个名称的内容就是我们对外界进行调节并使我们的调节为外界所了解时而与外界交换来的东西。

信息的定义(四)

  国内专家在比较了中外各家各派的信息定义后,倾向于取中国学者钟义信的解释。

1988年,钟义信在《信息科学原理》一书中认为,信息是事物运动的状态与方式,是物质的一种属性。

在这里,“事物”泛指一切可能的研究对象,包括外部世界的物质客体,也包括主观世界的精神现象;“运动”泛指一切意义上的变化,包括机械运动、化学运动、思维运动和社会运动;

“运动方式”是指事物运动在时间上所呈现的过程和规律;“运动状态”则是事物运动在空间上所展示的形状与态势。

钟义信还指出,信息不同于消息,消息只是信息的外壳,信息则是消息的内核;信息不同于信号,信号是信息的载体,信息则是信号所载荷的内容;信息不同于数据,数据是记录信息的一种形式,同样的信息也可以用文字或图像来表述。

信息还不同于情报和知识。

总之,“信息即事物运动的状态与方式”这个定义具有最大的普遍性,不仅能涵盖所有其它的信息定义,还可以通过引入约束条件转换为所有其它的信息定义。

例如,引入认识主体这一约束条件,可以转化为认识论意义上的信息定义,即信息是认识主体所感知或所表述的事物运动的状态与方式。

换一个约束条件,以主体的认识能力和观察过程为依据,则可将认识论意义上的信息进一步分为先验信息(认识主体具有的记忆能力)、实得信息(认识主体具有的学习能力)和实在信息(在理想观察条件下认识主体所获得的关于事物的全部信息)。

层层引入的约束条件越多,信息的内涵就越丰富,适用范围也越小,由此构成相互间有一定联系的信息概念体系

☆信息的类型与特征

  信息广泛存在于自然界、生物界和人类社会。

信息是多种多样、多方面、多层次的,信息的类型亦可根据不同的角度来分。

了解信息的类型不仅有助于我们加深对信息内涵及其特征的认识,也有助于丰富信息检索的知识。

  从产生信息的客体的性质来分,可分为自然信息(瞬时发生的声、光、热、电、形形色色的天气变化、缓慢的地壳运动、天体演化……)、生物信息(生物为繁衍生存而表现出来的各种形态和行为,如遗传信息、生物体内信息交流、动物种群内的信息交流)、机器信息(自动控制系统)和(人类)社会信息。

一切存在都在进行着某种形式的表达,只不过人类的表达要丰富得多,因为他们的存在内容更丰富。

社会信息就是指人与人之间交流的信息,既包括通过手势、身体、眼神所传达的非语义信息,也包括用语言、文字、图表等语义信息所传达的一切对人类社会运动变化状态的描述。

按照人类活动领域,社会信息又可分为科技信息、经济信息、政治信息、军事信息、文化信息等。

  以信息所依附的载体为依据,可分为文献信息、口头信息、电子信息、生物信息等。

文献信息,就是文献所表达的内载信息,以文字、符号、声像信息为编码的人类精神信息,也是经人们筛选、归纳和整理后记录下来的信息(recordedinformation),它与人工符号本身没有必然的联系,但要通过符号系统实现其传递。

文献信息也是一种相对固化的信息,一经“定格”在某种载体上就不能随外界的变化而变化。

这种性质的优点是,易识别、易保存、易传播,使人类精神信息能传于异地,留于异时,缺点是不能随外界的变化而变化,固态化是文献信息老化的原因。

2.知识、学习与信息

  知识,是人类对于客观世界的认识。

信息是知识的重要组成部分,但只有将反映自然现象和社会现象的信息经过加工,上升为对自然和社会发展客观规律的认识,这种再生信息才构成知识。

知识,是人类对于客观世界的认识。

在这里,知识作广义的理解,包括消息、情况、事实、数据。

知识可分为理性知识和感性知识。

理性知识,是对客观事物的本质和规律性的认识,是经过思维、逻辑加工的知识,构成知识体系;感性知识,是对客观事物的描述和对现象、事实的感知,是未经逻辑加工的知识。

   知识的存在必须有一定的物质形式。

人脑、文献、实物这三种知识载体都是物质的。

人们为了进行知识的传递和交流,还必须使知识具有能为感觉器官所感知的形式,即借助于文字、语言、符号、代码、电磁波、图像和实物等形式加以表现。

这种表现形式也是信息。

   人们获取知识的途径有二:

一是直接来源于产生信息的客观事物,二是通过信息载体或媒介(文献、电视、广播、他人等)的传递、交流而间接获得。

然而,获得的信息能否转化为知识,转化得是否充分、完整,则取决于受主的认知能力。

例如,人们对于卫星照片,气象云团的识读能力是不同的,所获得的信息的量和质将会有差别。

3.创新能力、信息检索与信息意识

∙知识创新与信息检索

∙信息技能

∙信息意识 

  能否进行知识创新、技术创新,与有没有能力获取创新所需要的大量信息有关。

换言之,一个人的信息素质是其创新能力的重要组成部分。

同样重要的信息,有的人善于抓住,有的人却漠然视之。

这是由于各人的信息意识强弱不同。

☆知识创新与信息检索

  塞缪尔·约翰逊(SamuelJohnson)说:

知识分成两类,一类是我们要掌握的学科知识,另一类是要知道在哪儿可以找到有关知识的信息(Knowledgeisoftwokinds.Weknowasubjectourselves,orweknowwherewecanfindinformationuponit)。

知识创新与信息检索

  一个人的知识既来源于他对客观世界的观察和探索,又来源于其他个体(包括前人)的知识。

为此,他必须阅读科学文献,掌握有关的思想、事实、理论和

方法等信息,在此基础上进一步分析、综合和研究,才能有所创新。

能否进行知识创新、技术创新,与有没有能力获取创新所需要的大量信息有关。

换言之,一个人的信息素质是其创新能力的重要组成部分。

  

  没有知识就无法创新,这是人们的共识。

但是,今天人们感叹自身知识的亏空,原因不在于世界上缺乏所需的基本的知识和大量准确的信息,而在于知识的存贮过于庞大和无序,其集中体现是出版物的泛滥。

知识存贮的无序化加剧了“信息污染”的程度,堵塞了通向知识之门的道路,耗费了大量探索自然和社会规律的精力,以至于人们不得不认真学习和研究获取信息的方法,掌握从大量无序知识中搜索对自己有用的、准确的知识的技能。

因此,信息检索知识已经构成知识体系中一个不可缺少的部分。

☆信息技能

  面临知识的无限性和与个人能力的有限性、教育的时滞性与社会发展的多变性、书本的陈旧性和生活的现实性等矛盾,我们必须增强获取新知识的技能,这种寻求有关新知识的能力就是我们今天所说的信息技能。

面临知识的无限和与个人能力的有限性、教育的时滞性与社会发展的多变性、书本的陈旧性和生活的现实性等矛盾,我们怎样增强获取新知识的技能?

怎样通过搜集各方面的信息来构筑与自己的智力水平相适应的知识结构并不断地加以补充和完善?

   寻求有关新知识的能力就是我们今天所说的信息技能。

在大学期间,它又具体表现为以下6种技能:

∙明确任务(TaskDefinition):

了解问题的症结,确定所需信息和目的,分清任务的轻重缓急;

∙信息查询策略(InformationSeekingStrategies):

了解各种信息源,能够作出评价并确定优先查找的次序;

∙查找和检索(LocationandAccess):

确定信息藏址,从信息源中找出信息;

∙信息利用(UseofInformation):

能够读懂(或听懂、理解)查出的信息,了解信息在满足需求中的特定价值;

∙信息综合(Synthesis):

能够组织信息,提供信息产品(论文、报告等);

∙信息评价(Evaluation):

评价查找结果和解决问题的过程(效率)。

☆信息意识

  信息意识是人们利用信息系统获取所需信息的内在动因,具体表现为对信息的敏感性、选择能力和消化吸收能力。

  同样重要的信息,有的人善于抓住,有的人却漠然视之。

这是由于各人的信息意识强弱不同。

信息技能的掌握在很大程度上取决于信息意识的提高。

   

所谓信息意识,简单地说,是人们利用信息系统获取所需信息的内在动因,具体表现为对信息的敏感性、选择能力和消化吸收能力。

有无信息意识决定着人们捕捉、判断和利用信息的自觉程度。

而信息意识的强烈与否对能否挖掘出有价值的信息、对文献获取能力的提高起着关键的作用。

   信息意识含有信息认知、信息情感和信息行为倾向三个层面。

信息认知是指对信息和信息活动的了解和看法,其中最重要的是评价性的认知;信息情感是指人们多次从多方面感受信息的过程中,逐渐形成的某种持久、稳定的、反映本质的需求关系的内心体验,这种体验相对持久、相对稳定,而不是那种即时产生的情绪;信息行为倾向是指个人在信息活动中欲表现出来的行为趋向,是信息行为的心理准备状态。

   信息意识形式有两种:

一是被动接受状态,二是自觉活跃状态。

前者指人们从社会的信息环境中被动地接受事先未料及的信息;后者指信息意识的觉醒状态,它促使人们制订信息活动计划,主动关心和了解各种变化,并作出相应的选择。

   人们的信息搜集活动是受信息需求驱使的,影响需求的力量的大小主要就是需求被意识的清晰程度——意识越明确,行动目标越清楚,则信息活动的动机越稳定、持久、强烈,努力程度也就越高。

因此,信息意识的强弱直接影响人们的信息需求程度。

☆信息意识的评估

  作为大学生,应具有这样一种信息意识:

认识到信息和信息活动的功能和作用,认识到信息对他们的学习和课余科研活动的效用,认识各种信息源的价值和信息机构提供的产品和服务,形成对信息的积极体验,进而产生与学习和课余科研相适应的信息需求和信息行为倾向。

经常注意并搜集各种载体的信息,积极利用包括图书馆在内的各种信息机构的服务,努力扩充知识面,主动地、有意识地去学习基本信息检索技能。

   了解情报意识的有无和强弱,可以从以下几方面出发做出大致的判断:

∙是否认识到信息和信息活动的功能和作用;

∙是否具有对信息和信息活动的积极体验(依赖感、赞同感和支持感);

∙是否具有与学习有关的信息需求和信息行为倾向,愿以最少的时间高效率地了解、查询自己需要的信息;

∙是否能自觉地表达出情报需要,并能及时地去查寻或主动利用信息系统来满足这种需求;

∙是否善于运用创造性思维,从大量信息中捕捉新动向,猎取趋势性的或有价值的信息;

   信息意识是可以培养的,经过教育和实践,可以由被动的接受状态转变为自觉活跃的主动状态,而被“激活”的信息意识又可以进一步推动信息技能的学习和训练。

二各种信息源及其特征

1.信息源

   顾名思义,就是信息的来源。

由于信息的含义十分宽泛,信息源的定义也因学科领域的不同而有不同的解释。

  在此我们简单地将其分为文献信息源、电子信息源、实物及口头信息源。

2.文献信息源

∙文献和文献信息

∙几种主要的一次文献信息源

3.电子信息源

∙数据库

∙网络信息源

4.实物及口头信息源

∙实物信息源及其优点

∙口头信息源

1.信息源

顾名思义,就是信息的来源。

由于信息的含义十分宽泛,信息源的定义也因学科领域的不同而有不同的解释。

  在此我们简单地将其分为文献信息源、电子信息源、实物及口头信息源。

从传播学的角度看,“传播的来源是指生成、制作和发送信息的人,也可以是群体——指发生信息的部门或机构。

” 

  在图书情报领域,信息源被解释为“人们在科研活动、生产经营活动和其它一切活动中所产生的成果和各种原始记录,以及对这些成果和原始记录加工整理得到的成品”,又可进一步分为文献信息源和非文献信息源(包括口头信息源、实物信息源)。

  依据信息源的层次及其加工和集约程度,信息源可分四次:

所有物质均为一次信息源,也称本体论信息源,从一次信息源中提取信息是信息资源生产者的任务;二次信息源也称感知信息源,主要储存于人的大脑中,传播、信息咨询、决策等领域所研究的也主要是二次信息源;三次信息源又称再生信息源,主要包括口头信息源、体语信息源、文献信息源和实物信息源四大类型,其中又以文献信息源(包括印刷型和电子型文献信息源)最为重要;四次信息源也称集约信息源,是文献信息源和实物信息源的集约化和系统化,前者如档案馆、图书馆、数据库,后者如博物馆、样品室、展览馆、标本室等。

  各种定义都是从特定的角度来解释的,强调的侧重点不同而已。

简而言之,信息源可看作是产生、持有和传递信息的一切物体、人员和机构。

2.文献信息源

∙文献和文献信息

∙几种主要的一次文献信息源

☆文献和文献信息

∙文献的涵义:

文献是“记录有人类精神信息的、且便于存贮或传递的人工固态附载物”。

∙文献的构成

∙按文献生产加工层次划分的文献形式

∙文献信息

 

 

☆几种主要的一次文献信息源

∙图书

∙期刊

∙报纸

∙专利文献

∙标准文献

∙产品样本

∙会议文献

∙“灰色文献”

∙档案文献

∙科技报告

∙政府出版物

∙学位论文

一次文献主要由上述十二类文献构成。

(1)文献的涵义

随着生产力的发展,存贮和表达人们思想的物质载体不同了,从金石、竹简、羊皮、丝帛、纸张发展到用感光介质和磁性介质,文字已不再是表达思想的唯一手段,图形、声频、视频等同样成为表达思想、传递感情的重要手段。

   因此,不能把文献仅仅看作我们习惯的纸质形式的信息载体。

目前有关文献的较权威的定义主要有两个,一是《文献情报术语国际标准(草案)》(ISO/DIS5127)的定义,“为了把人类知识传播开来和继承下去,人们用文字、图形、符号、声频、视频等手段将其记录下来,或写在纸上,或晒在蓝图上,或摄制在感光片上,或录到唱片上,或存贮在磁盘上。

这种附着在各种载体上的记录统称为文献。

”另一个定义更为概括,“文献,记录有知识的一切载体。

”这两个定义大体上能概括文献的特征,但“一切载体”比较笼统,有的载体是固态的、可见的,有的载体是动态的、不可见的,如声波、光波、电磁波。

信息通道的概念被提出来后,载体就可以分为存储型和传播型。

文献应属于存贮型的固态的载体,而不是同样可承载和传递信息的图文电话、语音信箱、电子邮件、网络等。

所以应该把文献理解为“记录有人类精神信息的、且便于存贮或传递的人工固态附载物”。

这里,强调的是那些在载体形式上便于保存和传递的纸质和非纸质的固态载体,而非瞬时信息的附载物或其它实物(文物、设备等,在功能上可存贮、积累、反复利用和传递,这二点限定可以帮助我们把文献置于实用的、可操作的范围内,否则,过份扩大它的概念外延只能给文献工作带来困难。

(2)文献的构成

  现代文献由四要素构成:

文献信息、文献载体、符号系统和记录方式。

文献信息是文献的内容,符号系统是信息的携带者,载体是符号赖以依附的“寄主”,而记录方式则是代表文献的符号进入载体的方法和过程,四要素缺乏任何一种都不可能形成文献。

A)文献信息

  文献信息属于信息,当然具有信息的一切性质和功能,但文献信息也有自身的特点。

文献信息特点

  文献信息属于信息,当然具有信息的一切性质和功能,但文献信息也有自身的特

点。

表现为:

   第一文献信息是经人的一系列加工(筛选、归纳、整理)后记录下来的信息(RecordedInformation),不是指文献符号系统本身的信息,也不是指文献载体本身的信息;

   第二文献所表达的信息内容虽然与符号本身没有必然联系,但文献信息的传递是通过人工符号系统——文字、标识符、声像信号来实现的,因而对文献信息的摄取方式和吸收的程度必然受到这种人工符号的制约;

   第三文献信息是一种相对固化的信息,如纸质印刷品所传递的信息是无法变动的。

可擦写光盘和磁盘虽然可以用修改、删除、增入等手段更新数据,一旦变动后又处于静态之中,文献信息的固态化是文献易老化的原因,它不能随外界的变化而变化。

为了克服由此造成的弊端,需要不断更新文献。

B)文献的符号系统

文献中的符号系统指图画、文字、公式、图表、编码,声像和电磁信息等。

  文献中的符号系统指图画、文字、公式、图表、编码、声像和电磁信息等。

   图画是最早的文献信息符号,在文字出现以前,人类就用图画来表达精神信息,图画的独到之处在于较强的直观性,读画人(信宿)无需接受文字训练就可与作画人(信源)沟通。

此外,图画让人们保持注意力和记忆力的作用比文字更大,因此以图代文,让人们在最短时间内有效地获取最大容量的信息成为今天一切宣传媒介设计所注重的方式。

  

文字,是有声语言信息的书面表达形式,由图画演变而来的。

图画对于表达抽象思维信息的无能为力可由文字来弥补。

文字用一套书写符号来记录、表达语言要素(词、词素、音节、音素等)。

但文字的特点——高度概括性、使用的随意性、音义的双重性也往往导致只可意会、无法言传的模糊语言,导致词不达意、一音多义、一语多音的现象,给信息交流造成误解。

这说明人工符号永远只能接近表述信息的原意。

   声像信息指留在唱片、录音带上的声频信息和摄在胶卷、录像带上的视频信号。

电磁信息符号是指计算机可读磁盘或光盘上的信息符号,由二进制的0和1构成,这些信息符号不是我们感官直接提取的,必须通过计算机解读。

C)文献的记录方式:

是指将表达信息的符号系统通过特定的人工记录方式使其附着于一定的文献载体上。

记录方式种类很多,职能各异,按记录手段分有写画、雕刻、印刷、摄制、录音;按记录方法分可有手工记录、机械记录、光记录、电记录、声记录和磁记录。

其中

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 经管营销 > 经济市场

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1