ImageVerifierCode 换一换
格式:DOC , 页数:5 ,大小:74KB ,
资源ID:1404888      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/1404888.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(信息组织期末复习资料.doc)为本站会员(b****2)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

信息组织期末复习资料.doc

1、信息检索需求的多样化(1)文献检索:是以文献为检索对象的信息检索。它为用户提供的是与用户的信息需求相关的文献信息,它的目的是相关文献的出处和收藏处所。文献检索的结果是提供与课题相关的数篇文献的线索或原文,供用户参考.(2)数据检索:是以数值和图表形式表示的数据为检索对象的信息检索。数据检索是一种确定性检索.(3)事实检索:是以从文献中抽取的事项为检索内容的信息检索。信息标引:就是对信息内容进行分析并充分而有效地予以揭示。揭示信息的内容是检索信息、利用信息的前提条件。从学科属性揭示信息内容就是分类标引,从主题特征揭示信息内容就是主题标引。准确标引信息要求准确的内容分析,否则就会出现错误标引。信息

2、系统组织:信息通过特征描述和内容揭示,获得了表示信息的标识,但这只是针对某一文献和信息单元的,把这些信息有序地组织起来才完成了信息组织的过程,这个过程就是信息系统组织。信息系统组织是把描述和标引的信息实体和信息记录组织成一个有序的系统。一、信息组织方法:(一)按组织对象分:文献实体组织与信息内容组织(二)按信息组织的层次分:语法信息组织、语义信息组织与语用信息组织(三)常用信息组织方法:1.分类组织法 2.主题组织法 3.集成组织法 三、信息组织手段 1、人工组织 2、自动组织1、分类检索语言:分类检索语言习惯简称分类语言或分类法,分类检索语言语族主要有三个语支,即(1)等级体系分类语言 (2

3、)分析综合分类语言 (3)半分析综合分类语言。2、主题检索语言 (1)标引词语言(2)单元词语言 (3)叙词语言检索语言词汇控制的意义:检索语言构成材料就是词汇,把词汇按某种方式组织起来构成检索语言词典,它是标引和检索的工具。检索语言的词汇控制又称规范化处理。由于表述信息内容的词汇非常庞杂,日常的自然语言词汇并非都能准确表达信息的学科和主题内容。自然语言缺点(1)词汇的同义现象。(2)词汇的多义现象。(3)词汇语义不清或语义不确定。(4)词量庞大(5)词间关系不明晰在现行的一些检索系统中,也比较广泛地直接采用自然语言检索,它虽然节省了词汇控制的成本,但却是以牺牲检索效率为代价的。因此,完全采用

4、自然语言进行信息组织的系统并不是理想的检索系统。即便是面对互联网急剧增长的信息资源,人们也越来越感到需要进行规范化控制。由此有了规范化检索语言在网络信息组织中的应用研究,有了网络本体语言的开发。网络信息组织从自由走向规范足以说明词汇控制的意义。检索语言词汇控制的内容:词汇控制的目的是为了使检索词符合唯一性、规律性、定型性、通用性和准确性。为了达到这个目标,应该从以下几方面进行词汇控制。(1)词量控制。词量控制是指对收入词表的词汇进行压缩、精选,使之与所要标引的信息数量和检索要求相适应。(2)词类控制。自然语言词汇有多种类别,如名词、动词、形容词、副词、介词、叹词,还有大量的词组。(3)词形控制

5、。词汇也存在不同的书面表达方式,如不同的次序、简繁体、单复数、不同拼写法,以及标点符号、字符、数字等,为了实现每个词词义和词性的唯一性,必须进行词形控制。(4)词义控制。检索语言中的每个词汇都只表示一个概念,即使检索语言词汇一般都比较精炼和简短,也会出现一词多义和同形异义现象。因此,必要时在主题词或类目词后加限定词,加含义及范围注释,或附加简明定义等。(5)词间关系控制。在情报检索语言词典编制中,对词汇语义和词间关系必须控制,这是为了词典中每个词汇都有独立的语义,词间关系能形成一个语义网。(6)专指度控制。检索语言词汇的专指度是指其语义的内涵与外延与信息主题内容的切合程度。信息检索系统由六个子

6、系统构成:(1)信息选择子系统 (2)标引子系统 (3)词表子系统 (4)检索子系统 (5)用户与系统之间的交互子系统 (6)匹配子系统 即对信息标引与提问标引进行匹配的子系统。从系统构成分析可见,检索语言和标引是系统的中心环节,它起着承上启下,连接用户与系统的关键作用。 概念之间的关系(一)属种关系:它是指一个概念的外延包含另一概念的全部外延,其中,外延大的概念叫属概念,外延小的概念叫种概念。(二)同一关系:它是指两概念在外延上完全重合。(三)交叉关系:即两种概念之间有且只有一部分外延是重合的。概念逻辑方法(一) 概念的限定与概括概念的限定是指通过增加概念的内涵以缩小概念的外延,即由属概念过

7、渡到种概念的逻辑方法。对一概念进行限定,从语言上说一般是增加限制词,如定语、状语等,例如,给“人”加上“大”就成为“大人”,增加的限制词应是恰当的,不能与原概念矛盾或重复。概念的概括是与概念的限定相反的一种逻辑方法,它是通过减少概念的内涵从而扩大其外延,由外延较小的种概念过渡到属概念。如把“先进工人”抽去“先进的”这一内涵就变成“工人”,再减去“从事工业生产的”这一内涵就变成“人”,这就是一个概括的过程。概括的方法可以使我们的认识上升到一定高度,加深对事物本质的了解。(二) 概念的划分概念的划分就是以事物的某种属性为分类标准,将一个属概念的外延分成若干个种概念的方法。事物有各种各样的属性,根据

8、不同的属性就可做不同的划分。如按图书的文字可以把“图书”分为“中文图书”和“外文图书”,按图书的学科类别又可以划分成“自然科学图书”、“社会科学图书”等,按图书的装订形式还可以划分成“平装图书”、“精装图书”,等等。概念的划分的基本规则是:划分得到的子项的外延之和应当等于母项的外延,划分得到的各子项的外延必须互相排斥,每次划分应当使用同一标准进行,划分必须是按层次逐级进行。分类检索的类型分类检索的基本形式有三种,即浏览式检索、直接检索、浏览与直接相结合的检索1、 浏览检索:就是按照信息系统的分类体系,以线性的方式沿着某一个起点,一层一层地在逐级查找,也就是知识树或知识地图浏览方式。2、 直接检

9、索:当信息被组织在数据库中后,某些对系统比较熟悉的用户,对需求明确的信息可以进行直接检索,即在系统中直接输入分类号、类名、关键词进行检索。这种形式的检索往往还要借助于该系统所使用的分类法。3、 浏览与直接相结合的检索:这种检索方式是电子分类法和网络信息分类系统特有的功能,就是在进行浏览式检索过程、在一个特定类目的限定下输入要检索信息的某些特征语词,以便迅速将该类信息定位;或者先输入信息的某个特征,初步判断、确定它的类属,在此基础进行浏览检索。分类法的宏观结构一般包括(1)编制说明 (2)基本类目表 (3)分类法主表 (4)辅助分类体系(5)分类法附表(6)分类法索引 (7)分类法使用手册与附录

10、分类法的微观结构一般包括(1)分类号(2)类名 (3)类级 (4)类目注释和参照 分类法编制的基本程序(一)分类法的功能分析与定位 (二)系统用户需求 (三)分类体系设计(四)分类标记设计 (五)分类法结构设计 (六)分类法主表设计 (七)分类法辅助分类体系设计(八)分类法辅助表设计 (九)分类法索引设计 (十)试标引与修订 按标记制度划分的分类标记1.层累标记制 2.顺序标记制 3.混合标记制 4.分面标记制 5.回归标记制 6.起讫标记制扩展同级类编号法 编号的方法是:某类的子类较多,本身的号码不敷使用,就借用相邻空余的同位类号,并将其扩展成与该子类相匹配的同级号码,为剩余的子类配号。此种

11、扩号法的特点是使同位类都有相同长度的号码。 子顺扩号法当某类下同位类很多,但无须再进一步划分,且同位类有不可预见性时,可使用类名的首字母进行扩号,即类号+字母。例如:M675 法国文学作品:按作家分M675B 巴尔扎克作品M675D 狄更新作品M675M 莫泊桑作品主题法的含义所谓主题法,一般是指直接以表示文献主题的语词作标识,提供字顺检索途径,并主要采用参照系统揭示词间关系的标引和检索文献的方法。它是分类法之外,另一种从内容角度标引和检索文献的主要方法。从检索语言的角度来说,主题法也就是主题检索语言,或称主题语言,它是用自然语言语词或受控的自然语言语词直接表达主题概念,按语词字顺排列主题概念

12、,主要用参照系统显示概念之间关系的检索语言。按照表达主题概念的语词标识的构成原理和特征的不同,主题法一般分为标题法、单元词法、叙词法、关键词法。关键词法:是直接以文献中能够表达主题概念的关键词作标识的一种准主题法。或者说,关键词法是由计算机或人工从文献中抽取关键词作标识,并按字顺排列,提供主题检索途径的方法。所谓关键词,是出现在文献题名、文摘、正文中,能够表达文献主题,具有文献意义的语词。关键词法作为主题法的一种,与标题法、叙词法相比,具有两个主要特点:(1)关键词是自然语言的语词,一般不作规范化处理;(2)一般不编制受控词表进行词汇控制,不显示词间关系,只是编制禁用词表来控制抽词。概念组配是

13、叙词法的基本原理 在叙词语言采用的多种原理方法中,概念组配是最基本的原理,它是决定叙词法特点和性能的根本因素。1、 概念组配与字面组配的区别叙词法采用的是概念组配,而不是字面组配。(1).概念组配与字面组配对词汇单位的要求不同。 概念组配要求以表达基本概念的语词为标识,用于概念组配的语词既可以是单词,也可以是词组。字面组配只要求参与组配的词与组配构成的词在字面形式上的一致强调参与组配语词的单元性,因此,要求采用最小的词汇单位单词,而不用词组。(2).概念组配与字面组配的本质不同。 概念组配本质上是在概念分析的基础上进行概念综合,是符合概念逻辑的组配。概念组配所表达的概念与参与组配的各方面所表达

14、的概念在逻辑上是有联系的,往往表现为下位概念与上位概念的关系。字面组配是利用构词法进行词的分拆和组合,它符合构词规律,但是不一定符合概念逻辑。2、叙词的概念组配类型(1)交叉组配 交叉组配是指使用两个或多个具有交叉关系的叙词进行组配。(2)方面组配 方面组配,又称限定组配,是指将表示某一事物的叙词与表示事物方面的叙词进行组配。(3)特称组配 特称组配,是指用一个表示事物类称的属概念叙词与表达“种差”的叙词进行组配。字顺表的微观结构1、 叙词款目和非正式叙词款目的著录项目 2.叙词款目和非正式叙词款目的著录格式 3.款目词的排列词汇转换模式:1、单向转换 2、互逆转换 3、多向转换 4、中介转换信息主题类型1.依据主题结构区分(1)单因素主题 (2)多因素主题 (多因素主题又细分为复合主题与联结主题)2.依据主题与检索系统专业性质相关程度区分(1)专业主题 (2)相关主题 (3)非专业主题 3.依据主题概括的文献内容范围区分(1)整体主题 (2)局部主题4.根据主题在文献中的重要程度区分(1)主要主题(2)次要主题5.依据主题在文献中呈现的清晰程度区分(1)显性主题 (2)隐性主题

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1