信息组织.docx

上传人:b****5 文档编号:10170678 上传时间:2023-02-09 格式:DOCX 页数:15 大小:27.28KB
下载 相关 举报
信息组织.docx_第1页
第1页 / 共15页
信息组织.docx_第2页
第2页 / 共15页
信息组织.docx_第3页
第3页 / 共15页
信息组织.docx_第4页
第4页 / 共15页
信息组织.docx_第5页
第5页 / 共15页
点击查看更多>>
下载资源
资源描述

信息组织.docx

《信息组织.docx》由会员分享,可在线阅读,更多相关《信息组织.docx(15页珍藏版)》请在冰豆网上搜索。

信息组织.docx

信息组织

第一章

信息组织的定义

信息组织,亦成称信息资源组织,是根据使用的需要,以文本及各种类型的信息资源为对象,通过对其内容进行分析、选择、处理、叙化,并以适当的形式加以提供的活动。

信息资源的概念

信息资源是指一切以记录形式存在的信息载体。

与“文献”含义接近。

信息组织和揭示的层次

信息组织和揭示的层次:

存在单位,个体,信息成分。

根据使用的需要确定。

就其组织和揭示的层次而言,直接以信息资源的存在形式为处理对象,例如直接以图书、期刊、网站等为处理单元。

也可以期刊、报刊、网站中的个体,如论文、新闻、网站中的构成部门为处理单位。

还可以选择其中的信息成分作为处理的单元。

(数据库)

信息组织和信息检索的关系

信息组织是信息检索的基础和前提,信息检索是信息组织的出发点和归宿。

信息组织的形式

信息组织的形式,信息资源,文献记录。

对信息资源进行组织,是指按照一定的方式将信息资源本身直接纳入信息资源集合。

文献组织的排列方式

文献组织的两种基本排列方式,固定排列法,按一定意义的次序排列。

检索工具的类型

按照检索工具的对象和特点,检索工具分为文献目录,索引,机读数据库,网络搜索引擎。

文献目录,以各种媒体的文献单元为对象,包括文献收藏目录和书目。

索引以文献集合中的文献单元或文献中的信息单元为揭示对象的检索工具。

按照数据的特点,机读数据库可以分为参考数据库和源数据库。

按照依据的标识特征,检索工具可以分为,以信息资源的外部特征为依据,以信息资源的内容特征为依据。

(以表达信息资源主题内容的表示为依据,提供从内容角度进行检索的途径。

包括主题法和分类法。

责任名、题名、机构名、出版社、标准书号、专利号、档案号、文献登录号为外部特征。

关键词、摘要、分类号为内容特征。

根据系统中所用的标识是否进行控制,检索工具可以分为受控检索系统和自然语言检索系统。

受控检索是指依据指定的受控词表建立的检索系统。

例,各种依据分类法和主题词表等建立的检索系统。

自然语言检索系统是指直接使用信息资源中自然语言的语词进行组织和检索的方法。

受控检索系统

自然语言检索系统

优点

保证检索与标引的一致性,提高查全率和查检率,灵活。

词汇更新及时

缺点

词表篇幅大,修订维护不方便。

落后于其他学科的发展

词汇不统一,查全率和查检率不高

按照系统中标识组配的特点,检索系统可以分为先组式和后组式。

先组式检索工具是指检索前复杂主题的标识在系统中就已经按一定方式组配好了的一类检索系统。

后组式检索工具是指检索前复杂主题的标识在检索系统中是以基本概念的形式独立存在的,实施检索时,才根据提问进行组合。

先组式

后组式

优点

容易使用,比较直观

灵活性强

缺点

手工检索系统中,必须从第一个词入手查找,计算机检索系统中灵活性弱

以基本概念的形式存放,不适合对文献进行系统浏览

检索语言的定义

检索语言是一种由表达信息资源主题概念及其相关关系的词汇及规则组成的人工语言系统,亦称为情报检索语言。

检索语言有词汇和语法组成。

第五章

信息资源分类的定义

信息资源分类,是指根据信息资源的内容属性和其他特征,将各种类型的资源分门别类地、系统地组织和揭示的方法。

信息资源的分类是一种从主题内容角度系统组织和揭示信息资源的方法,是分类方法在信息资源组织中的应用。

信息资源分类的特征

按照内容特征的相互关系进行组织。

从一定角度出发组织和揭示信息资源。

采用一定的标记符号作为排序工具。

通过类目索引提供从字顺角度查找类目的途径。

信息资源分类的作用

进行资源组织。

建立分类检索工具。

分类统计。

兼容工具。

信息资源分类法的编制方式

等级列举式

分面组配式

列举-组配式

定义

将所有的类目组织成一个等级系统,且采用尽量列举的方式编制的分类法。

也叫列举式分类法、枚举式分类法。

依据分析兼综合的原则编制的分类法

在详尽类表的基础上,广泛采用各种组配方式的分类法,也称半分面分类法

特点

分类结构显示直观,易于把握,便于使用。

类目设置比较均衡。

标记简明,适于分类排架

标引专指。

标记表达性强。

对科学发展的适应强。

篇幅小,便于管理、增补、修订

直观,缩小篇幅

不足

不能充分揭示资源中的大量存在的细小专深主题

直观性不强,类目分布不均衡,标引难度高,成分复杂,号码冗长

标记复杂、冗长

应用

美国《杜威十进分类法》

《美国国会图书馆图书分类法》

《中国图书馆分类法》

《冒泡分类法》

《布立斯数目分类法》

《国际十进分类法》

《图书馆书目分类法》

分类法的组成

分类法的组成分为类目体系、标记符号、说明与注释、类目索引。

类目体系的组成

按照其展开特点,通常是在基本部类的基础上,由基本大类、简表、详表、复分表组成。

基本大类、简表、详表构成类目表的主表。

复分表,又称附表,是一种结合主表使用需要编制的辅助表。

我国文献分类法的基本部类,应用。

我国文献分类法的基本部类,将知识门类分为哲学、社会科学、自然科学、马列主义和毛泽东思想、综合性图书五个部类。

国内当前使用比较广泛的文献分类法,如《中图法》、《科图法》。

基本大类应做好类目设置、序列两个方面。

类目设置应划分均衡、数量合理。

基本大类的数量保持在20个左右。

大类的数量一般保持在14~20个之间。

在大类的排列次序上,文献分类法一般均重视对各个部门之间关系的揭示。

大多重视对大类之间联系的揭示,一般将内容相关的门类集中设置。

我国文献分类法大类的序列,除将马列主义、毛泽东思想设为第一大类外,在大类的排列中一般都注意贯穿从总到分的原则,根据对类目关系的理解确定次序。

复分表的定义,作用,类型

由共性子目构成,供主表有关类目共同使用的表,称为复分表,亦称为副表、辅助表、共性区分表。

复分表是分面组配的一种基本使用形式。

作用为,缩小类表的篇幅,加强类表的伸缩性,增强类表的规律性。

复分表按其适用范围,可分为通用复分表、专类复分表和仿分。

通用复分表,又称共同区分表,是一种供主表各大类有关类目共同使用的表,通常在类表的前部或后部集中编列。

常用的复分表有:

标准复分表,地区复分表,时代复分表。

专类复分表,是一种只限于在某一基本大类或专门领域使用的复分表,一般设置于相应大类之下。

仿分是一种以统一的方法处理共性子目的方法。

利用某一类的子目作为进一步区分依据的类目处理方法即称为仿分。

标记符号的概念(理解),作用

标记符号,亦称分类号,是分类法中用以标识类目的代号。

标记符号具有固定类目次序,显示类目之间关系的作用。

分类号(标记符号)的要求

简明性,表达性,容纳性,助记性

号码的种类,与其对应的优缺点

按号码组成成分,分类标记通常可以分为单纯号码、混合号码两种。

单纯号码

数字号码

字母号码

优点

缺点

基数小,易于排检

基数大,排检不迅捷

使用不普遍

编号制度类型及其应用。

分类标记一般分为顺序标记制、层累标记制、顺序-层累标记制、分面标记制。

顺序标记制

层累标记制

顺序层累标记制

分面标记制

定义

按照类目在分类体系中的次序,顺序配以号码,号码只表示类目的次序。

按照类目划分的等级配置相应位数号码,号码不仅可以反映类目次序,并可以根据标记的位数判断类目的等级

采用顺序制和层累制的标记方式

以特定的符号或组配方式表示各个主题因素所展的分面,使能够揭示类目的次序和等级,显示类目的分面结构

优点

根据类目数量均衡地分配号码,标记简短,容纳性强,适合文献排架

可以揭示类目的等级结构,能够在机检系统中通过标记逐级显示分类体系

具有较强简明性和容纳性,保留一定的表达性

表达性和可组配性,能够充分揭示文献主题,可以进行轮排和组配检索

缺点

不能揭示类目体系的结构,无法在机检系统中通过标记按等级显示机读文档

类目划分等级够深,造成号码过长;同位类数量较多,超过号码的基数,就无法严格按等级编号

号码成分复杂,标记冗长,排序性能差,不适合组织文献排架

应用

美国《国会法》

《中图法》

《科图法》

《冒号分类法》

标记技术

标记技术包括八分法,双位制,借号法,预留空号法,对应编号法,字母标记法。

类目索引的定义

类目索引,亦称分类表索引,是一种按照主题字顺方法,从主题名称指向分类号,帮助分类人员利用类目表的工具。

类目索引根据其不同的特点,分类及应用

类目索引根据其不同的特点,可以分为直接索引、相关索引、主题词索引。

《中国人民大学图书馆图书分类法》(人大法)的索引属于直接索引。

分面分类表的索引属于直接索引

《中图法》的索引条目《杜威法》的索引中的条目属于相关索引。

我国《中图法》(四版)索引采用了轮排索引。

类目划分的定义、分类标准、应遵守的分类规则

类目的依据,是指依据一定的属性或特征对类目的外延进行区分,生成一组子目的过程。

建立分类体系时用以区分事物的属性,一般必须是信息资源的本质属性或显著特征。

逻辑划分规则:

每次划分只使用一个标准。

划分应该穷尽被划分类的外延。

划分后各子类相互排斥。

引用次序的定义、作用

引用次序,是指复合主题在标引与检索中不同主题因素的组配次序。

引用次序决定类目体系中复合主题的集中方式。

同位类的定义、常用同位类序列方法(同位类不等于同级类。

从同一个上位类区分出来的一组处于同等地位的子类,称为同位类。

常用同位类序列方法:

按时间先后顺序、事物进化顺序、空间次序、逻辑次序、依存次序、惯用的次序、实用顺序、字顺次序排列。

类目之间的关系有几种?

形式是什么?

类目之间的关系有四种,表现为从属关系,并列关系,交替关系,相关关系。

通过连续划分形成的一系列具有从属关系的类目,称为类系。

从属关系的类目包括属种、整部、方面等三种基本类型。

特点:

上位类必然能包括下位类的外延;下位类必然具有上位类的属性。

同位类是指由同一个上位类区分出来的、处于同等地位的一组类目。

类目体系中处于同一个等级的类目,称为同级类。

同级类不一定属于同一上位类,类目之间往往并没有同位类所具有的那种联系。

交替关系指交替类目与相应使用类目之间形成的关系。

相关关系是指类目之间除从属、并列、交替等方式以外的其他联系。

从属关系

并列关系

交替关系

相关关系

表现形式

连续划分

同位类

交替类目

类目参照

类目之间的关系

纵向联系

纵向联系

横向联系

横向联系

类目体系展开的特点

类目体系展开的特点:

重视按事物对象设类、多元划分、多维展开、横向关系揭示、采用类目设置与显示的新形式。

第七章

分类标引的定义

分类标引,又称为归类,是指依据一定的分类语言,对信息资源的内容特征进行分析、判断、选择,赋予分类标识的过程。

标引工作程序

标引工作程序:

查重、主题分析、归类、给号、审核

主要类目、附加类目、分析类目的定义

按照文献主要内容对象确定的类目,称为主要类目;

按照次要内容对象确定的类目,称为附加类目。

按照信息资源中部分内容进行的分类,称为分析类目。

主要分类号、附加分类号和分析类目号的定义

按照文献主要类目确定的号码,称为主要分类号。

按照文献的辅助类目和分析类目确定的号码,称为附加分类号和分析分类号。

附加分类号和分析分类号只用于编制工具。

使用本、确定使用本的定义

使用本,是指特定的文献标引结构直接作为分类依据的分类法文本。

根据分类标引的需要,对选定的通用性文献分类法进行适当调整,称为确定使用本。

确定使用本的范围

确定详略程度。

以专业机构为例,一般情况下,重点收藏的,直接使用详表;非重点收藏的,可略分。

局部扩充。

常用方法:

直接将类目注释中列举的小主题扩充为类目,从其他分类法相应门类移植,扩大副表的使用范围,归类增补。

局部集中。

包括:

确定交替类目,确定选择类目,按专题集中。

增加新类。

调整说明与注释。

基本分类规则包含的内容

信息资源的分类应根据信息资源的性质,按照其各自的特点进行。

信息资源的分类必须能体现分类法的逻辑性、等级性、次第性。

信息资源必须归入最切其内容的类。

类分的文献必须归入用途最大的类。

不能单凭题名、篇名的意义归类。

应注意标引的思想性。

一般分类规则

包括单主题信息资源的分类标引和多主题信息资源的分类标引

单主题信息资源是论述其一特色事物对象的资源。

根据论述的特点,可以分为简单单主题和方面单主题等类型。

单主题信息资源的分类标引

简单单主题信息资源,一般应按照主题对象的学科性质归类。

方面单主题信息资源,应根据其叙述的方面以及各个方面之间关系归类。

论述-主题两个或两个以上方面的信息资源,应根据不同方面之间的关系,确定其归属。

多主题信息资源的分类标引

并列主题的分类

论及两个并列关系主题的资源,如果同属于一个类列,具有共同的直接上位类,通常可直接归入上位类,否则,可按重点在前主题归类,同时为另一个主题作附加分类。

对同时涉及三个或三个以上并列主题的文献,一般根据涉及的范围,将其归入共同的上位或概括性类目。

从属关系主题的分类

联结关系主题的分类

应用关系主体的信息资源,一般应按被应用到的主题分类。

但综合阐述一理论方法在各方面应用的文献,应按该理论方法所在的学科归类。

比较关系主题的信息资源,一般应按资源作者重点论述的内容归类。

影响及因果关系的信息资源,一般应按被影响或表示结果的主题对象归类。

分类索书号的概念、构成

分类索书号使标记实现个别化。

表示同类书先后次序的号码称为同类书区分号,亦称书次号。

同类书区分号应取号简易,号码简短,适合文献工作中实际使用的需要。

分类索书号,又称分类排架号,是表示一文献在分类收藏中位置的号码。

完整的分类索引号包括分类号、书次号、辅助区分号三种成分。

分类索书号的记录形式通常可分为三行或两行书写,例:

分类号分类号

书次号或书次号/辅助区分号

辅助区分号

第八章

主题法的定义、特征

主题法,一般是指直接以表达主题内容的语词作检索标识,以字顺为主要检索途径的标引和检索信息资源的方法。

特征:

直接以语词作为检索标识。

以字顺作为主要检索途径。

以特定的事物、问题、现象,即主题为中心集中信息资源。

通过参照系统等方式揭示主题词之间关系的。

主题法的分法、按照不同的选词方式

按照主题法的选词方式,分为标题法、元词法、叙词法、关键词法。

按照其使用是否进行控制,可以分为受控主题法与非控主题法;

按照其使用时组配的先后,可以分为先组式主题法和后组式主题法。

按照选择的词汇

标题法

叙词法

关键词法

表现形式

标题词

概念组配方式

少量控制,轮排

代表性

《美国国会图书馆标题表》LCSH

《汉语主题表》

简称《汉表》

按照是否控制

受控的主题法

受控的主题法

非控主题法

按照组配先后

先组式主题法

后组或散组式主题法

后组式主题法

收入的词汇

标题词词和词组

叙词词和词组

词和词组

特点

形式直观,含义明确,操作简便,主要通过参照方式对词汇进行控制。

词汇控制严格,标引能力强,多途径检索,同时适用于标识单位和文献单位等不同形式

可以直接使用计算机标引或处理,速度快,成本低,词汇更新及时,专指性优于标题语言和叙词语言

不足

词量巨大、专指度相对不足、修订量大。

影响检索效果。

广泛吸收各种检索语言,发展了多种形式的索引,包括范畴索引、词族索引、轮排索引,直至编制各种类型的分类主题一体化词表。

检索质量不稳定,容易受文本表达质量的影响,缺乏词汇控制。

列举式词表

定组式标题

介词、连词、冠词、助词不能用作关键词。

标题法是一种以标题词作为主题标识,以词表预先确定的组配方式标引和检索的主题法。

字顺显示的组成。

标题词,亦称标题,是指经过词汇控制,用来标引信息资源的词或词组,通常为比较定型的事物名称。

叙词表,是以自然语言中精选出来的、经过严格处理的语词作为文献主题标识,通过概念组配方式表达文献主题的主题法类型。

叙词,亦称主题词,是经过规范处理的,以基本概念为基础的表达文献主题的词和词组。

关键词法,直接以自然语言中未经控制或只作少量的语词为文献主题标识,通过对关键词轮排等方式揭示文献主题的主题法。

叙词表的显示方式、定义

叙词表的显示方式为字顺显示,系统显示,图形显示三种类型。

按照其功能,叙词表是一种将标引人员或用户使用的自然语言转化为规范化的系统语言的术语控制工具。

按照其结构,叙词表是一种概况特定知识领域并有词义相关、语义相关的术语组成的可以不断补充的规范化词典。

字顺显示的组成

字顺显示的组成是字顺表、专有叙词表、双语种索引

按照传统词表组成,字顺表、附表、辅助索引

字顺表的定义、组成、基本的构成单位

字顺表是一种由众多叙词款目和非叙词款目按字顺排列的一览表。

叙词款目和非叙词款目是字顺表基本的构成单位,通常由款目词及其相关语义关系项构成的独立排检单位。

叙词款目或非叙词款目一般由款目词项、注释项、语义关系项组成。

款目词是叙词款目和非叙词款目的核心和排检依据。

相关成分根据词表的情况而定,如上例《汉表》款目项中,还包括汉语拼音和对应的外语译名。

语义关系项由各有关的参照项组成,依次设置代D、属S、分F、族Z、参C等各项参照。

非叙词只设用Y项,用于指向相应的叙词。

字顺索引仅收入叙词、非叙词。

入口词表是一种将非叙词集中编制的表,收入词表编制或标引中出现的按等同关系处理的非叙词。

专有叙词表,称附表,是将众多专有叙词款目按字顺排列的一览表,是字顺表的重要组成部分。

专有叙词表的作用,缩小主表的篇幅,便于用户从范畴出发对专有叙词进行查检,及时进行管理。

专有叙词表包括人名、地名、机构、产品型号名等,数量大,范围广。

双语种索引,是一种将全部叙词、非叙词与相应外语译名相互对应,按外文译名字顺排列的索引系统,是通过外文译名使用词表的辅助工具。

《汉语主题词表》包括,主表、附表、范畴索引、词族索引、英汉对照索引、轮排索引。

《中国分类主题词表》包括,分类号-主题词对应表,主题词-分类号对应词表

《社会科学索引词表》包括,分类表,字顺表,英汉译文对照表。

系统显示的概念、作用、编制特点

系统显示,是一种通过改变编排方式,满足标引人员和用户各种不同角度使用叙词的辅助工具。

系统显示,包括,范畴索引、词组索引、轮排索引、分类主题一体化次词表。

词族索引通常以词族为基本款目单位,多数以族首词为款目的标目,按族首词字顺对词族进行排序。

词族的显示,以族首词为标目,按照词族中的等级展开。

叙词上部的词为上位词,冒号越多,词的外延越广。

款目词下的词为下位词,记号越多,范围越小。

范畴索引

词组索引

定义

亦称分类索引,范畴表,是一种按照词汇所属学科或专业范畴编制的概略分类系统,是从分类角度查找叙词的辅助工具。

词族的定义

词族是指一组具有属分关系的叙词集合。

类目设置

以学科分类为基础,结合专业分类和词汇分类的特点进行

族首词的选择

外延较宽,具有实际检索意义的叙词

标记符号

多数采用单纯数字号码,少数使用字母与数字结合的混合号码

词族规模

不作限制,对等级关系进行完整显示。

规模过大,分设为几个词族,总词族和分词族分别排列。

标记制度

层累制

收入词表

全部叙词和非叙词

收入词表

按属分关系处理的叙词

作用

提供查词途径,从分类角度查找叙词。

作为概略分类的依据。

编表选词、处理词间关系。

作用

从词族出发。

上位登录。

限定词义。

轮排索引

轮排索引,亦称轮排表,是将词表中叙词按词素的字顺排列,使含有同一词素的叙词集中显示于一处的词汇表,是一种从词素的角度查找叙词的辅助工具。

收词范围,一种,只收词表中词表形式的叙词和非叙词,另一种,同时收入表中全部叙词和非叙词,包括单词、词组。

按照构成的词素,确定轮排条目数量。

显示方式,词外轮排,词内轮排,倒置轮排。

中文轮排检索分为顺序排序和逆序排列。

分类主题一体化词表,是一种分类语言和主题语言兼容互换的系统。

图形显示的分类

图形显示分为三类,树形结构图,箭头关系图,方框图。

叙词表的组成模式

一部具体的词表没有必要包括所有部分,根据实用需要确定其构成形式。

一部功能完善的叙词表至少包括字顺显示部分、系统显示部分。

一个好的词表力求,功能完备,功能互补,结构简明,编制和管理方便,易于掌握、便于使用。

叙词词汇类型

叙词表选词以名词为主,必要时收入少量形容词。

YDSFZC

叙词可分为普通名词和专有名词两种。

词表关系控制(三种关系、六种符号)

叙词表中叙词之间主要有,等同关系,属分关系,相关关系。

等同关系,Y用于非叙词之下,用来指应对应的叙词。

D用于正式叙词之下,用来指向被替代的非叙词。

等级关系,F为分项指示符,表示该项叙词为款目词的下位词。

S为属项指示符,表示该项叙词为款目词的上位词,Z为族首词符号,表示该项叙词为族首词。

相关关系通用符号C加以连接。

第十章

主题标引的概念

主题标引是依据一定的主题词表或主题标引规则,赋予信息资源语词标识的过程。

标引方式

标引方式分为整体标引,全面标引,对口标引,综合标引。

根据文献资源使用需要判断。

整体标引是,一种概况揭示信息资源基本主题内容的标引,亦称浅标引。

应用于书籍、论文、标准、档案或其他资源类型,常用于手工检索系统。

全面标引,是一种充分揭示信息资源论及的所有符合检索系统要求的主题概念的标引,亦称深标引。

适用于处理专业领域的论文、技术报告等文献类型。

不宜以图书为处理对象,较少使用分类标引。

对口标引,是一种只揭示资源中适合本专业需要的主题内容的标引,亦称重点标引,适用于专业文献单位。

综合标引是一种以集合型信息资源的整体为单位进行的概括性标引。

应用于传统的文献类型,如丛书、多卷书、论文集、会议录、标准汇编、档案的案卷等,或复合型的网站或数据库。

分析标引是一种根据资源中部分片段或集合型的构成单位进行的标引。

《中图法》~~文献分类法、等级列举式、层累标记制、相关索引

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工作范文 > 行政公文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1