《信息组织》知识点汇总.docx
《《信息组织》知识点汇总.docx》由会员分享,可在线阅读,更多相关《《信息组织》知识点汇总.docx(38页珍藏版)》请在冰豆网上搜索。
《信息组织》知识点汇总
《信息组织》知识点汇总
第一章第一节、信息组织的必要性
1.信息组织:
根据信息检索的需要,以文本及各种类型的信息资源为对象,通过对其内容特征等的分析、选择、标引、处理,使其有序化并以适当方式加以提供的活动。
2.信息组织的目的:
是根据使用需要建立起信息资源收藏系统和检索工具,以便信息资源开发和利用。
作为一种为了检索利用的需要对信息资源进行有序化组织的活动,它是与信息检索活动密切联系的。
3.信息检索:
根据检索需要,从检索系统中检出相应信息资源的过程。
3.信息资源:
通常指一切以记录形式存在的信息载体,只是比较而言,更侧重于对新型媒体形式的强调。
(可以是图书、期刊、报纸、论文,也可以是网络上的电子资源)
4.信息组织与信息检索有什么关系?
(1)信息组织是信息检索的基础和前提,只有对信息资源进行处理和有序化信息系统之后,才能准确有效查找相关信息资源;
(2)信息检索则是信息组织出发点与归宿,用户的检索需要是组织信息的主要依据。
第二节、信息组织的形式和检索途径
1.文献组织的基本排列方式:
一般有两种基本排列方式,其一为:
(固定排列法)和(按一定意义的次序排列。
)
(固定排列法,如档案、博物馆的收藏、光盘、录音带、缩微品。
按一定意义的次序排列,如图书、期刊等)
2.按照检索工具的对象和特点,可以分为(文献目录)、(索引)、(机读数据库)、(网络搜索引擎)四种类型。
3.按照标识特征,检索工具可以分哪两种基本类型?
(1)以信息资源的外部特征(形式特征)为检索依据,提供以信息资源形式特征为标识检索途径。
常见的信息资源形式特征有责任者名(即作者和与资源形成相关的人或机构,如译者、改编者、修订者等)、题名、机构名、标准书号、专利号、文献登录号(或顺序号)等。
(2)以信息资源的主题内容特征为检索依据,提供从资源内容进行检索的途径,主要有(分类法)、(主题法)。
4.按照系统中所用的标识是否进行控制,检索工具可以分为(受控检索系统)与(自然语言检索系统)。
5.按照系统中标识组配的特点,检索系统可以分为(先组式和后组式两种)。
6.检索工具还可以按照采用的形式,分为卡片式、书本式、缩微式、电子方式等。
第三节.信息组织的处理方式和研究内容
1.检索语言:
一种由表达信息资源主题概念及其相互关系的词汇及规则组成的人工语言系统,也称情报检索语言。
2.知识组织系统:
知识组织系统通常指经过组织的知识结构表达的工具,它试图包含组织信息和促进知识管理的各种类型的词表,其范围从传统的地名表、同义表,到新型的知识组织工具。
3.信息处理的基本做法:
(领会)
1)描述信息资源。
以便识别与确认它,主要方法是著录、编写题录和资源形式特征的描述;
2)浓缩信息资源内容。
主要方法是编写内容提要或文摘,供用户了解、选择和判断信息资源;
3)提供检索点。
主要方法是确定特定资源的标索特征(或标识)与可检信息。
信息资源的检索点有代表其内容特征和形式特征的各种标识,如题名、责任者、分类号、主题词或关键词等
4.信息组织活动的内容:
(领会)
信息组织活动包括两个基本方面:
(1)信息组织的操作。
指根据信息资源的内容和特征,对信息资源进行描述、标引、并将其组织进相应系统的过程。
(2)信息资源的组织规范。
这是根据信息组织的需要,按照信息资源的特点预先确定的规则和方法系统,是进行信息组织操作的依据。
第2章信息组织原理第一节对信息组织的要求
1、信息组织的主要目的是为了有效地检索和利用。
一般认为下述因素是一个信息组织系统必须考虑的重要因素:
(1)检全率
(2)检准率(3)检索速度和系统的及时性(4)系统的易用性(5)检索的成本效益
1.检全率:
检全率亦称查全率、命中率,是指一次检索中检出的与提问相关的信息资源数量占系统中所有与提问相关的信息资源数量的比例,
检全率=检出的相关信息资源量/系统中相关信息资源总量子数×100%
2.检准率;检准率亦称查准率、相关率,是指检出的相关信息资源的数量,占检出的全部信息资源数量的比例。
检准率=检出的相关信息资源数/检出的信息资源总数×100%
3.简述对信息组织的要求。
(领会)
(3)检索速度和系统的及时性。
检索速度是指用户从实施检索到得到结果化费的时间,它是衡量系统检索速度与使用效果的重要参数。
它与系统响应检索的能力、检全率、检准率、资源组织的全理性等因素有关。
系统的及时性是指检索工具处理信息和提供信息所用时间较短,能快速纳入、处理和提供信息。
(4)系统易用性。
是指标引人员使用检索系统描述、标引资源是否方便和易用;用户使用系统的简易性、方便性与获取信息的容易程度。
系统易用性是系统性能的主要因素,决定系统设计改进和发展方向。
(5)检索的成本效益。
是指检索系统的成本和效益之比。
检索成本包括系统设备费、标引处理费、检索运行费;检索效益指检索系统创造经济效益和社会效益。
好的检索系统是低成本高效益的系统。
4描述控制:
描述记录一般概要记录下一资源各种基本特征的数据,可以以浓缩的方式集中反映资源的特征和内容。
(1)描述项目的控制:
根据资源特点选择具有组织和揭示价值的资源特征作为描述的项目。
描述项目应该充分反映信息资源的基本特征和数据。
(2)描述文字的控制:
规定描述信息资源时所采用的文字,应当准确、精炼、统一、规范。
(3)描述级别的控制:
规定对信息资源进行描述的详略程度。
应根据不同的使用对象和需求、信息资源的特点、设备条件加以确定。
(4)描述格式的控制:
包括各种描述项目的次序、描述的标识、描述项目的表达形式等。
对此做统一规定的目的是方便不同类型信息系统之间的交流。
第二节信息组织中的控制与规范
1.句法控制的方法主要有哪些?
句法控制是根据信息资源标引和检索的需要,按照一定的组词造句规则,对检索词的组合方式做出的规定。
常见的句法措施有确定引用次序、使用辅助符号和句式转换。
(1)引用次序,是指复合主题标引和检索时,各个主题因素的组合次序。
在分类法中引用次序是指类目划分标准使用的先后次序或各主题分面在组配时的先后次序;在主题法中是指字顺检索系统中主标题与各级子标题组合的次序。
(2)辅助符号,是揭示主题概念之间的关系意义、进行检索操作的符号。
常见的有:
关系符号:
是一种用于揭示词语组配中形成的关系类型的符号,通过对组配中关系类型的表达,对标引词进行控制,说明组配性质并有一定的排序功能。
联系符号:
是一种揭示同一文献主题之间联系强度的符号,可以防止主题词之间出现误组配。
职能符号:
是一种表示主题标识在组配中的句法职能的符号,可以明确一个标识串(句子)中各主题因素的施动-受动作用,明确法含义,提高检准率。
(3)句式转换,是为了使检索句子各个有意义的词素能成为检索入口字,通过对语句中词语位置的变动来增加检索点。
常见的有:
轮排转换,将检索语句中每个有意义的词依次排在检索入口,其他词在保持相对位置的情况下移动。
链式转换,以逐次折卸句子链环的方法,将每个有检索意义的的词语依次排在检索入口。
分析转换,在一个检索词句中,每次抽取少量的词组配成标题,依次把每个有检索意义的词排在检索位置上。
2.词汇控制的范围是什么?
(领会)
词汇控制:
即根据标引和检索的需要,对自然语言中的的词汇进行优选、规范、揭示相关性的过程。
(2)词汇控制的主要措施包括:
同义控制:
是对字面形式不同而含义相同的词进行控制,使检索系统中一个概念只有一个词语表达。
包括对同义词、准同义词及部分专指词与泛指词进行的控制。
同义控制常用的方法是在几个词中选取一个作为规范词,在规范词和非规范词之间建立用代参照,便于用户从非规范词找到规范词。
同义控制的作用是可以克服一义多词的自然语言现象,把相同内容或特征的信息资源集中在一起。
如:
自行车代脚踏车单车
词义控制:
是对同形异义词和语义含糊的词进行控制,使词义明确,一个词语只表示一个概念,以控制一词多义现象。
词义控制常用的方法是在词后加限义词,在词下增加含义注释和范围注释。
疲劳(生理);疲劳(心理)
词间关系控制:
是揭示词汇之间的等级、等同、相关关系,使之成为语义相关的系统。
在主题法中词间关系控制采用设置参照、倒置标题、主标题-副标题以及编制词汇索引系统,如词族索引、范畴索引、轮排索引等。
分类语言主要通过类目体系显示词语间的从属、并列、相关关系,用类目参照显示语词概念的横向联系。
3.相关因素控制的主要内容(领会)
常用的相关控制包括引用关系、链接关系和用户需求等。
引用关系:
这是科学文献中通过相互引用建立的一种关系,通过它,可以根据相互引证关系,提示文献之间内容上的联系。
链接关系:
是基于超文本链接技术建立的对象之间的联系。
用户需求:
信息组织是为用户服务的,因此用户的检索需求是信息组织的目标和判断信息组织使用效果的重要指标。
第三节规范控制的依据
1.概念之间的关系类型。
同一关系:
“自行车”与“脚踏车”、“电子计算机”与“电脑”。
包含关系:
“哺乳动物”与“熊猫”、“图书馆”与“公共图书馆”。
交叉关系:
“妇女”与“科学家”、“中等教育”与“业余教育”。
矛盾关系:
“核国家”与“非核国家”。
两者之和等于上位概念“国家”。
“脊椎动物”与“无脊椎动物”
反对关系:
中医学与西医学。
两者之和小于上位概念“医学”。
“无产阶级”与“资产阶级”、“有机肥料”与“无机肥料”
并列关系:
“人造棉”与“锦纶”、“维纶”、“腈纶”
2.知识分类:
根据知识组织的不同对象和层次,现有的知识组织体系包括:
科学分类体系、学科分类体系、事物分类体系、行业分类体系等。
(见P24-25页表)
3.阐述文献保证原则和用户保证原则。
文献保证原则:
亦称文献根据,指信息资源组织应根据信息资源类型、数量等因素进行相应控制。
信息检索系统处理的对象是各种类型信息资源,因此要有效进行信息描述及主题内容的组织和提示,离不开对信息资源的内容、特征以及分布状况等的了解。
信息资源的数量、特点,往往是影响检索语言详略程序、确定类目或标识设置的重要依据。
用户保证原则:
指根据用户需要进行描述控制和词汇控制。
检索系统是为用户服务的,各种控制和组织措施如不符合用户的检索要求和使用习惯,必然会影响其使用效果。
因此对信息检索系统在进行规范控制时,应当有意识地从用户的使用需要出发。
4.信息资源组织对分类的借鉴。
信息资源组织以知识分类为基础,可以较好的揭示各个领域知识之间的关系和规律性,及时反映各知识领域的进展。
可以包括多种层次和方面,如:
作为信息资源分类的基础,用于建立合理的信息组织的结构。
作为基础类目门类的设置依据。
作为主题系统中范畴处理的依据。
作为专门领域下具体类目的设置依据。
作为类目之间关系、词间关系处理的依据等。
第三章信息描述第一节、信息描述的含义
1.信息描述的信含义:
亦称信息资源描述,是指根据信息组织和检索的需要,对信息资源的主题内容、形式特征、物质形态等进行分析、选择、记录的活动。
2.元数据:
是关于数据的数据,或关于数据的结构化的数据。
其作用主要包括:
识别:
确认并对要进行组织的信息资源进行个别化描述,使用户能识别该组织的资源对象。
定位:
提供信息资源位置的信息,以便供用户访问时使用。
检索,通过在描述数据中提供检索点,方便用户对资源的检索和利用。
选择,通过记录信息资源的各种特征,供用户对信息资源的使用价值进行判断,并作出选择。
3.信息描述的主要标准:
ISBD是《国际标准书目著录》的英文缩写,由国际图联(IFLA)1969年制定的供各类信息资源描述用的国际标准。
《文献著录总则》我国于1983年7月发表的全国文献著录总则。
DC:
是都柏林元素集的简称,1995年3月在美国小镇都柏林创建的元数据描述方法,是对网络资源描述最著名、最有代表性的标准。
第二节信息资源描述项目、标识和描述级次
1.信息描述项目:
亦称著录项目,是用以揭示文献内容和特征的记录事项。
2.基本描述项目的内容:
我国国家标准《文献著录总则》规定基本描述项目分为9个大项目,依次为:
题名和责任者项目;版本项;文献特殊细节项;出版发行项;载体形式项;丛编项;附注项;文献标准编号及有关记载项;提要项。
《都柏林核心集》分15个大项:
题名;创作者;主题;描述;出版者;参与者;日期;资源类型;格式;资源标识;来源;语言;关联;覆盖范围;权限管理。
3.
正题名:
说明题名文字/第一责任者;其他责任者.—版次及其他版本形式/与本版有关的责任者.—出版发行地:
出版者或发行者,出版发行日期(印制地:
印刷者,印刷日期)
页数或卷(册)数:
图;尺寸或开本+附件.—(丛书名/编者,国际标准连续出版物编号;丛编编号.附属丛编)
附注
国际标准书号(装订):
价格
提要
Ⅰ.书名Ⅱ.责任者Ⅲ.主题Ⅳ.分类号
掌握文献著录格式,描述各项目内容:
如下图:
图:
文献著录格式
4.著录详略级次(参见P41图3-3,图3-4,图3-5)
简要级次:
仅记录主要项目的级次,一般为小型文献单位;
基本级次:
记录主要项目的同时,记录部分选择项目。
最常见
详细级次:
记录主要项目和全部选择项目上。
适合国家书或集中编目使用。
描述信息源:
又称著录信息源、著录根据,指进行信息资源描述时描述信息的来源和出处。
第三节检索点和规范文档
1.检索点是指检索信息资源使用的题名、责任者、分类号、主题词等供检索使用的各种数据。
2.标目的含义及作用。
标目即手检系统中的检索点,是记录中用来作为排检依据的资特征。
标目有两个作用:
作为排检的依据,确定一款目在检索系统中的位置,供检索查找。
决定款目的性质,供组织相应检索工具使用。
3.参照法的含义和类型。
参照法是指引用户从检索工具中的一个标目或款目去查找另一个标目或款目的方法,其作用是指引检索系统中检索对象之间的联系,说明检索系统的编制和使用方法。
分为:
单纯参照,又称直接参照,从不用作标目的标识去查找用作标目的标识。
相关参照,又称兼互参照,从一个使用的标目去参考另一条或几条相关标目的参考。
一般参照,又称普通参照,是提供关于一定编目事项的说明,介绍用户使用系统的方法。
4.名称规范文档:
是一种对描述记录中的名称标目进行规范控制的工具。
其处理的范围,包括人名、机构团体名、著作题名等。
(P45)
5.题名检索点的选择方法:
(P43)
①文献描述中著录的正题名一般直接选作标目。
②适当选择副题名和附注项中的合辑题名作标目。
③并列题名在我国中文手工检索工具中一般不选作标目。
④一文献的题名检索点一般不宜超过两个,但题名分析款目不受此限制,可根据需要设置。
6.个人责任者检索点的选择方法:
①描述记录中第一责任者、两人合著中的第二个责任者名称均可以作标目。
但3人以上合著时只以第一责任者名称作标目。
②如可能,文献责任者中记录的其他责任方式的责任者亦可选择作为标目。
③附注项著录的责任者,以及其他有关责任者,一般不作标目,但在必要时,著名学者或著名著作的责任者也可作标目。
④以书名命名的编写组不作检索点、临时性写作团体如无检索价值,也不做检索点。
⑤丛书综合款目的责任者选择与单书相同;分散著录时,单书作者可选为第一责任者。
如果编者为出版社则不编制责任者综合款目。
当分析出来的材料的责任者与原书责任者不同时,应选其为分析款目的责任者检索点。
6一文献责任者检索点的数量一般不超过4个为宜。
7.规范文档:
是信息组织的一种需要,它是对元数据记录的标目进行控制、跟踪、维护工具。
包括名称规范档、主题规范档等。
其中,名称规范控制是根据确定标目的需要,规定统一使用名称的活动,范围包括人名、团体名、题名等。
规范控制的作用是:
(1)有利于以统一的方式加以记录。
(2)以规范、通用的形式加以记录。
(3)方便标引和检索。
(4)有助于实现国际书目共享。
第四节计算机编码
1.MARC-Machinereadablecataloging,机读编目格式是根据文献特点和文献机构之间信息交换的需要建立的标准化的计算机可读形式。
MARC中一个编目记录的结构(四个部分)
2.分隔符:
(P52页)
分隔符用于分隔不同数据集合,分为字段分隔符和记录分隔符两种。
字段分隔符以“*”表示,用于标志字段结尾。
记录分隔符用于标志记录的结束,以“#”表示。
3.计算机编码的作用。
(P50)
(1)用以显示。
(2)提供检索点。
(3)可以对数据进行一体化处理,促进资源共享。
第四章信息描述工作第一节信息描述工作概述
1.信息描述工作:
依据描述规则,对信息资源的特征进行分析、选择、记录的操作过程。
2.元数据在检索系统中的作用:
Ø向用户提供信息资源的目录学信息,供使用者确认信息资源,进行选择
Ø元数据的各种特征也是进行组织和检索的依据,是建立检索工具的基础和前提
3.信息描述工作的方式(类型)
分类依据
工作方式(类型)
描述的资源对象
文献编目、档案编目、博物馆藏品编目、网络资源编目
操作的设备条件
手工编目、机读编目、联机编目
处理方式
原始编目、复制编目
编目过程的组织形式
集中编目、共享编目
4.在版编目:
是集中编目的形式之一,是指在文献出版过程中进行编目,使编目数据得以与文献一起提供,方便文献机构使用。
5.大规模的信息资源描述网络——书目机构(BibliographicUtility)的出现。
这些机构将联机环境、网络环境与信息描述的形式结合,同时结合采用集中编目和协作编目的方式,为有关文献单位提供书目资源和服务。
ØOCLC(OnlineComputerLibraryCenter),为全美国和国外进行书目服务的机构
ØRLIN(ResearchLibraryInformationNetwork),该网络开始于1967年,是一个为美国研究图书馆服务的系统
ØUTLAS(UniversityofTorontoLibraryAutomationSystem),该系统最早为多伦多大学图书馆的自动化系统,目前已扩大成兼为其他图书馆服务的系统
Ø中国高等教育文献保障体系(CALIS),管理中心设置在北京大学图书馆,是我国高等学校信息资源的联机编目网络。
6.元数据工作的规范要求如下:
(P58)
Ø准确:
对信息资源的描述应真实反映其内容特征。
Ø规范:
信息资源的描述应严格遵守相应的描述规范,并在可能时依据相关的规范文档或控制词表。
Ø完备:
描述项目应比较完备,使得可以从信息资源的各种特征出发进行检索操作。
7.信息描述工作程序
(1)查重:
就是确定某一信息资源是否已经收入系统。
作用:
避免不必要的重复劳动,保证对信息资源描述和处理的一致性。
(2)描述:
描述操作通常应根据描述规范进行,规范化是信息资源描述的发展方向。
(3)标引:
分析信息资源的内容属性(特征)及相关的外表属性,并用特定的语言表达分析出的属性或特征,从而赋予其检索标识的过程。
在此处主要指分类标引、主题标引。
(4)复核:
包括检查描述项目是否完备,准确;分类标引、主题标引的结果是否符合系统的要求等。
8.Connexion元数据的创建方式:
①对已有的记录修改完善。
②克隆(clone)相关记录,进行修改。
③创建新元数据记录。
第二节信息描述方法
1.《文献著录总则》对题名的分类。
(P67,各种题名书上的例子要知道)
(1)正题名:
单纯题名、交替题名、合订题名。
(2)并列题名:
又称平行题名,对照题名,指见于书名页,与正题名语种不同的题名。
(3)副题名:
为解释或从属于正题名的另一题名,应记录于题名之后,以“:
”为标识。
(4)说明题名文字。
2.责任者的类型和责任方式。
责任者说明由责任者和责任方式组成。
责任者指对信息资源的生产负有责任的个人或团体。
个人责任者可以是一人或多人,集体责任者可以则指机构团体、会议活动等。
责任方式表示责任者对文献所作的贡献类型。
传统文献通常有著、编、改编、执笔、口述、译、注、点校、作词、作曲、绘等多种形式。
3.载体形态项、的含义和类型。
载体形态项是一个记录文献物质形态特征的项目。
包括:
数量、图、尺寸或开本、附件等。
文献特殊细节项是为某些特殊类型文献特征的著录设置的项目。
如:
连续出版物的卷、期、起讫、地图比例尺、投影法等,主要用于记录个别重要文献特征。
4.关联项的类型.(P71)
关联。
主要用于表达一信息资源与其他信息资源的联系。
有七种类型:
(1)部分、全部关联。
(2)版本关联。
(3)格式转换关联。
(4)参照关联。
(5)替代关联。
(6)附属关联。
(7)一致关联。
5.检索排检项的类型。
检索排检项通过对检索点的提示,供手工检索系统编制使用。
通常包括四个方面:
文献题名、责任者名、主题词、分类号。
6.传统《文献著录总则》与《都柏林核心集》的特点和异同。
同:
(1)完备的描述项目
(2)都对描述的等级、标识以及规范的使用作出相应的规定
(3)都具有比较强的扩充性、兼容性
异:
(1)针对传统文献描述和识别的需要设置
(2)对传统资源特征的描述项目的设置详尽,针对网络资源的描述项目相对比较概括
(3)各描述项目有明确规定的次序和等级
(4)对描述的表达有严格要求
(5)采用人工标识,适合专业文献单位使用,是一个以文献专业人员为处理主体的描述规范。
第五章分类法第一节分类法概述
1.分类:
是指依据事物的属性或特征加以区分和类聚,并将区分的结果按照一定的次序进行组织的活动。
分类是人类思维的基本形式,是认识世界的基本方法。
2.信息资源分类:
根据信息资源的内容属性和其他特征,将资源分门别类地、系统地组织和揭示的方法。
3.信息资源分类一般具有以下特征:
(1)按照信息资源内容特征的相互关系加以组织,使得信息资源成为一个根据其远近亲疏组织而成的具有等级性、次第性的系统。
(2)一般是从一定的角度出发组织信息资源的(按学科集中,按主题分散)。
(3)以一定标记符号作为排序工具。
(4)一般通过类目索引提供从字顺角度查找类目的途径。
4.对信息资源进行分类的作用意义
(1)进行资源组织。
(2)建立分类检索工具。
(3)分类统计。
(4)兼容工具。
5.分类法是一种从主题内容角度组织和揭示信息资源的方法,是分类方法在信息资源组织中的应用。
6.分类法的类型以及各类型的典型代表
信息资源分类法按照其编制方式,通常可以区分为:
等级列举式分类法。
美国的《杜威十进分类法》(DeweyDecimalClassification,简称《杜威法》或DDC)
《美国国会图书馆图书分类法》(LibraryofCongressClassification,简称《国会法》或LCC)
我国的《中国图书馆分类法》(简称《中图法》)等。
分面组配式分类法。
《冒号分类法》(ColonClassification,简称CC)
《布立斯书目分类法(二版)》(BlissBibliographicClassification,简称BC2)
列举组配式分类法。
《国际十进分类法》(UniversalDecimalClassification,简称UDC)
俄国的《图书馆书目分类法》
7.等级列举式分类法的特点、不足。
特