主题标引.docx
《主题标引.docx》由会员分享,可在线阅读,更多相关《主题标引.docx(36页珍藏版)》请在冰豆网上搜索。
主题标引
什么是主题法
1.所谓主题法(或主题语言)就是直接用代表事物的名词术语作为表达文献内容的标记符号,并依据这些标识符号的语义和字顺,组织编排检索工具的一种语言形式。
或者说,就是从图书资料的主题角度出发,以主题概念为对象,用描述主题概念的语言(自然语言或规范化语言)为基础,采取一系列的科学方法来直接地、灵活地、深入全面而准确地揭示和组织图书资料,以适应机检和手检的现代化方法。
2.从以上定义可知:
(1)主题法是一种情报检索语言。
情报检索语言按其结构原理可分为分类语言、描述语言和代码语言三大类型,主题法为描述语言。
(2)主题法是一种组织图书资料的方法。
它是直接把主题词按一定规律进行有序排列(字顺体系)来组织图书资料的方法。
(3)主题法是一种检索方法。
它是直接选用事物的名称和概念的名称术语为表征图书资料内容主题的标识符号,并以此作为查找依据的一种检索方法。
主题法与分类法的比较
相同之处
1.它们揭示和检索的对象是一致的,即都是各种类型的图书资料,它们都是依据这一对象的客观存在而产生和发展的。
2.它们都是从图书资料的内容途径进行揭示和检索的一种方法。
3.它们的目的和作用是一致的,即都是文献信息单位用来组织和编排图书资料检索工具,向读者揭示、宣传和流通图书资料的一种手段。
不同之处
1.体系结构不同
字顺系统是主题法体系结构的主体。
这种字顺系统指主题词表的全部主题词和主题目录、主题索引的全部标题,它们都是依据字顺排列先后的。
此外,有的主题词表还根据需要,编制了用于组配使用的各种类型的辅助表和附表。
如:
地域表、形式表、国家表、人物表、组织机构表等。
另外,还编制了一些用于提高标引和检索效能的分类索引、词族索引、文种对照索引、轮排索引等辅助性的结构措施。
分类法体系结构的主体是按学科性质划分的等级层累结构的逻辑分类系统。
这种逻辑分类系统,是指各门学科知识类目的划分,遵守从总到分,从一般到特殊,从低级到高级,从简单到复杂,从上位到下位,层层展开,上下隶属的逻辑序列。
此外,分类法在体系结构上,还编制了一定数量的辅助分类表、专类复分表、类目索引或相关主题。
2.揭示事物的角度不同
主题法主要是从图书资料内容的主题字顺角度进行揭示,它所揭示的是某个具体的事物、对象和问题。
主题法不问学科分野,也不管学科之间的逻辑关系,而只是对事物的特定对象及其各个方面的问题进行研究和探索。
分类法则主要是从图书资料内容的学科性质出发对事物进行分类揭示的。
它所揭示的是事物属于什么学科门类,便于读者把这个事物置于一定学科体系之中进行研究和探索。
3.对图书资料的集中与分散不同
主题法是把同一主题的图书资料集中,却把同一学科性质的图书资料分散。
相反,分类法把同一学科性质的图书资料集中,却把同一主题的图书资料分散。
4.标识符号系统不同
主题法主要采用直接的语词标识系统,以规范化的或不规范化的自然语言,作为图书资料内容主题的标识符号,这种标识符号比较直观,给人以一目了然的效果。
但是,其不足之处是采用这种标识编排图书资料检索工具时,词与词之间是机械地排列,在编排上不能揭示和反映学科体系的内在联系。
分类法采用的则是一种间接的号码标识系统。
即以字母、数字或二者混合的号码,作为大小类目的标识符号。
分类法所组织和编排的检索工具,主要依据类号进行序列。
图书资料的学科体系,也主要是靠这种类号去揭示和反映。
类号与类目名称紧密结合,一旦类号完全脱离类目名称,则难于知道类号的含义。
5.语义关系的显示方法不同
主题法的主题词之间的语义关系,主要是通过它的参照系统,即“用(Y)”、“代(D)”、“属(S)”、“分(F)”、“族(Z)”、“参(C)”等显示同义、属分和相关语义关系。
其次,叙词法还编制了范畴分类索引、词族索引(词族图)等辅助性措施来显示词的隶属或等级性质的语义关系。
分类法类目之间的语义关系,主要依靠类号类目的等级层次,直接显示上下位类目概念之间的隶属关系、平行并列关系,其次还靠参见法、指入法、交替法以及类目注释说明等方法,显示类目概念之间的同义、相关等语义关系。
6.组配方法不同
主题法的组配,由于直接采用自然语言的名词术语作为组配标识,它的组配是词与词的结合,所以使用起来一般比较直观、灵活。
分类法的单线性逻辑序列,一般很难反映学科之间的多种交叉现象。
譬如边缘学科、交叉学科和综合学科的图书资料,在类表中往往难于安排位置,适应性较差。
为了满足这一需要,现代许多分类法,则采用许多通用复合组配、专用复分组配和主类号组配等有利措施,来补救这一缺点。
7.组织藏书的功能不同
主题法不可能具有组织藏书排架的功能。
分类法在功能上则具有独到的优点,它既能用于组织编排目录索引检索工具,又能用于组织藏书排架,是管理图书的一种科学方法。
8.适应自动化的程度不同
从总的使用情况来看,主题法由于直接使用自然语言作为检索标识和采取语词概念的组配方法,以及反记著录的方法,因而它更适应于各种机械设备,便于实现图书资料检索工作的自动化、网络化。
当然,主题法也可用于编制手工检索工具,而分类法虽然可以用于计算机检索,但主要是用于编制手工检索工具。
单元词法联号和职号的使用
1.联系符号。
当一篇文献有两个或两个以上主题,不同主题的单元词之间在检索过程中可能产生误组配(假联系)时,可使用关联符号解决。
例如:
文献 “地图的排架和乐谱的著录 0148” 可标引为:
地图 0148a 排架 0148a
乐谱 0148b 著录 0148b
2.职能符号。
由于单元词组配无词序,所以两个单元词的组配有可能产生两种涵义,可使用职能符号解决。
例如:
文献 “清洁用机械 0142”和文献 “机械的清洁 0163” 我们可用a代表事物、对象,b代表性能、用途,c代表方法、过程,则:
清洁用机械:
机械 a0142 清洁 b0142
机械的清洁:
机械 a0163 清洁 c0163
叙词法的构成原理
1.叙词法是多种情报检索语言的原理和方法的综合。
(1)对单元词法的借鉴和发展——保留了组配的原理;
(2)对组配式分类法的借鉴——用概念组配代替字面组配;
(3)对标题法的借鉴和发展——①允许使用词组; ②需要严格的规范化处理,保证词与概念一一对应; ③有完善的参照系统。
(4)对等级列举式分类法的借鉴——①叙词表中大多编有范畴(分类)索引; ②在叙词表中编有词族索引(等级索引)。
(5)对关键词法的借鉴——在叙词表中编制叙词轮排索引。
2.概念组配是叙词法的基本原理。
概念组配与字面组配在形式上有时相同,有时不同;而从性质上来说,则两者区别甚大。
字面组配,其实质是词的分拆与组合(拆词);概念组配,其实质是概念的分析与综合(拆义)。
两者的检索效果有很大差异。
《汉语主题词表》介绍
目前,《汉语主题词表》共三卷八册。
第一卷 社会科学部分,共两个分册。
分别为:
第一分册 字顺表; 第二分册 索引。
第二卷 自然科学部分,共五个分册。
分别为:
第一、二分册 字顺表; 第三分册 范畴索引、词族索引; 第四分册 英汉对照索引; 第五分册 轮排索引。
第三卷 附表,共一个分册。
按照其结构,《汉语主题词表》可分为主表、附表和索引。
一、主表
主表亦称字顺表或主题字顺表。
它包括社会科学(第一卷):
第一分册和自然科学(第二卷):
第一、二分册。
它是《汉语主题词表》的主体,由全部正式主题词、非正式主题词、参照项、注释项、英文名等项组成,并按汉语拼音字顺排列,是标引和检索图书资料的主要工具。
1.主表的主题词款目结构
主题词款目是构成《汉语主题词表》主表的基本结构单位,其款目结构包括:
款目主题词、款目主题词的汉语拼音、英文译名、范畴分类号、注释和参照项等项目。
2.主表的编排
(1)主表中所有款目主题词和款目非主题词要严格按汉语拼音字母顺序排列(不考虑同音同形字)。
(2)首版主题词以字母为单位排列,排列时不考虑汉字的笔划、笔型;修订后的自然科学部分以汉字为单位注音,按音序、调序与部首笔划排列。
(3)拉丁字母与汉语拼音字母混排,其它文种字母一律排在汉语拼音字母Z之后。
(4)词中出现括弧()、连字符—或其它符号,不影响排序。
(5)词中出现的希腊字母一律按其拼读的汉语拼音字母排列。
(6)数字按单个数字的汉语拼音顺序排列。
二、附表
附表是将主表中通用的一些专有名词术语抽出另行排列,以减少主表的篇幅,便于利用。
附表是主表的组成部分,单列为第三卷,为社会科学和自然科学共用。
本附表所收录的主题词包括:
附表一 世界各国政区名称; 附表二 自然地理区划名称;
附表三 组织机构; 附表四 人物。
附表共收主题词8200多条。
四个附表,分别按主题词的汉语拼音字母顺序排列,主题词款目由汉语拼音、汉语名称及英文译名等项构成,有的款目下还列有注释和参照项,但主题词款目没有范畴号。
因为附表是主表的组成部分,所以字顺主题词表的总词量为“主表+附表”。
三、索引
1.范畴索引。
亦称分类索引,是把主表中全部主题词,按其所属的范畴并结合词汇的学科分类需要划分成若干个大小类目,供依学科范畴查词时使用的一种索引。
(1)范畴索引的功能
①便于从分类角度来查找与某一范畴内容有关的主题词,达到按类查词的目的。
②可作为资料报导、发行和交流时进行分类的依据。
③对选词、编制参照等工作能起到分工协调和检查遗漏的作用,是编制主题词表的辅助工具。
(2)结构
例:
45 生物科学 ………………………………… 一级类
45A 普通生物科学 ………………………… 二级类
45AC 进化 ………………………………… 三级类
(3)类目设置(划分)原则
①范畴索引收入主表的全部款目叙词,包括主题词和非正式主题词。
②所有主题词均按词义分入范畴索引中的相应类目,原则上一词一类。
③类目的划分和设置充分考虑收词情况和标引与检索的实际需要。
2.词族索引。
亦称族系索引、词族表、等级索引,它是把主题词中某些具有属分关系的全部主题词,按其本质属性的级别展开,加以全显示的一种词族系统。
(1)词族索引的功能
①在电子计算机检索系统中可以满足族性检索的要求。
②起自动扩大检索与缩小检索范围的作用。
③有助于限定词义,有利于提高在标引和检索中选词的专指性及准确性。
(2)结构
例:
Weiguanjiegou
维管结构*
• 本质部 …………………………… 第二级
• • 管状分子 …………………… 第三级
• • • 导管 ……………………… 第四级
• • • 管胞 ……………………… 第四级
• 韧皮部 …………………………… 第二级
• • 筛分子 ……………………… 第三级
(3)划分原则
①收入词族索引的词,必须是主表或附表中按属分关系处理的主题词,非正式主题词和不具有明确属分关系的词一律不得收入。
②一般应选择外延较宽、具有族性检索意义的主题词作族首词。
外延太宽、内涵太浅没有实际检索意义的语词均不能选作族首词。
③当一个主题词同时从属于两个词族时,一般应在相应词族下予以反映,但已确定为族首词的语词不得再在其它词族的分项中出现。
④对于极少数主题词,按其属性可以从属于同一词族中不同级别,必要时也容许其在不同等级下予以重复反映,但这种情况一般应严格控制。
3.轮排索引。
亦称轮排表,是将词表中全部主题词按词素的字顺排列,含有同一词素的词组集中显示于一处的词汇表,是从词素角度查找主题词的辅助工具。
(1)轮排索引的功能
①增加检索入口,便于从词素角度出发查找词组,提高查词的速度。
②将具有同一词素的叙词集中在一起,有助于用户判断词表中是否有所需的词组。
③有助于利用词面成族的特点,发现遗漏的词汇或词间关系处理存在的问题,以便加以改进。
(2)结构形式 采用题内关键词索引的形式编制。
例:
检索入口 范畴号及用代参照 主表页码及栏目
汽包锅炉 53CB 1986中
Drumboilers
汽车 72B 1986中
Automobil
… … …
公共汽车 72B D 大客车 924右
(3)类目编制原则
①本轮排索引收入《汉语主题词表》自然科学部分的全部主题词,包括单词、词组,正式主题词和非正式主题词。
②每个主题词根据其构成要素,即有检索价值的单元概念,确定轮排数量。
③条目的排序采用双向排列法,即先按检索入口右侧汉字的拼音排列,右侧相同的主题词,则按检索入口左侧的汉字,从右向左排,以便可以将靠近入口词的汉字有层次的排列,以方便用户选择使用。
4.英汉对照索引。
它是把英文名与汉语主题词互相对应的,并以英文字母顺序排列而成的一种对照索引。
(1)英汉对照索引的功能
①便于对英文主题词译名进行规范化。
②便于从英文名称角度查找和选用汉语主题词,以便进一步明确主题词的含义。
③便于利用英文检索工具向汉语转化。
④为国外索引语言的兼容性和标准化奠定基础。
⑤可作为一部综合性大型英汉翻译参考工具书,在标引和检索英文文献资料时。
可作为参考英文主题词译名的一种辅助工具。
(2)结构形式
例:
Subject
主语
主体
Subject analysis
主题分析
(3)类目设置规则
①每个汉语主题词应尽量译成英文。
②当一个汉语主题词有几个英文译名时,应同时译出,并按字母顺序分别排列。
③当一个英文名词有几个汉语语义时,也应同时列出,汉语主题词按其汉语拼音顺序排列。
④当一个英文名词同时对应一个正式主题词和一个以上非正式主题词时,可省略非正式主题词,只列出正式主题词。
⑤当一个英文名词只对应一个非正式主题词时,必须在下面列出正式主题词,并不再列出英文译名。
分类主题一体化语言
一、什么是分类主题一体化语言
1.定义
检索语言的分类主题一体化,是指在一个检索语言系统中(或由两种原来独立的检索语言合成的系统),对它们的分类表部与叙词表部的术语、参照、标识、索引四部分实施统一的控制,从而能够满足分类标引与主题标引的需要,简称一体化检索语言或一体化词表,国外称为分类法/叙词表系统。
三、分类主题一体化语言的原理
(以《中国分类主题词表》为例)
1.情报检索语言的兼容与互换
所谓兼容是指两个实体结合起来工作的能力。
情报检索语言的兼容是指某种词表或分类表的词汇(包括叙词、类目等)及其构造的检索式或标引记录,可以直接适用于或通过转换适用于多个不同的情报检索系统。
也就是说,不同情报检索系统的标引数据可以互相转换,一个检索式可以适用于多个实现了情报检索语言兼容的系统。
2.采用分类表——叙词表双向对照索引
分类表——叙词表双向对照索引是美国和欧洲学者为了调查分类表与叙词表(或标题表)之间的关系而研制出来的。
其中规模较大的是1972年美国威廉斯(Williams,J.G.)用计算机辅助编成的《分类的美国国会图书馆标题表》(Classified Library of Congress Subject Headings)和1981年美国鲍克公司书目部根据美国国会图书馆180万种藏书的主题目录编制、出版的《主题标准档》(Subject Authorities)。
我国在八、九十年代也编制、出版了一批分类表——叙词表对照索引,如《中国分类主题词表》。
分类表——叙词表双向对照索引是一种分类标引数据与主题标引数据相互转换的有效工具。
应当指出,这种兼容互换其中有相当部分是等值兼容,即分类号和叙词在外延和内涵上是完全等同的,也有一部分是不同程度的对应兼容(包括近似兼容或包容兼容),还有一小部分无法兼容。
3.《中图法》与《汉表》的兼容互换
《中图法》与《汉表》之间实现兼容的可能性和现实性表现在下列几个方面:
(1)从情报检索语言的原理上分析。
它们都实施了相同范围的词量和词类控制、词形控制、词义控制及词间关系控制等类控制,只不过控制的方法和程度不同而已。
(2)从两种情报检索语言的词汇兼容性分析。
①学科的覆盖面几乎完全相同。
两者皆是综合性的情报检索语言,覆盖了一切学科领域。
不同检索语言覆盖学科领域的重复程度越高,它们就越容易实现兼容与互换。
②词汇的专指度比较接近。
《中图法》(含《资料法》)有类目多达5万多个,如果再加上类目注释中包含的主题概念及复分、仿分概念,已与收词多达10万的《汉表》的专指度相差无几,两者都属于专指度较高的检索语言,因而易于实现类目与主题词的转换。
③词汇都具有不同程度的解析性。
《中图法》和《汉表》表面看来词汇结构似乎截然不同。
实际上《汉表》可以用两个或两个以上的叙词与一个先组度较高的类目对应。
并且《中图法》是一个正在由体系分类法向组配分类法转变的检索语言,其类目有较高的解析性,不仅设有70个专用复分表和7个通用复分表,而且拥有多种组配手段,这些为两者实现语义兼容创造了条件。
④分类体系的相似性。
《中图法》的分类体系与《汉表》的范畴索引在一、二级类目上几乎完全相同,完全对应,三级以下也十分接近。
两者分类体系的相似性正是两者兼容的基础。
⑤语种的同一性。
《中图法》类目的名称和《汉表》的叙词都采用了相同的自然语言——汉语,两者的术语体系十分接近。
(3)从两种情报检索语言的结构兼容性分析。
《中图法》和《汉表》这两种检索语言在宏观结构上差别很大,但是在微观结构上,它们都包含四个基本的构成因素:
①术语;②标记符号;③术语连件;④索引。
《中国分类主题词表》
一、编制概况
1.编制目的及意义
(1)编制目的。
《中国分类主题词表》是我国图书情报界为提高文献分类标引和主题标引质量、降低标引难度及补编主题目录等而编制的。
(2)意义。
①为建立综合性文献数据库,实现联机检索和信息资源共享奠定了基础。
②为完善图书馆目录体系,沟通分类和主题两大检索系统起到了推动作用,同时也促进了计算机检索和手工检索工具的研制。
③为联机多库检索系统中解决检索语言障碍,起到了中介词典的作用,推动了检索语言标准化的进程。
④在检索和标引系统中,能够实现分类主题一体化,可降低标引难度,提高检索效率和标引工作效率,为实现机助标引、自动标引创造了条件。
⑤从检索语言角度看,它已构成先组式等级分类语言与后组式主题语言相结合的分类主题一体化的检索语言,为检索语言兼容互换创造了条件。
⑥作为一个详尽的知识体系,可为科学研究提供较为详细的研究提纲,也为编制专业主题词表、专业文献分类法,提供了基本词汇和分类体系。
⑦为术语学的研究和术语库的建立提供了参考依据。
3.体系结构。
《中国分类主题词表》是由三部分构成:
(1)编制说明与使用说明。
它是对《中国分类主题词表》编制目的、编制原理、编制结构及功能、使用方法等有关事项的总体说明。
(2)《分类号——主题词对应表》,共一卷两册。
这是《中国分类主题词表》从分类到主题、从类号到主题词的对照索引体系,包含了《中图法》、《资料法》所有类目和对应主题词款目、对应注释,即由《中图法》的主表、7个附表和2个附录,以及《汉表》修订后的共10万5千多个主题词构成。
它既是一部增加主题词(串)注释的新版《中图法》,又是一部以《中图法》分类体系组织的《汉表》分类索引。
(3)《主题词——分类号对应表》,共一卷四册。
这是《中国分类主题词表》从主题词到分类号,从标题到分类号的对照索引体系。
它含有20,5322个主题词、主题词串和1,4690个非正式主题词。
它既是一部以《中图法》类号为范畴号的《汉语主题词表》,又是一部主题词表式的《中图法》类目索引。
二、《分类号——主题词对应表》的结构和特点
3.《分类号——主题词对应表》的特点和作用
特点:
(1)它是一个以分类法为中心的,由一个分类法及以分类对应方式组织的主题词相结合的标引系统。
(2)其分类表是一个由《中图法》和《资料法》融为一体的分类体系,可以同时供图书馆和资料单位使用。
(3)其主题对应表部分除收入《汉表》全部主题词外,还收入各种主题词的组配标题形式即主题词串,用户可以直接选用或作为建立组配标题形式的一种参考依据。
(4)它是《中图法》和《汉表》两种检索工具的结合,两者都具有标引功能,可以根据文献主题内容,直接依据它进行分类标引和主题标引。
作用:
(1)它可以作为一部独立的分类法使用,其后对应的主题词可以用来帮助确定类目的含义或范围,以便正确归类。
(2)它可以在分类标引的同时,根据情况进行主题标引,每个类目后不仅对应其所包含的全部主题词,而且包括相应的主题词组配标题形式,可以根据标引图书资料的需要加以选用,必要时再核对字顺表,使用十分方便。
(3)具有主题词的分类索引的作用,便于从分类体系的角度了解某一学科门类主题词的全貌,提供按学科专业查找主题词的途径。
三、《主题词——分类号对应表》的结构和特点
3.《主题词——分类号对应表》的特点和作用
与《汉表》的字顺表相比,《主题词——分类号对应表》由下述不同:
(1)收词范围除《汉表》主题词外,还包括近年来中文图书标引中的新增词和《分类号——主题词对应表》中的新增词,收词较全,能更好反映学科领域的发展,适应各种文献资料的标引。
(2)不仅收入单词和词组,而且包括主题词的组配标题形式,同时采用后组和先组结合的方式,便利对复杂主题的标引。
(3)不仅显示主题词的相关关系,而且在族首词下对等级关系进行完整显示,相当于将字顺表与词族索引合并,功能完备,详略得当。
(4)对应的标识是《中图法》的分类号,而不是范畴类号,可以直接据此查找《分类号——主题词对应表》,方便分类标引。
(5)将所有主题词、主题词串集中于一表,比《汉表》结构紧凑。
(6)该进了排检方法,采用音序和字形结合排序,符合人们查找习惯。
《主题词——分类号对应表》的作用:
(1)可以从字顺角度查找相应的主题词以及常用复杂主题的主题词串,进行文献主题标引,其主题词串具有简化主题词的组配程序,降低标引工作难度的作用。
(2)可以作为《中图法》的主题标引,从主题词出发,查找相应类目,方便类目的查找。
(3)能够显示分类表中没有显示的多种语义关系,便于通过语义系统进行相关主题的查找,扩大、缩小主题词的检索范围,同时也可以通过语义关系确定主题词的确切词义,提高标引的正确度。
主题标引工作
一、主题标引的意义
1.主题标引的定义
(1)所谓标引工作,是指根据文献的特征,赋予某种检索标识的过程。
(2)文献的主题标引,是指在文献存贮和检索过程中,对文献进行主题分析,将文献主题概念从自然语言转换成规范化的检索语言,即对主题分析结果赋予检索标识的过程。
主题标引的实质就是语言规范化问题,即将自然语言转换为《词表》中正式主题词。
2.主题标引的意义
(1)将文献中有用的重要信息给以主题标识,为读者提供多种检索途径,使文献得到充分利用;
(2)将同一主题的文献加以集中,便于全面查找所需专题的文献;
(3)只有通过主题标引,才能构成主题字顺检索系统,将文献内容编排成系列,提供检索。
二、主题标引的方式
主题标引依据不同的区分标准,可以分成多种不同的标引方式。
其中,按照对文献内容的揭示特点,主题标引可以分为以下几种:
1.整体标引 亦称浅标引,是一种概括揭示文献基本主题