出版信息组织与利用.docx
《出版信息组织与利用.docx》由会员分享,可在线阅读,更多相关《出版信息组织与利用.docx(23页珍藏版)》请在冰豆网上搜索。
出版信息组织与利用
出版信息组织与利用
第一章信息与信息资源概说
▪第一节信息与文献信息
概念解释:
信息、文献、知识
信息:
是物质的一种基本属性。
它是自然和人类社会中一切事物自身运动状态与方式,是事物的内在联系和含义的表征。
知识:
是人类实践经验的总结,是人的主观世界对客观世界的如实反映和概括,是认识的结果。
知识是信息的一部分,是由信息提炼,转化而成的是经过人类认识,挑选,系统和深化了的信息。
文献:
记录有知识的一切载体。
信息包括知识,知识包括文献。
(三圈图)
文献信息
⏹文献信息就是以文献形式记录人类知识的信息。
文献信息资源是人类信息资源的主体。
⏹文献信息既具有物质的属性,又不是物质;既属于意识范畴,又不是纯意识的。
⏹它是用文献形式把客观事物的属性再现出来,因而它既有物质的属性,又是意识的存在形式。
物质和意识在一定程度上可以是统一的,文献信息正是体现这种统一性的事物。
人们需要各种文献信息
▪例1、文献查找:
在论文写作或编辑过程中需要“出版业产业化、集团化改革”方面的资料。
▪例2、数据或事实查询:
①“我国印刷术的起源与发展”——中韩之争;肖东发教授的例子
②在工作中需要核实:
1998年我国出版业的规模和利润各是多少亿元?
▪例3、生活中的信息查询
报考研究生,需要对高校及研究生硕士点的情况进行了解,进行决策。
当代大学生需要较高的信息素质
⏹信息素质:
“信息素质”(Informationliteracy)也称信息素养,这一概念最早由美国波尔(PaulZurkowski)于1974年提出。
信息素质包括图书馆素质、计算机素质、媒体素质、技术素质等。
目前,国内信息管理行业对“信息素质”的定义趋于多样化。
综合起来,可得到一种共识:
信息素质是人认识、创造、利用信息的品质和技能。
信息素质包含信息意识、信息能力和信息道德三方面的内容。
⏹信息素质是创新人才应具备的基本素质之一。
中场
第二节文献信息的类型
(文献的分类)
一、根据文献载体和信息记录形式划分
1.手写文献
2.印刷型文献
3.缩微型文献
4.视听型文献
5.机读型文献(电子文献)
二、根据文献编辑出版的特征和____范围划分
1.正规文献:
(1)图书
(2)期刊(3)报纸
2.非正规文献(也称灰色文献):
(1)会议资料
(2)学位论文
(3)内部刊物(4)档案文献
(5)政府出版物
1.正规文献:
通常指正式的、公开出版发行的文献。
⏹
(1)图书:
形式特征是完整固定,有封面、书名页、目次、正文及版权页,并都装订成册。
内容特征是主题突出、论述完整、内容成熟。
出版周期较长,一般不反映最新的知识信息。
⏹
(2)期刊:
又称杂志,是指具有一个稳定的总名,有一定的卷期或年月标志,定期或不定期连续出版的文献形式。
主要特点是出版迅速、内容新颖广泛、系统连贯。
⏹核心期刊:
指那些信息密度大,具有代表性和权威性,使用寿命长,反映学科发展最新动向和科学研究的最新成果,受到专业读者重视的期刊。
核心期刊是一种重要的科学文献信息源。
⏹例如:
中国核心期刊指南、中文核心期刊要目
⏹(3)报纸:
也是一种连续出版物,出版周期短,时效性最强;形式简单,一般以单张出版;内容包罗万象,汇天下之精华,具有广泛的使用价值。
2.非正规文献:
也称灰色文献,专指非公开发表,通过正规渠道无法获得,有重要参考价值的文献。
(1)会议资料:
指在国内外各种学术会议上交流的论文。
(2)学位论文:
即高等学校、研究机构的学生为取得某种学位而撰写的论文。
(3)内部刊物:
指政府机关、高等院校、研究机构、出版发行等单位非公开出版的刊物。
(4)档案文献:
指国家机构、社会组织以及个人在从事各项实践活动中直接形成的具有保存使用价值,经过立档归档,集中保管起来的各种文件。
(5)政府出版物:
指各国政府及其所属部门发表的文件。
三、根据文献的加工程度划分
1.一次文献
2.二次文献
3.三次文献
1.一次文献:
指以科学研究、工作实践中的新成果、新知识和经验总结为依据而创作产生的文献。
这是最基本的文献信息源。
主要包括学术专著、报刊论文、文学作品、科研报告等。
2.二次文献:
指根据实际需要,按照一定的科学方法,将特定范围的分散的一次文献进行加工整理而形成的文献。
它能较为全面系统地反映某学科某专业的线索,是检索一次文献的工具。
主要包括书目、索引、文摘、图书馆目录等。
3.三次文献:
指通过二次文献提供的线索,选用一次文献内容,进行分析综合后而编写的文献。
包括综述研究和参考工具两类。
综述研究类如专题述评、动态综述、进展报告等;参考工具类有百科全书、年鉴、手册等。
三次文献的特点在于高度浓缩和深度加工,是知识在更高层次上的网络化和综合化。
第三节电子信息源
▪电子信息源是以电子数据的形式,把文字、声音、图像等形式的信息存储在光、磁等介质上,以电信号、光信号的形式传输,并通过计算机和其它外部设备再现出来的一种新型信息源。
因此电子信息源实质上是一类机读型信息源。
▪电子信息源按其载体形态可分为两大类:
有形电子信息源,即封装型电子信息源;网络电子信息源。
▪网络电子信息源又分为联机网络信息源和Internet网络信息源。
音像信息资源
▪音乐
▪视频
▪多媒体
电子信息源的特点
⏹文献信息载体方面,电子信息源以磁性介质和光介质作为信息存储载体
⏹文献信息表现形式为文本、超文本、多媒体和超媒体,使文字、图形、声音、动画、三维图像等相结合
电子信息源的特点
▪电子信息源较易共享
▪电子信息源时效性强
▪知识的类聚性
第二章信息检索原理
▪第一节信息检索基本原理
▪信息检索(InformationRetrieval)广义上是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出相关信息的过程和技术,又叫“信息存储与检索”(InformationStorageandRetrieval)。
▪狭义的信息检索则仅指该过程的后半部分,即从某一信息集合中找出所需的信息的过程,相当于人们通常所说的信息查询(InformationSearch)。
▪如不加特别说明,本处提到的“信息检索”是狭义的信息检索,即信息查询。
信息检索的意义和作用
▪1.信息检索是获取知识的捷径
▪2.信息检索是科学研究的向导
▪3.信息检索是终身教育的基础
信息检索的类型
(一)
⏹按照存储与检索的信息类型不同,信息检索可以分为数据检索、事实检索、文献检索
⏹数据检索是以数值或图表形式表示的数据为检索对象的信息检索。
数据检索的对象是具有数量性质,并以数值形式表示的数据。
⏹事实检索是以从文献中抽取的事项为检索内容的信息检索。
事实检索以事项为检索的目的和对象,检索的结果是有关某一事物的具体答案,既包括非数值信息,也包括一些数据信息,针对查询要求,由检索系统进行分析、推理后,再输出最终结果。
⏹文献检索是以文献为检索对象的信息检索。
它为用户提供的是与用户的信息需求相关的文献信息,文献检索的目的是提供相关文献的出处、收藏处所或者文献原文。
信息检索的类型
(二)
⏹按信息存贮和检索手段,信息检索可分为手工检索、机械化检索和计算机检索
⏹手工检索就是用人工来处理和查找所需信息的检索方式。
⏹机械化检索是利用探针或检索器件等机械装置来处理和查找文献信息的检索方式,是介于手工检索和计算机检索的一种半自动化检索。
⏹按机械化检索使用的设备和信息载体机械化检索又可以细分为穿孔卡片检索和缩微品检索。
⏹计算机检索是利用计算机和一定的通信设备查找所需信息的检索方式。
⏹它需要计算机、通信硬件设施、系统软件和应用软件。
⏹目前,广泛使用的计算机检索系统包括因特网上检索系统、联机检索系统和光盘检索系统。
信息检索系统
⏹信息检索系统是拥有一定的存储、检索技术装备,存储有经过加工的各类信息,并能为信息用户检索所需信息的服务工作系统。
⏹信息检索系统是连接信息用户和信息资源的必要中介。
⏹信息检索系统是由信息资源、设备、方法(信息存储和检索方法)、人员(系统管理人员和信息用户)等因素有机结合而成的复杂系统,具有信息采集、整理加工、存贮、查询、显示传递等功能。
信息检索系统
⏹根据信息检索系统使用的工具、载体和技术方法的不同,信息检索系统可分为手工检索系统(印刷型检索系统)、缩微检索系统和计算机检索系统。
⏹手工检索系统由手工检索设备(如书本式目录、检索性工具书、文摘、索引、卡片柜等)、检索语言、文献库等构成。
⏹它具有使用方便,成本低廉等特点,但检索效率和响应时间均较差。
⏹缩微检索系统是一种机械检索系统,随着计算机检索系统的推广和完善,目前应用日渐稀少。
⏹计算机检索系统主要由计算机检索设备(联机检索设备、光盘检索设备、微机检索设备、缩微品机检设备等)、检索语言、文献库等构成。
⏹计算机检索系统具有检索效率高,响应速度快等特点,但是成本和检索费用较高。
信息检索系统
⏹计算机检索系统又可分为一次性信息检索系统和二次性信息检索系统。
⏹前者适合于信息量不大而需要经常修改的情况,如航空订票系统;
⏹后者适用于信息量大而不需修改的情况,如图书或文献检索系统。
信息检索工具
⏹信息检索必须要借助于一定的检索工具。
⏹信息检索工具是指用以报导、存贮和查找文献信息线索的工具。
⏹它是附有检索标识的某一范围文献条目的集合,是二次文献。
⏹检索工具具有广义和狭义之分。
⏹广义的检索工具是指用来报道、存贮、查询文献信息的一切工具与设备,可分为手工检索工具、机械检索工具和计算机检索工具。
⏹广义检索工具与检索系统的含义是一致的,彼此并没有严格的区分界定。
⏹狭义的检索工具则主要指手工检索工具,也称印刷型检索工具或书本式检索工具。
⏹我们这里的检索工具是广义的检索工具,任何具有信息存贮和检索功能的工具和设施均可称为检索系统或检索工具。
⏹但手工检索的时候,多使用检索工具一词;而计算机检索时则更多使用检索系统一词。
信息检索工具
⏹检索工具应具备以下四个条件:
⏹
(1)明确的收录范围;
⏹
(2)完整明了的文献特征标识;
⏹(3)提供多种必要的检索途径[检索点];
⏹(4)全部条目科学地、按照一定规则组织成为一个有机整体。
信息检索工具
⏹手工检索工具一般分为以下几大类:
⏹
(1)目录:
目录是图书、期刊或其它出版物外表特征的解释和报道。
⏹
(2)题录:
题录是以单篇文献为基本著录单位来描述文献外表特征(如文献题名、著者姓名、文献出处等)的检索工具,题录没有内容摘要,是快速报道文献信息的一类检索工具。
⏹(3)文摘:
文摘是指不加解释和评论的、对信息资料进行准确简化的再现。
文摘的基本作用是用来判别或代替阅读原文。
⏹按照编写人的不同,文摘可分为著者文摘和非著者文摘。
⏹就其摘要的详简程度,可分为指示性文摘和报导性文摘两种。
信息检索工具
⏹(4)索引:
索引本意为指点。
索引型检索工具是根据一定的需要,把特定范围内的某些重要文献中的有关款目或知识单元,如书名、刊名、人名、地名、语词等,按照一定的方法编排,并指明出处,为用户提供文献线索的一种检索工具。
⏹人们可借助索引的指点,找到隐藏于众多而庞杂的资料中有关信息的出处。
在检索工具中,常用的索引类型有分类索引、主题索引、关键词索引、著者索引等。
⏹(5)信息资料指南:
这是一种新的检索工具,目前正在陆续出现。
如,“xx省党政信息指南”、“手表行业指南”等类型的小册子,其中既有历史资料,又有近期信息。
⏹除了上述几种检索工具外,还有“工具书指南”、“书目之书目”等检索工具,它们是检索工具的检索工具,对于我们掌握使用检索工具具有重要的指引和帮助作用。
电子版检索工具
⏹电子版检索工具是手工检索工具的延伸;
⏹从载体形式上说,有光盘版和网络版之分,早期还有软盘版;
⏹从检索方式上说,有单机检索工具、联机检索工具和网络检索工具之分。
电子版检索工具的类型划分
⏹数值型数据库:
存贮并提供数值型数据信息的数据库。
⏹事实型数据库:
存贮并提供对基本知识和事实的历史、现状、进展进行记录、描述信息的数据库。
⏹文献型数据库:
存贮并提供文献性、资料性信息的数据库。
电子版检索工具的主要优势
⏹具有强大的检索功能;
⏹检索工具和文献信息资源本身二位一体,一次文献和二次文献零距离;
⏹强化了对文献信息资源内涵和内在联系的深度揭示;
⏹提供全方位、立体化的信息;
⏹内容更新周期短、速度快。
第二节信息检索的方法与步骤
⏹信息检索的途径
⏹检索途径,顾名思义,就是信息检索的路线和出发点。
⏹信息检索的途径取决于信息存贮过程中各种检索系统(工具)对文献信息处理的方式和内容。
⏹检索途径大多来源于文献信息的外部特征(如题名、著者)和内部特征(如所属学科)。
信息检索的途径
⏹分类途径
对信息检索而言,分类途径就是根据文献的内容特征,利用分类目录或分类索引查找文献的检索途径。
⏹主题途径
主题途径是以表达文献内容的词、词组或短语为检索点查找文献信息的途径;
⏹主题检索途径是信息检索中最重要的检索途径之一。
⏹责任者途径
责任者是指对文献信息内容负责或作出贡献的个人或团体,包括著者、编者、译者等。
⏹责任者途径是根据文献的外部特征,利用著者(个人或单位著者)目录和著者索引进行检索的途径,习称著者途径。
信息检索的途径
⏹题名途径
文献题名是表达、象征、隐喻文献内容及特征的词、短语或句子。
题名是文献的标题或名称,包括书名、刊名、篇名等。
⏹题名途径就是根据文献名称来查找文献的检索途径。
⏹通过题名途径可以利用书、刊、杂志、文章的名称查找文献,原理简单、简便易行,题名途径是最直接、方便的检索途径。
⏹序号途径
序号途径是借助某些文献所特有的编号来检索文献信息的检索途径。
许多文献具有唯一性或一定的序号,如专利号、科技报告的报告号、合同号、资助号、文摘号、国际标准图书编号、标准文献的标准号、电子元件型号等等。
这些序号都可以用来检索某一类文献。
手工信息检索的一般方法
⏹常用的手工信息检索方法有四种:
直接检索法、间接检索法、追溯法和循环法。
其中后三种检索方法是信息检索的基本方法,又以间接检索法最常用。
⏹计算机检索可利用的检索方法更多,如关键词法、逐词分割法等。
⏹直接检索法又称直查法,是指不利用检索系统或检索工具,通过直接浏览或阅读原始文献检索获取信息的方法。
⏹间接检索法也称常用法或工具法,就是利用文摘或题录等各种文献检索工具查找文献的方法。
⏹常用法根据时间范围又分为顺查法、倒查法和抽查法。
信息检索的方法
⏹顺查法是以所查课题起始年代为起点由远而近地按时间顺序的查找方法。
⏹与顺查法正好相反,倒查法(也称逆查法、回溯性检索)是由近及远,由新到旧的顺序查找检索文献信息的方法。
⏹抽查法是指根据检索课题的实际情况,着重查检某个时期文献信息资料的一种方法。
⏹抽查法根据课题研究的特点,抓住检索课题研究发展迅速、出版文献较多的年代,抽取一段时间(几年或十几年)或一段时间内的几个点,再进行顺时查找或逆时查找。
信息检索的方法
⏹追溯法也称引文查找法、跟踪法,是指利用已经掌握的文献末尾所列的参考文献,通过文后参考文献进行追溯查找“引文”的一种简便的扩大信息来源的方法。
⏹它还可以从查到的“引文”中再追溯查找“引文”,像滚雪球一样,依据文献间的引用关系,获得越来越多的内容相关文献。
⏹综合法又称为循环法,它是上述追溯法和间接检索法的结合并加以综合运用的方法。
⏹具体地说,采用这种方法查找文献时,既要利用一般检索工具书刊,又要利用文献后附的参考文献进行追溯,分期分段地交替使用,知道获得满意的相关文献为止。
信息检索语言
信息检索语言是根据文献信息检索的需要创造出来的一种人工语言。
人工语言也称受控语言。
是依据一定的规则对自然语言进行事先规范,将其编制成表,以供文献标引和检索时使用的语言。
检索语言的基本要求
⏹保证较高的检全率和检准率。
⏹能满足多种检索要求。
⏹易于标引,易于检索。
⏹具有兼容性和通用性。
⏹具有不断进行现代化改造的可能性。
信息检索语言的功能
⏹
(1)对文献的信息内容(及某些外表特征)加以标引。
要求利用检索语言能够正确标引文献信息内容及其外表特征;
⏹
(2)对内容相同及相关的文献信息加以集中或揭示其相关性,提高信息检索效率;
⏹(3)对大量文献信息加以系统化或组织化,使文献信息的存储集中化、系统化,便于信息检索者按照一定的排列次序进行有序化检索;
⏹(4)便于将标引用语和检索用语进行相符性比较,保证不同检索人员表述相同文献内容的一致性,以及检索人员与标引人员对相同文献内容表述的一致性;
⏹(5)保证检索者按不同需要检索文献时,都能获得最高的查全率和查准率;
⏹(6)在文献信息标引者和检索者之间发挥桥梁和纽带作用,使二者在理解和表达文献信息主题方面达到一致,提高信息检索的准确性。
⏹检索语言可分为分类检索语言、主题检索语言和代码检索语言三种。
⏹在信息检索系统中,常用的是分类检索语言和主题检索语言。
功能上各有优势,也各有不足。
⏹随着计算机检索技术的发展,直接来自文献本身、未经规范化处理的自然语言以其标引检索简便快捷又受到人们的广泛关注。
分类主题一体化语言和自然语言代表了未来检索语言的发展方向。
第三节使用检索工具的基本技术
方法
检索词的遴选
⏹检索词可分为:
⏹字段词(如题名字段、著者字段、主题字段、摘要字段、时间字段、语种字段等)
⏹任意词
字段词检索
(1)
字段词检索
(2)
字段词检索(3)
字段词检索(4)
字段词检索(5)
遴选检索词的“循环衍生法”
⏹通过对一个词的定义、语素、语境(上下文)进行分析获得具有同义或相关关系的衍生语词。
⏹通过对衍生语词进行反复检索尝试来确保检索词的全面与准确。
循环衍生法的理论基础
⏹定义词与被定义词往往关系密切;
⏹含有相同语素的词往往具有语义上的联系;
⏹意义相关的词在同一语境中出现的概率更大。
定义衍生法-1
⏹从一个词的定义中寻找它的同义词或相关词;对找到的语词再定义、再寻找;不断反复,使衍生的结果不断扩大。
定义衍生法-2
文化社会学:
亦称“社会学文化学派”。
西方社会学理论和流派之一。
形成于19世纪末。
代表人物有美国社会学家萨姆纳等。
认为“风俗决定文化”、“社会是文化的产物”。
其特点是用文化因素来解释各种社会现象。
《辞海》1989年版第1736页
定义衍生法-3
萨姆纳:
一译孙末楠。
美国社会学家。
1907年当选为美国社会学会会长。
对“习俗”和“道德规范”两个概念进行了论述。
著有《民俗论》、《社会的科学》等。
节选自:
《辞海》1989年版第677页
定义衍生法-4
⏹习俗:
风俗习惯。
⏹道德规范:
人们在道德生活中应当遵循的行为准则的总和。
是一定社会或阶级对人们提出的道德要求,也是道德原则的具体体现。
《辞海》1989年版第108、1196页
定义衍生法-5
语素衍生法-1
⏹分析一个词的关键语素,由语素出发寻找该语素的同义词或相关词;再从找出的语词中确定新的关键语素,寻找该语素的同义词或相关词;不断反复,使衍生的结果不断扩大。
语素衍生法-2
语境衍生法-1
⏹先将一个词作为检索词,检出包含该词的上下文,然后在该词的附近寻找它的同义词或相关词。
语境衍生法-2
语境衍生法-3
……康雍乾三帝倡导并亲自参与一系列文化创造活动,吸收大批学者加入,直接推动学术发展起来,出现学派纷立,俊采星驰的繁荣景象。
尤以考据学即乾嘉学派的形成为其大宗,……如顾炎武、阎若璩等为考据学的开山鼻祖,其后,有惠栋创“吴派”;再稍后,有戴震创“皖派”,其他如任大椿、庄存与、纪昀、王念孙、彭元瑞等一大批学者,都是乾嘉学派的主要代表人物。
李治亭.清代逊国90年祭.社会科学战线,2001(3)
语境衍生法-4
考据学惠栋吴派戴震皖派
顾炎武阎若璩任大椿庄存与
纪昀王念孙彭元瑞
二次检索
⏹又称再次检索。
在已有检索结果中的进一步检索。
⏹二次检索使用的检索词必须与前次检索的主题相关,如包含关系、下位关系、并列关系等。
二次检索
(1)
二次检索
(2)
二次检索(3)
二次检索(4)
二次检索(5)
二次检索(6)
布尔逻辑检索
⏹逻辑“与”(and):
“同时包含”关系。
⏹逻辑“或”(or):
“分别包含”关系。
⏹逻辑“非”(not):
“排除其他”关系。
布尔检索法
▪用布尔逻辑算符来表达检索词间的逻辑组配关系,是最基本、最常用的检索技术。
▪布尔运算符有三种,分别是逻辑或OR、逻辑与AND、逻辑非NOT。
▪1)逻辑或 OR:
也可写作“+”、检索词A和检索词B若用“OR”组配,则提问式可写为“AORB”或者“A+B”,表示要检索含有A、B词之一或同时包含AB两词的文献。
▪逻辑或表达检索词间的并列关系。
可扩大检索范围,提高查全率,如“鲁迅OR周树人”
逻辑或:
A+B、AORB
▪2)逻辑与AND:
也可写作“×”,检索词A与检索词B若用“AND”组配。
则提问式可写为“AANDB”或者“A×B”,表示要找出含有这两个词的文献集合。
▪表达检索词间的交叉关系。
可缩小检索范围,提高查准率。
▪如:
“印刷*学院”,表明结果必须同时含有”印刷”和“学院”才为命中,则“北京印刷厂”排除。
逻辑与:
A×B、AANDB
▪3)逻辑非NOT:
也可写作“-”,检索词A和检索词B若用“NOT”进行组配,则提问式可写为“ANOTB”或“A-B”,表示要找出含有检索词A而不含检索词B的文献。
▪表达检索词间的排除关系。
可缩小检索范围,提高查准率,但要慎用。
▪如:
A-B,表明结果是A中不包含B的那部分。
⏹如“北京站–北京西站”表示检索结果要含有“北京站”而不含“北京西站”
逻辑非:
A-B、ANOTB
布尔逻辑检索举例-1
⏹查找1980—2000年间出版的季羡林先生所写的有关“东方文化”的著作。
布尔逻辑检索
(1)
布尔逻辑检索
(2)
布尔逻辑检索举例-2
⏹查找1980—2000年间出版的季羡林先生所写的有关“东方文化”论题以外的著作。
布尔逻辑检索(3)
布尔逻辑检索(4)
截词检索
⏹截词检索是利用检索词的词干或不完整词形进行检索的方法。
⏹截词的形式主要有任意截断和嵌入截断。
截词检索法
▪截词检索检索时,只需用词干加截词符号,凡是含有与该词干相同内容的文献均能被检出。
▪该方法能很好解决中西文单词的派生形式,避免漏检现象的出现。
▪检索系统不同,截词符也不同,常用的有:
#,?
,*等。
⏹根据截词符出现的位置不同,可分为:
⏹
(1)后截词:
将截词符放在词根后面,前方一致。
是最常用的截词方式。
主要用在词的单复数、年代、作者、查同根词等情况。
⏹如:
王伟?
(可查出所有名字中含“王伟”的作者的文献)