川大信息检索及利用复习资料整理.docx
《川大信息检索及利用复习资料整理.docx》由会员分享,可在线阅读,更多相关《川大信息检索及利用复习资料整理.docx(21页珍藏版)》请在冰豆网上搜索。
川大信息检索及利用复习资料整理
四川大学信息检索与利用文史类
一、图书馆服务与资源介绍
1、四川大学图书馆,由文理、工学、医学、江安四个分馆组成。
川大图书馆主页的数据库:
超星、CNKI、维普、万方、SCI、SpringerLinker
2、索取号:
索取号是某种图书或期刊在图书馆中位置的代号,是图书馆进行藏书组织、排架、流通和清点的主要依据之一,同时也是读者查找文献资源的依据。
绝大多数的图书馆使用分类排架号作为索取号。
一般根据文献类型的不同,称图书的索取号为索书号、期刊的索取号为索刊号。
(1)索书号:
我馆索书号标签粘贴在书脊距底部约一寸的位置。
本馆索书号由以下两个部分构成:
中图法分类号;同类区分号。
(2)索刊号
过刊索刊号粘贴或烫印在书脊距底部约5cm的位置,
现刊索刊号粘贴或手写在期刊封面下部。
3、《中图法》分类(5个基本部类,22个基本大类)
A马克思主义、列宁主义、毛泽东思想、邓小平理论
B哲学、宗教
C社会科学总论;F经济
N自然科学总论;T工业技术(TB一般工业技术)
Z综合性图书
4、与望江、华西分馆的借还书
(1)读者在就近分馆凭有效借阅证提交借书申请单;
(2)四个工作日内读者申请的图书由图书所属分馆传递到提交借书申请单的分馆,读者到提交借书申请单的分馆凭借书申请单和有效借阅证办理借阅手续;
(3)读者申请的图书在该分馆保留两个工作日,两个工作日后读者未来取书,该书被送回图书所属分馆。
1.3信息检索的概念和作用
1、信息检索的概念
信息检索通常是指从以一定方式组成的信息集合中,查找特定用户所需信息的方法与过程。
广义的信息检索包括信息的存储与检索。
2、信息检索的基本原理
(1)信息检索是文献交流的重要环节;
(2)文献存储的可逆性是信息检索的基础
3、信息检索的类型
文献检索数据检索事实检索
1.4信息检索语言
信息检索语言的概念
是人们在加工、储存及检索信息时所使用的标识符号。
信息检索语言的分类
自然语言受控语言
几种常用的分类语言
中图法(中国图书馆分类法);杜威十进分类法DDC
1.6信息检索工具和检索系统
计算机信息检索的类型:
参考数据库;源数据库/联机检索系统(如DIALOG);光盘数据库系统;网络信息检索系统
1.7信息检索效果及评价
查全率查准率漏检率误检率其他
第2章信息检索技术及其应用
1、布尔算符:
用来规定检索概念或检索词之间相互逻辑关系的算符。
逻辑“与”:
AND(或*);逻辑“或”:
OR(或+);逻辑“非”:
NOT(或–)
2位置算符/词位算符:
用于限定词与词之间的位置关系,以提高查准率。
当检索词为词组形式时,或两个检索词之间可能被其他词或标点符号隔开时,均应使用位置算符。
(1)W-With
①W是With的缩写,表示在此算符两侧的检索词必须按输入时的前后顺序排列,不能颠倒。
所连接的词之间除可以有一个空格、标点或连接号外不得夹有任何其他单词或字母。
例:
intelligent(W)robot?
②Wn(或nW)表示在此算符两侧的检索词必须按输入时的前后顺序排列,不能颠倒。
但允许在连接的两个词之间最多插入n个单元词。
例:
intelligentw1robot*
(2)N-Near
①N是Near的缩写,表示此算符两侧的检索词必须紧密相连,所连接的词之间不允许插入任何其他单词或字母。
但词序可以颠倒。
例:
intelligentNEARrobot*
②Nn(或nN)表示在两个检索词之间最多可插入n个单词,且两词的词序任意。
例:
intelligentN1robot*
3、截词检索:
截词是指将检索词在适当的地方截断,截词检索是用截断词的一个局部进行的检索,凡是满足这个截词所有字符(串)的记录,系统都为命中。
截词检索在西文数据库中广泛使用。
是在词干后可能变化的位置加上截词符号。
检索词的单复数形式,同一词英、美不同拼法,词根相同的词都可用截词检索。
这样既可减少检索词的输入量,又可扩大查找范围,提高查全率。
①按截词位置分:
前截断、后截断、中截断;
②按截词的字符数量分:
非限制截断、限制截断。
注:
表示截词的截断符号,各检索系统有不同的规定,没有统一标准。
(1)后截断
后截断是在检索词词干后面加截词符,表示不限制或限制词尾可变化的字符数,即查找词干相同的所有词。
从检索性质上讲,后截断是前方一致检索。
①非限制截断:
是在检索词词干后面加一个截词符,表示不限制词尾可变化的字符位数,即查找词干相同的所有词。
即允许其后可带有任何字符且数量不限。
例:
comput?
相当于查找compute、computing、computerized、computationally……
注:
不宜将词截得过短,否则容易造成误检。
②限制截断:
是在检索词词干后面加若干个截词符,表示限制可变化的字符数。
例:
fib?
?
相当于查找fiber或fibre……
(2)中截断(通配符或屏蔽)
是把截断符号置于一个检索词的中间,对词中间出现变化的字符数加以限定。
一般中截断仅允许有限截断。
例:
organi#ation,可检索到包含organization和organisation的记录。
①一个?
,代表零个或任意个字符。
例:
colo?
r可检索到包含color、colour、colonizer、colorimeter的记录。
②一个?
和数字,其中的数字代表可替换的字符数。
例:
colo?
1r,只能检索到包含colour的记录。
4、字段检索:
指定检索词出现的字段,被指定的字段也称检索入口,检索时,系统只对指定字段进行匹配运算,提高了效率和查准率。
西文数据库,字段检索常用代码来表示,如:
作者AU,机构名称CS,文摘AB,题名TI,关键词KW。
四、学位论文数据库
1、学位论文是本科生和研究生从事学习和科学研究活动的学术论文。
(1)与一般论文的写作比较,质量要求更高,结构更为严谨。
(2)与期刊论文的检索比较,有以下特殊的检索字段(入口):
导师、第一导师、导师单位、论文级别、学科专业名称、学位授予单位等。
2、学位论文信息检索
(1)CNKI学位论文全文数据库
(2)中国博士学位论文全文数据库
(3)中国优秀硕士学位论文全文数据库
(4)万方学位论文全文数据库
(5)四川大学学位论文数据库
(6)CALIS高校学位论文文摘库
(7)PQDD(学位论文数据库)
ProQuest公司是世界上最早及最大的博硕士论文收藏和供应商
第9章信息资源的利用与论文写作
9.4学术论文写作
1、学术论文的特点:
求实性科学性创新性理论性
2、学术论文的基本格式与写作要求
①规则:
GB7713-87(国标《科学技术报告、学位论文和学术论文的编写格式);GB7714-87(国标《文后参考文献著录规则》)
②基本格式:
题名;作者姓名和单位;摘要;关键词;引言;正文;结论;致谢(学位论文必备);英文题名、摘要及关键词;参考文献。
3、学术论文三要素:
论点、论据和论证。
英文电子图书
§KingBook(金图国际外文数字图书馆)远程镜像
§KingBook(金图国际外文数字图书馆)
§MyiLibrary电子书数据库
§EncyclopædiaBritannica(大英百科全书、不列颠百科全书)
§SpringerEbooks
MyiLibrary电子书数据库
§学科覆盖范围:
工程技术、自然科学、生命科学、医药、社会科学、法律、教育、心理、哲学、政治学、文学、语言、音乐等。
§
EncyclopædiaBritannica
§EncyclopaediaBritannica包括印刷版《不列颠百科全书》的73000余条条目,提供有关各种主题完整而准确的信息,包括短条目和长及书籍的长条目。
§BritannicaConciseEncyclopaedia《不列颠百科全书》简明版,包括28000个短条目,可以迅速解答有关历史、艺术、科学等主题的问题。
§TheWeb‘sBestSites大英精选网站。
超过166,000专家编辑群精选推荐网站。
§TheWeb'sBestSites大英精选网站.
§Merriam-WebsterDictionary&Thesaurus韦氏词典及英语同义词字典
§JournalsandMagazinesEBOnline还包括对EBSCO和ProQuest这两个数据库的部分期刊和杂志的检索.
§TheNewYorkTimes,BBCNews焦点新闻.
§SpotlightArchive大英主题数据库
§WorldAtlas世界地图
§WorldDataAnalyst全球资料分析
§GatewaytotheClassics经典文献
§NotableQuotations名人格言
§BritannicaBlog大英知识博客
§AdvocacyforAnimals动物保护站
SpringerLink系统可访问2010-2012版权年Springer出版的近10500种英文电子书,学科涉及化学与材料、数学与统计学、资源环境与地球科学、计算机科学、生命科学、医学、物理学、经济学、商业与管理、心理学、人文社科、法律、教育学、哲学,其中包括LectureNotesinComputerScience(计算机科学讲义)、LectureNotesinMathematics(数学讲义)、LectureNotesinPhysics(物理学讲义)和LectureNotesinEarthScience(地球科学讲义)等著名丛书
英文数据库
§Webofscience
§EBSCO
§Gale
§OCLC基础组的13个数据库
§Emerald管理学、工程学数据库
§ScienceDirect(ElsevierSDOL)
§SpringerLink
§Wiley-BlackWelle-journals
§JSTOR(JournalStorage)-CASHL电子资源
§PAO(PeriodicalsArchiveOnline)-CASHL电子资源
§ProQuestResearchLibrary(PRL)ProQuest学术图书馆期刊数据
§SAGEJournalsOnline
§PQDD--ProQuestDigitalDissertations(CALIS镜像)学位论文
WebofScience
WebofScience由五个数据库组成,内容包含来自数以千计的学术期刊、书籍、丛书、报告、会议及其他出版物的信息
§ScienceCitationIndexExpanded(科学引文索引)(SCI-Expanded):
是针对科学期刊文献的多学科索引。
§SocialSciencesCitationIndex(社会科学引文索引)(SSCI):
是针对社会科学期刊文献的多学科索引。
§Arts&HumanitiesCitationIndex(艺术及人文科学引文索引)(A&HCI):
是艺术和人文期刊文献的多学科索引。
§ConferenceProceedingsCitationIndex-Science(CPCI-S):
此数据库对应印刷版的《科技会议录索引》(IndextoScientific&TechnicalProceedings,简称ISTP)。
§ConferenceProceedingsCitationIndex-SocialSciences&Humanities(CPCI-SSH):
此数据库对应印刷版的《社会与人文科学会议录索引》(IndextoSocialScience&HumanitiesProceedings,简称ISSHP)。
11个字段的深入分析
§按照作者分析:
了解某个研究的核心研究人员是谁;
§按照丛书名称分析:
§按照会议名称分析:
了解论文发表在那些会议录上;
§按照国家/地区分析:
了解核心研究国是哪里;
§按照文献类型分析:
了解该研究通常以什么途径发表;
§按基金资助机构分析:
了解发表论文基金资助的情况;
§按照机构分析:
了解有哪些机构在从事这项研究
§按照语种分析:
了解该研究是以什么语种发表的;
§按照出版年分析:
了解该研究的发展趋势;
§按照来源出版物分析:
了解该研究通常发表在哪些期刊上;
§按照学科分类分析:
了解该研究涉及了哪些研究领域
EBSCO是美国的一家私人公司
§名称来源于“EltonB.StephensCompany”
§创建于1943年,1963年开设图书馆服务办公室,1986年开始发展电子信息产品,1994年开始在Internet上提供在线服务。
§是全球最早推出全文在线数据库检索系统的公司之一
§可以提供100多种全文数据库和二次文献数据库。
所用检索系统为“EBSCOhost”。
Gale平台数据库
§Gale集团隶属于全球最大的信息传媒集团之一TheThomsonCorporation(TTC),是国际著名出版机构和全球最大、最权威的参考书出版商,多年来在出版人文科学工具书以及机构名录方面颇具权威性。
图书馆购买了Gale集团6个专题数据库,内容来自Gale集团多年来出版的众多参考书系列,许多资料为Gale集团独家拥有,是重要的事实性数据来源。
数据每月更新一次。
OCLC基础组的12个数据库
JSTOR(JournalStorage)-CASHL电子资源
§该库是以政治学、经济学、哲学、历史等人文社会学科主题为中心,兼有一般科学性主题共十几个领域的代表性学术期刊的全文库,从创刊号到最近两三年前过刊都可用影像来阅览全文,有些过刊其回溯年代早至1665年,目前共计400多种期刊,具体内容包括:
§1.Arts&SciencesICollection人文社会主题一
§2.GeneralScienceCollection一般科学性主题
§3.Ecology&BotanyCollection生态学与植物学主题:
§4.Arts&SciencesIICollection人文社会主题二
§5.BusinessCollection商业主题:
有关商业方面的期刊46种。
§6.Language&LiteratureCollection语言文学专题:
共47种刊。
PQDD学位论文全文库是目前国内唯一提供国外高质量学位论文全文的数据库,主要收录了来自欧美国家2,000余所知名大学的优秀博硕士论文,目前中国集团可以共享的论文已经达到254345篇,涉及文、理、工、农、医等多个领域,是学术研究中十分重要的信息资源。
CALIS公共目录检索系统(
一、信息、知识、文献的概念
1.信息(information):
信息是指客观事物相联系,反映客观事物的运动状态,通过一定的物质载体被发出、传递和感受,对接受对象的思维产生影响并用来指导接受对象的行为的一种描述。
从本质上说,信息是反映现实世界的运动。
发展和变化状态及规律的信号与消息。
2.知识:
知识是人类在改造客观世界实践中所得的认识和经验的总合,是信息的一部分,是一种特定的人类信息。
3.文献(document):
文献是用文字、图形、符号、声频、视频等技术手段记录人类知识的一切物质载体。
二、信息、知识和文献之间的相互关系
1.信息是事物的本来面貌,信息经过人脑加工形成知识。
2.只有将自然现象和社会现象的信息经过加工,上升为对自然和社会发展客观规律的认识,这种再生信息才构成知识。
3.知识信息被记录在载体上就形成文献。
文献必须包含知识内容,而知识内容只有记录在物质载体上才能构成文献。
文献经过传递、传播、应用于理论与实际而产生新的信息。
一、文献信息资源的层次
从对文献的生产加工与组织层次来看,文献可以分成一次文献、二次文献和三次文献。
1.一次文献(primarydocument)
即原始文献。
人们对自然和社会信息进行首次加工(固化)而成的文字记载,这是文献信息源的主要部分,数量极为庞大。
专著、报纸、期刊、专利文献、标准文献、会议文献、样本等成品文献属于一次文献。
2.二次文献(secondarydocument)
是通过对大量分散、无序的一次文献进行再加工,通过整理、提炼和压缩,并按其外部特征(题名、作者、文献物理特征)和内容特征序化,形成另一类新的文献形式——书目、索引、文摘,这就是二次文献。
二次文献的重要性在于它可以提供一次文献的线索。
3.三次文献(tertiarydocument)
在利用二次文献的基础上,选择有关的一次文献再加以分析、综合而编写出来的第三个层次的文献形式——专题报告、综述、进展以及手册、百科全书、年鉴等工具书,就是三次文献。
n从一次文献——>二次文献——>三次文献
n博——>略,分散——>集中,无序——>有序
n一次文献:
文献的基础,是文献检索的对象
n二次文献:
是一次文献的简略和有序化,是文献检索的工具。
n三次文献:
是集中分散的一次文献,按知识门类或专题进行综合加工的产物,是文献检索的重要来源。
二、文献信息资源的类型
1.根据文献的载体形式划分印刷型缩微型机读型视听型
2.根据文献的编辑出版形式划分
3.按文献的结构等级(文献的加工程度)划分
1.图书(book)ISBN(InternationalStandardBookNumber)
定义:
指内容比较成熟、资料比较系统、有完整定型的装祯形式的出版物。
格式:
著者、书名[M]、版本(第1版不标注)、出版地、出版者、出版年、引文所在的起始或起止页码。
【例】BorkoH,BernierCL.Indexingconceptsandmethods[M].NewYork:
AcademicPress,1978
2.期刊(journal、periodical)ISSN(InternationalStandardSerialNumber)
定义:
是指那些定期或不定期出版、汇集了多为著者论文的连续出版物。
通常有数字或年月顺序编号,并打算无限期地连续出版下去的出版物。
期刊一般都有固定的刊名。
格式:
著者、题(篇)名[J]、刊名、出版年、卷号(期号)、引文所在的起始或起止页码。
【例】PorterMF,ZhangJ.Analgorithmforsuffixstripping[J].Program.1980,14(3):
130~137
3.会议文献(conference、paper)
定义:
会议文献是在各种学术、专题会议上发表的论文、报告稿、讲演稿等与会议有关的文献。
会议文献多数以会议录的形式出现。
是专业领域最新研究成果报道的一种主要方式。
格式:
文献著者、题(篇)名[A]、论文集名[C]、出版地、出版者、出版年、引文所在起始或起止页码。
【例】NealJ.TheDigitalImperative:
BuildingtheElectronicLibraryoftheFuture[A].'98GeneralConferenceofInternationalFederationofLibraryAssociationsandInstitutes[C],Amsterdam,TheNetherlands,1998.
4.学位论文(dissertation、thesis)
定义:
高等学校或科研院所的本科生、研究生为获得学位资格(学士、硕士和博士)而撰写的学术性较强的研究论文。
格式:
著者、题(篇)名[D]、保存地点、保存单位、年份、引文所在起始或起止页码。
【例】CairnsRB.Infraredspectroscopicstudiesonsolidoxygen[D].Berkeley:
Univ.ofCalifornia,1986
8.政府出版物(governmentdocument)
政府出版物是各国政府部门及其所属机构发表、出版的文件,其内容广泛,概括可以分为行政性文献和科技文献两大类。
9.产品资料、技术档案等(productliterature、technicalrecord)
各厂商为推销产品而印发的商业宣传品,包括产品样本、产品目录、产品说明书、厂商介绍、技术座谈资料等。
企业或科研机构在技术工作中形成的、有一定的工程对象的技术文件。
如任务书、协议书、技术经济指标和审批文件、研究计划方案大纲和技术措施等。
各类型出版物特点比较
●内容新颖性:
期刊、会议文献、图书
●信息报道速度:
期刊、会议文献
●流通范围广度:
期刊、图书、会议文献、政府出版物
●发行量:
期刊、图书、会议文献
●易于获取程度:
期刊、图书、学位论文、会议文献、政府出版物
文献出版类型的辩识
(1)图书:
有出版社名称和出版年份。
(2)期刊:
包括刊名、卷、期、页码、月年。
(3)会议文献:
包括会议名称、时间、地址、会议录出版单位及其地址、出版年份、会议录提供单位及其地址、页码。
(4)学位论文:
一般著录学位和学位论文的名称,颁发的单位及地址、时间。
一、信息检索的概念
广义的信息检索:
是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程和技术。
全称为“信息存储与检索”。
狭义的信息检索:
指该过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻。
二、信息检索的基本原理
是信息用户的需求和信息集合的比较与选择,即匹配(match)的过程。
用户根据检索需求,对一定的信息集合采用一定的技术手段,根据一定的线索与准则找出相关的信息。
三、信息检索的类型
1.根据信息的存储媒体和检索技术手段的不同,信息检索可分为:
手工检索:
通常使用的是一些印刷载体的工具书和检索期刊,检索过程由人脑和手翻书刊的配合来完成的,匹配是人脑的思考、比较和选择。
计算机检索:
使用的是检索系统。
系统包括计算机设备、终端、通信设施、数据库和检索、应用软件等。
2.根据检索对象形式的不同,信息检索可分为:
文献检索:
凡以文献检索工具(文摘、题录、全文等)为检索对象,是一种相关检索,不直接解答用户所提出的技术问题本身,只提供与之相关的文献供用户参考。
数据检索(数值检索):
以数值、图标等信息形式为检索对象的信息检索。
是一种确定性检索,直接回答用户所需要的确切的数据。
事实检索:
事实数据也被称作“基础资料”,它是指以直接提供可用的特定事实信息为目的的信息检索。
一、检索方法
文献检索的方法(查找文献的