文献检索技术优质PPT.ppt
《文献检索技术优质PPT.ppt》由会员分享,可在线阅读,更多相关《文献检索技术优质PPT.ppt(38页珍藏版)》请在冰豆网上搜索。
例如:
检索含有检索项A或检索项B的文献,可表示为:
“AORB”或“A+B”3逻辑逻辑“非非”n含含义:
排除含有某些词的记录的,即检出的记录中只能含有NOT算符前的检索词,但不能同时含有其后的词。
用于从某一检索范围中排除不需要的概念。
这种组配可以缩小检索范围。
n用“NOT”或“-”表示,但在但在检索索时建建议使用使用NOT,以避免与,以避免与词间的分隔符的分隔符“-”混淆。
混淆。
在含有概念A的文献集合中,排除同时含有概念B的文献,可表示为:
“ANOTB”或“A-B”。
4运算优先级运算优先级n运算优选级顺序为(),NOT,OR,AND;
n可以用括号改变它们之间的运算顺序。
通常在有通常在有括号的情况下,括号内的逻辑运算先执行,有多括号的情况下,括号内的逻辑运算先执行,有多层括号时,先执行最内层的括号。
层括号时,先执行最内层的括号。
(AORD)ANDB,表示先执行“AORD”的检索,再与B进行AND运算。
5注意事项注意事项1)有的检索工具以符号形象地表达布尔检索的功能,如“+”表示逻辑与,“-”表示逻辑非。
有的检索工具直接把布尔逻辑隐含在菜单中,例如,Lycos以“matchallterms”表示逻辑与,以“matchanyterm”表示逻辑或。
绝大多数检索工具的高级检索完全用表格和文字来表达布尔关系,如,Excite以“必须包括(MUSTcontain)”表示逻辑与,用“一定不含”(MUSTNOTcontain)表示逻辑非。
有的检索工具部分支持布尔关系,如Yahoo!
尚不支持逻辑非。
2)用布尔逻辑表达检索要求,除要掌握检索课题的相关因素外,还应在布尔算符对检索结果的影响方面引起注意。
布尔算符使用正确但却不能达到应有检索效果的例子很多。
nOR逻辑有些检索词表达的概念,存在整体与部分的关系。
在检索中,这类关系如果处理不好,就不能得到满意的检索效果。
对此,一般原则是,如果检索词涉及到表达整体的概念,就要针对具体情况分别列出每一个表达部分概念的检索词,否则将出现漏检。
nNOT逻辑在检索逻辑中使用NOT,能排除含有由NOT指定的检索词的文献,协助检索出更准确的文献。
但是,使用NOT必须慎重。
因为,如果两个关系紧密的检索词同在一个检索逻辑中,对其中一个使用NOT逻辑会导致含另一个词的文献也被排除。
6小结小结n检索中逻辑算符使用是最频繁的,对逻辑算符使用的技巧决定检索结果的满意程度。
n用布尔逻辑表达检索要求,除要掌握检索课题的相关因素外,还应在布尔算符对检索结果的影响方面引起注意。
n另外,对同一个布尔逻辑提问式来说,不同的运算次序会有不同的检索结果。
布尔算符使用正确但不能达到应有检索效果的事情是很多的。
示例:
使用布尔逻辑运算符示例:
使用布尔逻辑运算符表明查询结果中必须同时包含表明查询结果中必须同时包含intelligentrobot和和control表明查询结果中至少包含两个检索词中的任意一个表明查询结果中至少包含两个检索词中的任意一个,intelligentrobot或或control表明检索结果包含表明检索结果包含intelligentrobot,但同时必须去掉和,但同时必须去掉和control相关的内容相关的内容Intelligentrobotandcontrol(intelligentrobot*control)Intelligentrobotorcontrol(intelligentrobot+control)Intelligentrobotnotcontrol(intelligentrobot-control)注:
英文数据库通常用字母,中文数据库要用符号。
注:
二、位置检索(二、位置检索(邻近检索)技术)技术n表明两或多个检索词之间关系的符号。
表明两或多个检索词之间关系的符号。
n适用于两个检索词以指定间隔距离或者指定的顺序出现的场合。
可以看成特殊功能的AND算符。
AND算符不限制两个检索词的位置和出现顺序。
n例如:
communicationANDsatellite命中的文献可能有communicationsatellite;
satellitecommunication;
communicaticndevicesforsatellites;
communicaticnlinkswithoutsatellites;
n位置算符可以改进AND算符的这种不足,它是特殊功能的AND算符。
按照两个检索词出现的顺序和距离,可以有多种位置算符,而且对同一位置算符,检索系统不同,规定的位置算符也不同。
1)“(W)”n含义:
“(W)”算符中的W含义为“With”。
表示其两侧的检索词必须紧密相连,除开空格和标点号外,不得插入其他词或字母,两词的词序不可颠倒。
其简略形式为()。
communication(W)satellitecommunication()satellite两者相同2)“(nw)”n“(nW)”中的“W”的含义为“Word”,它允许两词间插入最多为n个其他词,包括实词和系统禁用词,词序不变。
n例如:
communication(2W)satellite则会检出communicationsatellitecommunicationthoughsatellitecommunicationonthesatellite3)“(N)”n含义:
“(N)”中的N含义为“Near”。
表示其两侧的检索词必须紧密相连,除开空格和标点符号外,不得插入其他词或字母,两词的词序可以颠倒。
4)“(nN)”n含含义:
“(nN)”是“(N)”算符的变形,不同之处为允许两词间插入最多为n个其他词,包括实词和系统禁用词。
COTTON(2N)PROCESSING则命中:
Cottonprocessing;
processingofcotton;
processingofEgyptiancotton5)5)“(F)(F)”同字段检索同字段检索n含义:
含义:
“(F)”算符中F的含义为“Field”。
这个算符表示其两侧的检索词必须在同一个词段中出现,(例如;
同在题目字段或文摘字段)词序不限,中间可插任意检索词项。
POLLUTION(F)CONTRON可命中Contronandmanagementofindustrialpollution同在题目中(F)邻近算符与AND布尔逻辑主要区别在于:
(F)使两个检索项在同一字段,AND布尔逻辑中两个检索词会发生在不同字段中。
6)6)“(s)(s)”同句检索同句检索n含义:
“(s)”算符中的S含义为“Sentence”。
这个算符表示其两侧的检索词必须在同一自然句子(子字段)中出现,两词的词序可以颠倒。
n放宽了词位置检索的要求,使表达同一概念但不满足词位置条件的文献也可以被检索出来,从而提高了查全率。
以上介绍的各种位置算符,按照限制程度的大小,(W)、(nW)最强,(N)、(nN)次之,(S)再次之。
当(nN)的n10时,其作用已经相当于(S)。
三、三、截词检索技术n含含义:
用截断的词(词的片段)的一个局部进行的检索,并认为凡满足这个词局部中的所有字符(串)的文献,都为命中的文献。
n检索者将检索词在合适的地方截断,然后截出的片断进行检索。
原因原因:
n由于西文的构由于西文的构词特性,在特性,在检索中索中经常会遇到名常会遇到名词的的单复数形式不一致;
同一个意思的复数形式不一致;
同一个意思的词,英美拼,英美拼法不一致;
法不一致;
词干加上不同性干加上不同性质的前的前缀和后和后缀就可就可以派生出以派生出许多意多意义相近的相近的词等等。
等等。
n为了保了保证查全,就得在全,就得在检索式中加上索式中加上这些具有各些具有各种种变化形式的相关意化形式的相关意义的的检索索词,这样就会出就会出现检索式索式过于冗于冗长,输入入检索索词的的时间太久,同太久,同时也占太多机也占太多机时。
截词的方式截词的方式
(1)按截断的字符数量来分:
有限截断和无限截断)按截断的字符数量来分:
有限截断和无限截断有限截断:
有具体截去的字符数。
有限截断:
无限截断:
不指明具体截去的字符数。
(2)按截断的位置区分:
后截断、前截断以及中)按截断的位置区分:
后截断、前截断以及中间截断。
截断。
(3)截断常使用截断符号,各)截断常使用截断符号,各检索系索系统所使用的截断符号所使用的截断符号有所不同,常用的符号有有所不同,常用的符号有“?
”,“”,“”以及以及“*”。
以下。
以下举例中用例中用“?
”来表示有限截断,用来表示有限截断,用“*”表示无限截断。
表示无限截断。
注意:
不同的数据注意:
不同的数据库所用的截所用的截词符不一符不一样,使用,使用应先先查一下各数据一下各数据库的帮助加以确的帮助加以确认。
1后方截词(后方截词(前方一致或右截断)n含含义:
将截词符放在一串字符的后面,用以表示以相同字符串开头,而结尾不同的所有词。
(11)词尾的有限截断)词尾的有限截断n相同字符串后可能变化一个字符时,则在其后使用一个“?
”、空格、再加一个“?
”,常用来表示检索词的单复数变化。
用system?
可以查出sytem和systems的文献。
n相同字符串后可能变化两个以上字符时,则在其后连续使用若干个“?
”代替可能变化的字符。
?
表示两个字符,?
表示三个字符,以此类推。
(2)词尾的无限截断)词尾的无限截断n相同字符串后可能变化任何字符串时,则在其后使用一个“?
”。
这种方法可以查找出含有相同字符串的所有检索词。
comput?
可查出compute,computer,computing,computation,computerisation等。
(3)后截词主要使用在如下)后截词主要使用在如下4个方面个方面n词的的单复数,如复数,如book?
,?
,potato?
;
?
n年代,如年代,如198?
(?
(80年代),年代),19?
(20世世纪);
);
n作者,如用作者,如用Lancaster*可可检出所有姓出所有姓Lancaster的作的作者;
者;
n同根同根词,如用,如用biolog*,可,可检出出biological、biologist、biology等同根等同根词。
注意
(1)有限截断比)有限截断比较精确,只精确,只检索出用索出用户需要的需要的词汇;
(2)使用)使用时无限截断必无限截断必须注意:
词干不要太短,否干不要太短,否则会会检出出许多无关的文献;
多无关的文献;
(3)应尽量尽量选用不会引起用不会引起误检的截断的截断词。
2中间截词中间截词(中间屏蔽)n将提问字符串中间的字符用符号代替,主要用于英式美式不同拼法的英文单词,或单复数不同的单词。
n截词符具有“OR”运算符的功能,能够扩大检索范围,而且减