第四讲 搜索引擎检索.docx

上传人:b****8 文档编号:9697428 上传时间:2023-02-05 格式:DOCX 页数:26 大小:1.03MB
下载 相关 举报
第四讲 搜索引擎检索.docx_第1页
第1页 / 共26页
第四讲 搜索引擎检索.docx_第2页
第2页 / 共26页
第四讲 搜索引擎检索.docx_第3页
第3页 / 共26页
第四讲 搜索引擎检索.docx_第4页
第4页 / 共26页
第四讲 搜索引擎检索.docx_第5页
第5页 / 共26页
点击查看更多>>
下载资源
资源描述

第四讲 搜索引擎检索.docx

《第四讲 搜索引擎检索.docx》由会员分享,可在线阅读,更多相关《第四讲 搜索引擎检索.docx(26页珍藏版)》请在冰豆网上搜索。

第四讲 搜索引擎检索.docx

第四讲搜索引擎检索

第四讲搜索引擎检索

4.1网络检索工具的类型

互联网的出现是20世纪最伟大的科学成就之一,其发展速度远远超过世界上其他科学技术的发展速度。

互联网与它所负载的海量信息,正在对社会经济生活、对人们的价值观念和生存方式产生着强烈的冲击。

随着互联网的发展,网上信息资源的数量、种类呈爆炸性增长,如何才能在浩如烟海的数字化、多媒体、非规范、跨时空、跨行业、跨语种的信息资源中快捷、准确地找出所需信息已成为一个突出的问题,用户迫切需要高效的检索技术和检索工具。

检索工具有哪些?

网络检索工具按照不同的划分方法,可分为许多不同的类型。

1、按索引方式:

目录型、索引型搜索引擎。

2、按检索工具数量分:

独立型搜索引擎、集合型搜索引擎。

独立型搜索引擎它拥有自己的索引数据库,提供基于自身索引库的查询服务,如Google等。

集合型搜索引擎是多个独立型搜索引擎的组合也称多元搜索引擎、元搜索引擎,一般它没有自己的索引数据库,只提供集成的查询界面;如Profusion等。

3、按检索网络资源传输协议分为:

Web资源检索工具、非Web资源检索工具。

Web资源检索工具是以Web资源为检索对象,这是当前网上检索工具的主流几乎成了网络检索工具的代称。

非Web资源检索工具是查找网上非Web资源(FTP、Gopher、Usenet、Telnet等),如查找FTP资源的Archie、查找Telnet资源的Hytelnet等。

随着Web资源的迅速发展,非Web资源检索工具正在逐步Web化,使Web资源检索工具成为检索网络信息资源的集成化工具。

4.2Web资源检索工具

WorldWideWeb简称WWW或Web,中文称万维网,它采用超文本(Hypertext)、超媒体(Hypermedia)技术,集文字、图像、声音、动画等多媒体信息为一体,以直观的图形界面提供网络信息。

WWW信息资源是互联网上最主要、最常见的信息资源。

一、独立搜索引擎

拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,国外具代表性的有Google、AllTheWeb等,国内著名的有XX(Baidu)等。

二、元搜索引擎

元搜索引擎(Meta-SearchEngine)

元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。

著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等。

中文元搜索引擎中具有代表性的有比比猫(Bbmao)搜索引擎。

在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo

4.3非Web资源检索工具

非Web资源检索工具(传统信息查询工具)

一、FTP

FTP是文件传输服务,通过FTP不仅可以从远程计算机上获取、下载文件,也可以将文件从本地机上传到远程计算机上。

通过FTP可获得电子图书、电子杂志、免费软件等许多类型的信息资源。

FTP资源分记名和匿名两种,最常用的是匿名FTP,即以anonymous或FTP作用户名,用E-mail地址或guest作登录口令,登录到远程计算机上,再利用那里的资源。

这种匿名访问,一般被限制在公共目录下(Public或Pub),且不能上传文件,只能浏览、下载那里的资源。

二、Gopher

信息鼠(Gopher)是由美国明尼苏达大学在90年代初研究开发的一种基于菜单的网络信息系统,采用客户机/服务器模式。

Gopher还提供与WWW、FTP、WAIS、Archie的连接。

世界上许多Gopher服务器颁布在大学、公司或其他组织机构内,如资源目录/索引、图书馆目录及电子文献、公共数据库、单位简介及活动信息、生活信息、与其他Gopher服务器的连接等。

Internet上有上千个Gopher服务器。

它们将Internet的信息资源组织成单一形式的资料库,称作Gopher空间。

Gopher不同于一般的信息查询工具,它使用关键字作索引,用户可以方便地从Internet某台主机连接到另一台主机,查找到所需的资料。

但随着WWW的发展与普及,以及Gopher不能传送多媒体信息的缺点,使其处于面临淘汰的境地,有些Gopher服务器已经关闭。

现在Gopher网址可通过WWW访问。

一些Gopher资源

位置Internet地址IP地址用户名

北京邮电大学gopher

北京大学 gopher

澳大利亚国立大学info.anu.edu.au150.203.84.20info

智利gopher.puc.c1146.155.1.16gopher

丹麦学术研究网gopher.denet.dk129.142.6.66gopher

英国布拉德福大学gopher.brad.ac.uk143.53.2.5info

德国gopher.th-darmstadt.de130.83.55.75gopher

西班牙gopher.uv.es147.156.1.12gopher

瑞典gopher.chalmers.se129.16.221.40gopher

加利福尼亚infopath.ucsd.edu132.239.50.100infopath

加利福尼亚scilibx.ucsc.edu128.114.143.4gopher

伊利诺斯大学ux1.cso.uiuc.edu128.174.5.59gopher

伊阿华大学panda.uiowa.edu128.255.40.201

密执安州立大学gopher.msu.edu35.8.2.61gopher

明尼苏达大学consultant.micro.umn.edu134.84.132.4gopher

北卡罗利那大学gopher.unc.edu152.1.45.21gopher

俄亥俄图书馆信息网gopher.ohiolink.edu130.108.120.25gopher

弗吉尼亚大学ecosys.drdr.virginia.edu128.143.96.10gopher

弗吉尼亚大学gopher.virginia.edu128.143.22.36gwis

华盛顿州立大学wsuaix.csc.wsu.edu134.121.1.40wsuinfo

三、Telnet

远程Telnet是Internet上较早使用的一种基本工具。

它将用户注册到网上某一台主机上,使用户成为该主机的虚拟终端,共享该主机的资源和服务。

例如图书馆联机公共检索目录也可通过Telnet来实现。

应用Telnet还可再连接到另一台主机上去访问其资源。

Telnet的登录一般需要输入用户名和口令,最通用的是guest,public等。

Telnet曾经是Internet交通网络的主要部分,但现已被万维网替代。

然而,仍有一些好的Telnet站点。

四、网络论坛

网络论坛是一种最丰富、最自由、最具开放性的网络信息资源。

主要包括:

新闻组(Usenet)、电子论坛(MailingList)、电子公告(BBS)、专题讨论组(discussionGroup)等。

新闻组(UsenetNewsgroups)是一个巨大的信息集合,它按类别细分成许多小组,讨论共同关心的话题。

主动地从新闻服务器上读取信息。

电子论坛(MailingList)是一组成员的E-mail地址,又称电子邮件列表或电子邮件群。

被动地从邮箱中接收电子邮件。

电子公告(BulletinBoardService-BBS)提供多种信息服务。

4.4搜索引擎介绍

一、Google

Google搜索引擎,提供了最便捷的网上信息查询方法。

搜索全球上百亿网页资料,几十亿张图片。

Google可为世界各地的用户提供适需的搜索结果,而且搜索时间通常不到半秒。

现在,Google每天需要提供2亿多次查询服务。

Google的特殊功能

1.查找Flash文件

查找Flash文件,“关键词filetype:

swf”。

Google已经可以支持13种非HTML文件的搜索。

除了PDF文档,Google现在还可以搜索MicrosoftOffice(doc,ppt,xls,rtf)、ShockwaveFlash(swf)、PostScript(ps)和其它类型文档。

新的文档类型只要与用户的搜索相关,就会自动显示在搜索结果中。

2.问答

想知道日本有多少人口吗?

长江的长度?

只要输入这些事实性的问题或关键字(如"日本的人口"),Google会在网上查找答案。

3.地图查寻

使用Google查寻城市地图或具体地址,只需要在捜索框直接键入城市名或地址后加上“地图”即可,或直接输入具体地址。

4.网页快照

Google在访问网站时,会将看过的网页复制一份网页快照,以备在找不到原来的网页时使用。

单击“网页快照”时,您将看到Google将该网页编入索引时的页面。

Google依据这些快照来分析网页是否符合您的需求。

5.货币转换

使用内置货币转换器,只需在Google搜索框中键入您需要完成的货币转换,并单击“回车”键或GoogleSearch按钮即可。

示例:

10新加坡元等于多少印度卢比

8人民币换成泰国的货币

6.计算器

Google为用户提供了一个内置计算器。

只需要在搜索字段中输入算式,按一下回车键或者搜索就可以了。

做所有简单的计算,一些复杂的科学计算,单位换算,以及提供各种物理常数。

例子:

5+2*22^20sqrt(-4)一磅=?

7.相关搜索

Google能够提供与您原搜索相关的搜索词。

这些相关的搜索词是根据过去Google所有用户的搜索习惯和Google提供的计算两个搜索词之间相关度的独家技术而产生出来的。

这些相关的搜索词一般比原搜索词更常用。

8.类似网页

单击“类似网页”时,Google侦察兵便开始寻找与这一网页相关的网页。

Google侦察兵可以“一兵多用”。

如果您对某一网站的内容很感兴趣,但又嫌资料不够,Google侦察兵会帮您找到其他有类似资料的网站。

9.按链接搜索

有一些词后面加上冒号对Google具有特殊的含义。

其中的一个词是“link:

”。

查询link:

显示所有指向该网址的网页。

例如,“link:

”将找出所有指向Google主页的网页。

不能将link:

搜索与普通关键词搜索结合使用。

10.指定网域

有一些词后面加上冒号对Google有特殊的含义。

其中的一个词是“site:

”。

要在某个特定的域或站点中进行搜索,可以在Google搜索框中输入“site:

”。

11.手气不错

按下“手气不错”按钮将自动进入Google查询到的第一个网页。

您将完全看不到其它的搜索结果。

使用“手气不错”进行搜索表示用于搜索网页的时间较少而用于检查网页的时间较多。

12.错别字改正

Google的错别字改正软件系统会对输入的关键词进行自动扫描,它能提供相应提示来帮助纠正可能有的错别字。

例如,搜索“互连网”,Google会自动提示“您是不是要找:

互联网”。

13.天气查询

用Google查询中国城市地区的天气和天气预报。

14.金融信息

在搜索框中输入股票和基金的名称或代码,可查询最新的股票和基金信息。

15.邮编区号

查询邮政编码或长途电话区号,只需输入关键词(“邮编”,“yb”和“YB”任选其一;“区号”,“qh”和“QH”任选其一)和要查的城市地名或邮政编码或电话区号即可。

16.手机号码

查询手机电话号码归属地,直接输入要查的号码即可(不需要任何关键词)。

17.农历日历转换

用Google直接查询农历日期、节气和农历节日,只需键入关键词(“阳历”、“公历”、“阴历”、“农历”或它们的拼音缩写“gl”、“nl”)加上日期即可。

也可以直接输入节气名称、农历节日名称,加上年份或“去年”,“今年”,“明年”。

18.定义

要查看字词或词组的定义,只需键入“define”,接着键入一个空格,然后键入您需要其定义的词。

如果Google在网络上找到了该字词或词组的定义,则会检索该信息并在搜索结果的顶部显示它们。

定义HTML

Google的非主流功能:

1、英语词典

英语单词释义,如:

define:

information即可从不同的在线资源中得到对information一词的解释。

2、英语缩略词表

在输入英语缩略词,即可查到全称及其释义。

3、网页翻译

目前只支持将英语翻译成拉丁语、法语、西班牙语、德语和葡萄牙语。

汉语为测试版。

4、单词纠错

Google的纠错功能可以纠正输入不准确的英语单词,如:

本想输入单词“Google”,因记忆不准误拼为“guugle”时,结果页面会提醒“您要找的会不会是:

Google”,来纠正拼写错误。

5、繁简转换

中文繁简体自动转换是Google默认的功能,如果不希望转换,可在“使用偏好”中关掉该选项。

6、搜索结果过滤

进入英文Google的使用偏好(http:

//www.G),开启SafeSearchFiltering,即可过滤成人内容和不良信息。

7、目录检索

如果嫌关键词搜索内容庞杂,可以使用Google人工编制与维护的目录体系进行搜索。

英文目录在http:

//directory.G,中文目录在http:

//directory.G。

8、自动跟踪搜索结果

9、查看搜索结果的相关度

登陆

10、查找美国电话号码

在搜索框中输入“姓(姓首字母),名,城市名”或“姓(姓首字母),名,邮编)等即可出相应的电话号码。

详见:

11、查看美国街区地图

在搜索框中输入街道地址、邮编、城镇或州名(一般仅输入街道地址和城镇名)便可搜索到该街区的地图。

如“165UniversityAvePaloAltoCA”。

12、用数字查找相关信息

在搜索框中输入美国专利号(如:

patent5123123)、联邦通信委员会(FCC)ID号(如:

fccB4Z-34009-PIR)、联邦航空管理局(FAA)的飞机注册号(如:

n199ua)、UPS联合包裹运送服务公司与联邦快递(FEDEX)的包裹号(如:

1Z9999W999999999与fedex999999999999)即可搜索到相关信息。

13、查找商品与价格

登陆

14、出行参考

在搜索框中输入机场英文全称的三个字母代码和“airport”,可以查询机场航班延迟信息和即时天气状况,如查询SanFranciscoInternationalAirport(旧金山国际机场),输入“sfoairport”。

15、电话查询

登陆google返回的结果吗?

如故对电话查询感兴趣的话,可登陆专门论坛:

16、安装工具栏

为方便使用google搜索,可到

17、在浏览器之外使用Google

到下载GoogleDeskbar,不用打开浏览器,也不必离开任何当前应用程序的情况下就可以立即用Google来搜索。

18、反转镜像

19、懒汉秀

其实是一款小玩具,进入

20、彩蛋游戏

21、主页风格展示

微软风格:

MAC风格:

Linux风格:

FreeBSD风格:

22、罕见“语言”入口

克林冈语入口:

政治入口:

宗教入口:

小猪入口:

黑客专用入口:

以上非主流功能,指英文google而言,有些是中文版没有的,其中大多具有实用价值,少数(16、19-23)则是情趣性的“旁门左道”;有些是主流功能的补充延伸,一些是最新发布的外挂工具(17-18)。

google的非主流功能是其形象特征的组成部分,而且这些所谓的非主流功能也在不断地增补和改进,如果没有这些非主流功能,google也就不成为其google了。

二、XX

XX(B,Inc)于1999年底成立于美国硅谷,它的创建者是资深信息检索技术专家、超链分析专利的唯一持有人――XX总裁李彦宏,及其好友(在硅谷商界成功经验)的XX执行副总裁徐勇博士。

XX在中国各地和美国均设有服务器,搜索范围涵盖了中国大陆、香港、台湾、澳门、新加坡等华语地区以及北美、欧洲的部分站点。

三、一搜

一搜()是雅虎公司基于全球领先的YST(YahooSearchTechnology)技术,在中国推出的独立搜索门户。

一搜于2004年6月21日正式发布,具有简洁专业、海量(50亿网页,5.5亿图片,1000万音乐,网页搜索支持38种语言)、客观精准、国际化、稳定等特质,是值得依赖的专业搜索门户。

四、中国搜索

2003年12月23日,刚刚上市的慧聪国际集团重拳出击,原慧聪搜索正式独立运做,成立了中国搜索,全力打造中文搜索第一品牌。

五、搜狐搜索

搜狗是搜狐()推出的第三代互动式搜索引擎,在用户输入一个查询词后,尝试理解用户可能的查询意图,给出多个主题概念的搜索提示,通过人机交互过程,智能展开多组相关的主题概念,引导用户更快速准确定位自己所关注的内容。

六、英文Google

七、Yahoo

八、AskJeeves

九、AllTheW

十、HotBot

十一、中文元搜索引擎

1、万纬搜索

核心功能很弱,制作一般。

2、bbmao

国内唯一具有自动聚类功能的元搜索引擎,技术和功能上都比较强。

十二、英文元搜索引擎

vivisimo(

1、DOGPILE2、Ixquick3、Mamma4、One2seek5、Savvysearch6、Surfwax

十三、其它专业搜索举例

1、股票行情搜索--证券之星

2、图像搜索--VisionNext

3、地图搜索--图行天下

4、MP3搜索--搜刮网

5、书目查询--WebPac

6、图书搜索--当当书店

7、期刊论文搜索--中国期刊网

8、标准搜索--中国标准咨询网

9、企业产品搜索--阿里巴巴

10、法律搜索--北大法律信息网

11、医药搜索--37℃医学网

4.5检索实例1

实例:

介绍上海城市概况和近几年发展的材料

经理让小王准备一份介绍上海城市概况和近几年发展的多媒体材料,打算为国外公司总部的同事们作报告之用。

小王应该怎样在网上查找呢?

(文字、图片、声音)

小王以为很简单,他在Google搜索引擎中使用上海提问关键词进行了检索,结果怎样呢?

小王一看,太多了。

他想,再试试雅虎中国。

他仍用上海这一提问,结果会使他满意吗?

小王有点不知所措了。

经验一:

网络资源搜索的第一步不是选择搜索引擎,而是分析提问内容,提取提问表达式。

发现大量的大学院校、医院等众多不需要的信息。

经验二:

搜索引擎提供布尔逻辑功能。

Google、Yahoo中使用(上海-大学-医院)

相关的网页很多,怎么办呢?

经过仔细分析,他觉得他向国外公司总部的同事们介绍的内容应该为有关上海的一般性的介绍,使用"上海"和"概况"这两个关键词也许更切合提问主题。

经验三:

在分析提问内容时,需细化提问内容的主题,提取多个符合提问内容的关键词。

经验四:

如果想获得较为有效的检索结果,灵活巧妙地运用各个搜索引擎提供的高级检索功能则为首选之道。

在Google的查询结果中,第一条命中记录就是直接反映“上海概况”主题的网页网址。

在这里他发现了不少关于上海历史、地理、气候衣着等人文地理的资料。

中文找到了,英文如何找?

介绍上海情况的英文在哪?

旅游?

文字资源查找下载得差不多了,小王又开始寻思着查找一些图片了,他觉着他的报告或许应该有一些反映新旧上

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 求职职场 > 简历

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1