ImageVerifierCode 换一换
格式:DOCX , 页数:26 ,大小:1.03MB ,
资源ID:9697428      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/9697428.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(第四讲 搜索引擎检索.docx)为本站会员(b****8)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

第四讲 搜索引擎检索.docx

1、第四讲 搜索引擎检索第四讲 搜索引擎检索4.1 网络检索工具的类型互联网的出现是20世纪最伟大的科学成就之一,其发展速度远远超过世界上其他科学技术的发展速度。互联网与它所负载的海量信息,正在对社会经济生活、对人们的价值观念和生存方式产生着强烈的冲击。随着互联网的发展,网上信息资源的数量、种类呈爆炸性增长,如何才能在浩如烟海的数字化、多媒体、非规范、跨时空、跨行业、跨语种的信息资源中快捷、准确地找出所需信息已成为一个突出的问题,用户迫切需要高效的检索技术和检索工具。 检索工具有哪些?网络检索工具按照不同的划分方法,可分为许多不同的类型。1、按索引方式:目录型、索引型搜索引擎。2、按检索工具数量分

2、:独立型搜索引擎、集合型搜索引擎。独立型搜索引擎它拥有自己的索引数据库,提供基于自身索引库的查询服务,如Google等。集合型搜索引擎是多个独立型搜索引擎的组合也称多元搜索引擎、元搜索引擎,一般它没有自己的索引数据库,只提供集成的查询界面;如Profusion等。3、按检索网络资源传输协议分为:Web资源检索工具、非Web资源检索工具。Web资源检索工具是以Web资源为检索对象,这是当前网上检索工具的主流几乎成了网络检索工具的代称。非Web资源检索工具是查找网上非Web资源(FTP、Gopher、Usenet、Telnet等),如查找FTP资源的Archie、查找Telnet资源的Hyteln

3、et等。 随着Web资源的迅速发展,非Web资源检索工具正在逐步Web化,使Web资源检索工具成为检索网络信息资源的集成化工具。4.2 Web资源检索工具WorldWideWeb简称WWW或Web,中文称万维网,它采用超文本(Hypertext)、超媒体(Hypermedia)技术,集文字、图像、声音、动画等多媒体信息为一体,以直观的图形界面提供网络信息。WWW信息资源是互联网上最主要、最常见的信息资源。一、独立搜索引擎拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,国外具代表性的有Google、AllTheWeb等,国内著名的有XX(Ba

4、idu)等。二、元搜索引擎元搜索引擎 (Meta-Search Engine)元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等。中文元搜索引擎中具有代表性的有比比猫(Bbmao)搜索引擎。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo 4.3 非Web资源检索工具非Web资源检索工具(传统信息查询工具)一、FTPFTP是文件传输服务,通过FTP不仅可以从远程计算机上获取、下载文件,也可以将文件从本地机上传到远程

5、计算机上。通过FTP可获得电子图书、电子杂志、免费软件等许多类型的信息资源。FTP资源分记名和匿名两种,最常用的是匿名FTP,即以anonymous或FTP作用户名,用E-mail地址或guest作登录口令,登录到远程计算机上,再利用那里的资源。这种匿名访问,一般被限制在公共目录下(Public或Pub),且不能上传文件,只能浏览、下载那里的资源。二、Gopher信息鼠(Gopher)是由美国明尼苏达大学在90年代初研究开发的一种基于菜单的网络信息系统,采用客户机/服务器模式。 Gopher还提供与 WWW、FTP、WAIS、Archie的连接。世界上许多Gopher服务器颁布在大学、公司或其

6、他组织机构内,如资源目录/索引、图书馆目录及电子文献、公共数据库、单位简介及活动信息、生活信息、与其他Gopher服务器的连接等。Internet上有上千个Gopher服务器。它们将Internet的信息资源组织成单一形式的资料库,称作Gopher空间。Gopher不同于一般的信息查询工具,它使用关键字作索引,用户可以方便地从Internet某台主机连接到另一台主机,查找到所需的资料。 但随着WWW的发展与普及,以及Gopher不能传送多媒体信息的缺点,使其处于面临淘汰的境地,有些Gopher服务器已经关闭。 现在Gopher网址可通过WWW访问。一些Gopher资源 位 置 Internet

7、 地址 IP地址 用户名北京邮电大学 gopher北京大学 gopher澳大利亚国立大学 info.anu.edu.au 150.203.84.20 info智利 gopher.puc.c1 146.155.1.16 gopher丹麦学术研究网 gopher.denet.dk 129.142.6.66 gopher英国布拉德福大学 gopher.brad.ac.uk 143.53.2.5 info德国 gopher.th-darmstadt.de 130.83.55.75 gopher西班牙 gopher.uv.es 147.156.1.12 gopher瑞典 gopher.chalmers.

8、se 129.16.221.40 gopher加利福尼亚 infopath.ucsd.edu 132.239.50.100 infopath加利福尼亚 scilibx.ucsc.edu 128.114.143.4 gopher伊利诺斯大学 ux1.cso.uiuc.edu 128.174.5.59 gopher伊阿华大学 panda.uiowa.edu 128.255.40.201密执安州立大学 gopher.msu.edu 35.8.2.61 gopher明尼苏达大学 consultant.micro.umn.edu 134.84.132.4 gopher北卡罗利那大学 gopher.unc

9、.edu 152.1.45.21 gopher俄亥俄图书馆信息网 gopher.ohiolink.edu 130.108.120.25 gopher弗吉尼亚大学 ecosys.drdr.virginia.edu 128.143.96.10 gopher弗吉尼亚大学 gopher.virginia.edu 128.143.22.36 gwis华盛顿州立大学 wsuaix.csc.wsu.edu 134.121.1.40 wsuinfo三、 Telnet远程Telnet是Internet上较早使用的一种基本工具。它将用户注册到网上某一台主机上,使用户成为该主机的虚拟终端,共享该主机的资源和服务。例

10、如图书馆联机公共检索目录也可通过Telnet来实现。应用Telnet还可再连接到另一台主机上去访问其资源。Telnet的登录一般需要输入用户名和口令,最通用的是guest, public等。 Telnet曾经是Internet交通网络的主要部分,但现已被万维网替代。然而,仍有一些好的Telnet站点。四、网络论坛网络论坛是一种最丰富、最自由、最具开放性的网络信息资源。主要包括:新闻组(Usenet)、电子论坛(Mailing List)、电子公告(BBS)、专题讨论组(discussion Group)等。新闻组(Usenet Newsgroups)是一个巨大的信息集合,它按类别细分成许多小组

11、,讨论共同关心的话题。主动地从新闻服务器上读取信息。电子论坛(Mailing List)是一组成员的E-mail地址,又称电子邮件列表或电子邮件群。被动地从邮箱中接收电子邮件。电子公告(Bulletin Board ServiceBBS)提供多种信息服务。4.4 搜索引擎介绍一、GoogleGoogle 搜索引擎,提供了最便捷的网上信息查询方法。搜索全球上百亿网页资料,几十亿张图片。Google 可为世界各地的用户提供适需的搜索结果,而且搜索时间通常不到半秒。现在,Google 每天需要提供 2 亿多次查询服务。Google 的特殊功能1.查找 Flash 文件 查找Flash文件,“关键词

12、filetype:swf”。Google已经可以支持13种非HTML文件的搜索。除了PDF文档,Google现在还可以搜索Microsoft Office (doc, ppt, xls, rtf) 、Shockwave Flash (swf)、PostScript (ps)和其它类型文档。新的文档类型只要与用户的搜索相关,就会自动显示在搜索结果中。2.问答 想知道日本有多少人口吗?长江的长度?只要输入这些事实性的问题或关键字(如日本的人口),Google 会在网上查找答案。3.地图查寻使用Google查寻城市地图或具体地址,只需要在捜索框直接键入城市名或地址后加上“地图”即可,或直接输入具体地

13、址。4.网页快照 Google 在访问网站时,会将看过的网页复制一份网页快照,以备在找不到原来的网页时使用。单击“网页快照”时,您将看到 Google 将该网页编入索引时的页面。Google 依据这些快照来分析网页是否符合您的需求。5.货币转换 使用内置货币转换器,只需在 Google 搜索框中键入您需要完成的货币转换,并单击“回车”键或 Google Search 按钮即可。 示例:10新加坡元等于多少印度卢比 8人民币换成泰国的货币 6.计算器 Google 为用户提供了一个内置计算器。只需要在搜索字段中输入算式,按一下回车键或者搜索就可以了。做所有简单的计算,一些复杂的科学计算,单位换算

14、,以及提供各种物理常数。 例子:5+2*2 220 sqrt(-4) 一磅=?克 7.相关搜索 Google 能够提供与您原搜索相关的搜索词。这些相关的搜索词是根据过去Google所有用户的搜索习惯和Google提供的计算两个搜索词之间相关度的独家技术而产生出来的。这些相关的搜索词一般比原搜索词更常用。8.类似网页 单击“类似网页”时,Google侦察兵便开始寻找与这一网页相关的网页。Google侦察兵可以“一兵多用”。如果您对某一网站的内容很感兴趣,但又嫌资料不够,Google侦察兵会帮您找到其他有类似资料的网站。9.按链接搜索 有一些词后面加上冒号对 Google 具有特殊的含义。其中的一

15、个词是“link:”。查询 link: 显示所有指向该网址的网页。例如,“link:”将找出所有指向 Google 主页的网页。不能将 link: 搜索与普通关键词搜索结合使用。10.指定网域有一些词后面加上冒号对 Google 有特殊的含义。其中的一个词是“site:”。要在某个特定的域或站点中进行搜索,可以在 Google 搜索框中输入“site:”。11.手气不错 按下“手气不错”按钮将自动进入Google查询到的第一个网页。您将完全看不到其它的搜索结果。使用“手气不错”进行搜索表示用于搜索网页的时间较少而用于检查网页的时间较多。12.错别字改正 Google 的错别字改正软件系统会对输

16、入的关键词进行自动扫描, 它能提供相应提示来帮助纠正可能有的错别字。例如,搜索“互连网”,Google 会自动提示 “您是不是要找:互联网”。13.天气查询用Google查询中国城市地区的天气和天气预报。14.金融信息在搜索框中输入股票和基金的名称或代码, 可查询最新的股票和基金信息。15.邮编区号 查询邮政编码或长途电话区号,只需输入关键词(“邮编”,“yb” 和“YB” 任选其一;“区号”, “qh” 和“QH” 任选其一)和要查的城市地名或邮政编码或电话区号即可。16.手机号码查询手机电话号码归属地,直接输入要查的号码即可(不需要任何关键词)。17.农历日历转换 用Google 直接查询

17、农历日期、节气和农历节日,只需键入关键词(“阳历”、“公历”、“阴历”、“农历”或它们的拼音缩写 “gl”、“nl”)加上日期即可。也可以直接输入节气名称、农历节日名称,加上年份或“去年”,“今 年”,“明年”。18.定义要查看字词或词组的定义,只需键入“define”,接着键入一个空格,然后键入您需要其定义的词。如果 Google 在网络上找到了该字词或词组的定义,则会检索该信息并在搜索结果的顶部显示它们。 定义 HTMLGoogle的非主流功能:1、英语词典英语单词释义,如:define:information 即可从不同的在线资源中得到对information一词的解释。2、英语缩略词表

18、在 输入英语缩略词,即可查到全称及其释义。3、网页翻译 目前只支持将英语翻译成拉丁语、法语、西班牙语、德语和葡萄牙语。汉语为测试版。4、单词纠错 Google的纠错功能可以纠正输入不准确的英语单词,如:本想输入单词“Google”,因记忆不准误拼为“guugle”时,结果页面会提醒“您要找的会不会是: Google ”,来纠正拼写错误。5、繁简转换 中文繁简体自动转换是Google默认的功能,如果不希望转换,可在“使用偏好”中关掉该选项。 6、搜索结果过滤 进入英文Google的使用偏好(http:/www.G ),开启SafeSearch Filtering,即可过滤成人内容和不良信息。7、

19、目录检索 如果嫌关键词搜索内容庞杂,可以使用Google人工编制与维护的目录体系进行搜索。英文目录在http:/directory.G ,中文目录在http:/directory.G 。8、自动跟踪搜索结果 到9、查看搜索结果的相关度 登陆 10、查找美国电话号码在搜索框中输入“姓(姓首字母),名,城市名”或“姓(姓首字母),名,邮编)等即可出相应的电话号码。详见:11、查看美国街区地图在搜索框中输入街道地址、邮编、城镇或州名(一般仅输入街道地址和城镇名)便可搜索到该街区的地图。如“165 University Ave Palo Alto CA”。12、用数字查找相关信息在搜索框中输入美国专利

20、号(如:patent 5123123)、联邦通信委员会(FCC)ID号(如:fcc B4Z-34009-PIR)、联邦航空管理局(FAA)的飞机注册号(如:n199ua)、UPS联合包裹运送服务公司与联邦快递(FEDEX)的包裹号(如:1Z9999W999999999与fedex 999999999999)即可搜索到相关信息。13、查找商品与价格登陆 14、出行参考在搜索框中输入机场英文全称的三个字母代码和“airport”,可以查询机场航班延迟信息和即时天气状况,如查询San Francisco International Airport(旧金山国际机场),输入“sfo airport”。1

21、5、电话查询登陆 google返回的结果吗?如故对电话查询感兴趣的话,可登陆专门论坛:16、安装工具栏为方便使用google搜索,可到17、在浏览器之外使用Google到 下载 Google Deskbar,不用打开浏览器,也不必离开任何当前应用程序的情况下就可以立即用Google来搜索。18、反转镜像在19、懒汉秀其实是一款小玩具,进入20、彩蛋游戏21、主页风格展示 微软风格: MAC风格: Linux风格: FreeBSD风格:22、罕见“语言”入口克林冈语入口:政治入口:宗教入口:小猪入口:黑客专用入口:以上非主流功能,指英文google而言,有些是中文版没有的,其中大多具有实用价值,

22、少数(16、19-23)则是情趣性的“旁门左道”;有些是主流功能的补充延伸,一些是最新发布的外挂工具(17-18)。google的非主流功能是其形象特征的组成部分,而且这些所谓的非主流功能也在不断地增补和改进,如果没有这些非主流功能,google也就不成为其google了。二、XX XX(B,Inc)于1999年底成立于美国硅谷,它的创建者是资深信息检索技术专家、超链分析专利的唯一持有人XX总裁李彦宏,及其好友(在硅谷商界成功经验)的XX执行副总裁徐勇博士。XX在中国各地和美国均设有服务器,搜索范围涵盖了中国大陆、香港、台湾、澳门、新加坡等华语地区以及北美、欧洲的部分站点。三、一搜 一搜()是

23、雅虎公司基于全球领先的YST(Yahoo Search Technology)技术,在中国推出的独立搜索门户。一搜于2004年6月21日正式发布,具有简洁专业、海量(50亿网页,5.5亿图片,1000万音乐,网页搜索支持38种语言)、客观精准、国际化、稳定等特质,是值得依赖的专业搜索门户。四、中国搜索 2003年12月23日,刚刚上市的慧聪国际集团重拳出击,原慧聪搜索正式独立运做,成立了中国搜索,全力打造中文搜索第一品牌。五、搜狐搜索 搜狗是搜狐()推出的第三代互动式搜索引擎,在用户输入一个查询词后,尝试理解用户可能的查询意图,给出多个主题概念的搜索提示,通过人机交互过程,智能展开多组相关的主

24、题概念,引导用户更快速准确定位自己所关注的内容。六、英文Google 七、Yahoo 八、Ask Jeeves 九、AllTheW 十、HotBot 十一、中文元搜索引擎 1、万纬搜索 核心功能很弱,制作一般。 2、bbmao 国内唯一具有自动聚类功能的元搜索引擎,技术和功能上都比较强。十二、英文元搜索引擎vivisimo ( 1、DOGPILE 2、Ixquick 3、Mamma 4、One2seek 5、Savvysearch 6、Surfwax十三、其它专业搜索举例1、股票行情搜索-证券之星2、图像搜索-VisionNext3、地图搜索-图行天下 4、MP3搜索-搜刮网5、书目查询-We

25、bPac6、图书搜索-当当书店7、期刊论文搜索-中国期刊网8、标准搜索-中国标准咨询网9、企业产品搜索-阿里巴巴10、法律搜索-北大法律信息网11、医药搜索-37医学网4.5 检索实例1实例:介绍上海城市概况和近几年发展的材料经理让小王准备一份介绍上海城市概况和近几年发展的多媒体材料,打算为国外公司总部的同事们作报告之用。小王应该怎样在网上查找呢?(文字、图片、声音)小王以为很简单,他在Google搜索引擎中使用上海提问关键词进行了检索,结果怎样呢?小王一看,太多了。他想,再试试雅虎中国。他仍用上海这一提问,结果会使他满意吗? 小王有点不知所措了。经验一:网络资源搜索的第一步不是选择搜索引擎,

26、而是分析提问内容,提取提问表达式。发现大量的大学院校、医院等众多不需要的信息。经验二:搜索引擎提供布尔逻辑功能。Google、Yahoo中使用(上海-大学-医院)相关的网页很多,怎么办呢?经过仔细分析,他觉得他向国外公司总部的同事们介绍的内容应该为有关上海的一般性的介绍,使用上海和概况这两个关键词也许更切合提问主题。经验三:在分析提问内容时,需细化提问内容的主题,提取多个符合提问内容的关键词。经验四:如果想获得较为有效的检索结果,灵活巧妙地运用各个搜索引擎提供的高级检索功能则为首选之道。在Google的查询结果中,第一条命中记录就是直接反映“上海概况”主题的网页网址。在这里他发现了不少关于上海历史、地理、气候衣着等人文地理的资料。中文找到了,英文如何找?介绍上海情况的英文在哪?旅游?文字资源查找下载得差不多了,小王又开始寻思着查找一些图片了,他觉着他的报告或许应该有一些反映新旧上

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1