网络信息资源检索与利用.doc
《网络信息资源检索与利用.doc》由会员分享,可在线阅读,更多相关《网络信息资源检索与利用.doc(20页珍藏版)》请在冰豆网上搜索。
![网络信息资源检索与利用.doc](https://file1.bdocx.com/fileroot1/2022-10/20/f69c1e92-4f1b-4b12-8e81-479c74ba4e65/f69c1e92-4f1b-4b12-8e81-479c74ba4e651.gif)
课内实验报告
课程名:
网络信息资源检索与利用
任课教师:
程录庆
专业:
信息管理与信息系统
学号:
姓名:
二○一三至二○一四年度第2学期
南京邮电大学管理学院
《网络信息资源检索与利用》课程实验第1次实验报告
实验内容及基本要求:
实验项目名称:
网络基础知识
实验类型:
验证
每组人数:
1
实验内容及要求:
1.请写出多种查询本机IP地址的方法(数量和工具不限)。
2.学会在机房的计算机网络上使用FTP作文件的上传与下载。
FTP站点地址:
10。
20。
126。
5
用户名:
lab
口令:
空
3.请找到最简单的判断某机器的21端口是否打开的方法。
4.请用搜索引擎检索"网络融入生活"有关的话题,你知道如何将网络融入生活吗?
5.请找到人民日报的网络版本(图形版或文字版都是网络版),看看它都有些什么内容。
6.找到一个网络问卷调查网站,学会使用它发布问卷并且回收。
要求简明扼要的用文字和图表完成上述作业相关内容。
实验结果:
1.请写出多种查询本机IP地址的方法(数量和工具不限)。
(1)使用Ping命名查询IP
打开运行,输入cmd
进入命令窗口之后,输入:
ipconfig/all回车即可看到整个电脑的详细的IP配置信息
(2)使用网络状态查看IP地址
进入“网络和共享中心”,网络连接
2.学会在机房的计算机网络上使用FTP作文件的上传与下载。
FTP站点地址:
10。
20。
126。
5
用户名:
lab
口令:
空
如此下载
如此上传
3.请找到最简单的判断某机器的21端口是否打开的方法。
打开DOS命令提示符
查看有无打开21端口
4.网络融入生活
在生活中多使用网络做事,现在智能手机普及,比如我们在旅游时不用拿着厚厚一沓地图查看,用手机可以方便的查询地图并且精确的定位。
再比如我们不需要拿着厚重的书籍,使用电子书就够了。
在生活中多使用网络来简化生活,网络就会融入生活。
5.请找到人民日报的网络版本(图形版或文字版都是网络版),看看它都有些什么内容。
6.找到一个网络问卷调查网站,学会使用它发布问卷并且回收。
登陆问卷星,并创建一个问卷。
回收问卷。
《网络信息资源检索与利用》课程实验第2次实验报告
实验内容及基本要求:
实验项目名称:
网络搜索引擎的应用
实验类型:
验证
每组人数:
1
实验内容及要求:
1.请分别针对网络资源目录使用的分类方法进行举例。
2.在Bing的分类目录中分别找到一条路径指向网站:
中国新闻网及美国CNN。
3.在yahoo的分类目录中找到一条路径指向网站论文:
ctr.stanford.edu/Summer98/koumoutsakos.pdf。
4.在新浪网的分类目录中找到一条路径指向学校的网站:
5.选择元搜索引擎查询问题:
西方教育体系中有一种被称为“K-12”教育,请试查出全称是什么,代表何意?
6.请指出google,yahoo,sina,sohu的分类目录之间的异同和优劣(500字以内)
7.请了解google和baidu在进行关键词检索中语法的异同,并举例说明这两者在针对某一主题进行检索时检索结果的差异以及对检索意图理解准确度的差异。
8.搜索并了解主流的RSS订阅软件,完成用RSS在两个以上网站订阅两个以上专题。
实验结果:
1.请分别针对网络资源目录使用的分类方法进行举例。
A.套用图书分类法
如:
a.杜威十进分类法(DDC)
b.国际十进分类法(UDC)
c.国会图书馆分类法(LCC)
d.中国图书分类法
B.网站自行设计的分类法
如:
a.等级式主题分类法系统。
b.分面组配分类系统。
c.学科分类法系统。
2.在Bing的分类目录中分别找到一条路径指向网站:
中国新闻网及美国CNN。
3.在yahoo的分类目录中找到一条路径指向网站论文:
ctr.stanford.edu/Summer98/koumoutsakos.pdf。
在yahoo中搜索ctr.stanford.edu
进入斯坦福大学
进入1998年的summerprogram
查找koumoutsakos教授的文章
4.在新浪网的分类目录中找到一条路径指向学校的网站:
进入新浪网,选择教育专题
查找到南京邮电大学
点击右侧的“进入官网”
5.选择元搜索引擎查询问题:
西方教育体系中有一种被称为“K-12”教育,请试查出全称是什么,代表何意?
进入元搜索引擎dogpile
得出K-12教育为
K12或K-12,是kindergartenthroughtwelfthgrade的简写,是指从幼儿园(Kindergarten,通常5-6岁)到十二年级(grade12,通常17-18岁),这两个年纪是美国、澳大利亚及EnglishCanada的免费教育头尾的两个年纪,此外也可用作对基础教育阶段的通称。
6.请指出google,yahoo,sina,sohu的分类目录之间的异同和优劣
A.Google
作为全球最大的多语言搜索引擎,在国际上占有的市场越来越大,成为互联网最具潜力的企业,以下就介绍下GOOGLE搜索引擎的主要特点:
1.特有的PR技术,PR 能够对网页的重要性做出客观的评价。
PR是GOOGLE评价一个网站质量高低的重要标准,PR分为十个等级,从容不1至10,PR越高代表网站质量和权威性越高,排名也就越靠前。
2.更新和收录快,GOOGLE收录新站一般在十个工作日左右,是所有搜索引擎收录最快的,更新也比较稳定,一般一个星期都会有大的更新。
3.重视链接的文字描述和链接的质量,链接的文字描述也就是做链接用的文字,这个文字对GOOGLE排名起一定作用,因此我们建议如果网站要做某些关键词,在交换链接时要用这个关键词做链向你网站,链接的质量与链接网站的权威性和与你站是否相关有关,权威越高侧你站获得的排名越好, 4.重视Description描述,多次研究发现,那些在GOOGLE排名好的网站在描述中匀含有关键词,而且有些重复二次,因此可推断其对描述还是相当重视。
五、超文本匹配分析:
Google 的搜索引擎同时也分析网页内容。
并不采用单纯扫描基于网页的文本(网站发布商可以通过元标记控制这类文本)的方式,而是分析网页的全部内容以及字体、分区及每个文字精确位置等因素。
同时还会分析相邻网页的内容,以确保返回与用户查询最相关的结果。
B.Yahoo()
Yahoo 是世界上最著名的网络资源目录。
Yahoo的魅力,就在于它的可浏览式等级主题目录。
Yahoo按照主题建立分类索引,提供全面的分类体系结构,并结合高质量的检索软件,成为网络检索工具的佼佼者和等级式风络资源目录的典型代表。
Yahoo采用多标准高类、多维展开的方式,能够为某一信息源在其巨大的分类等级结构中提供不同的路径分支入口,保证了从不同的路径,为检索相同内容的不同用户提供服务。
对于交替类目,Yahoo利用了符号“@”来表示,起到了类似于相关参照的作用,能够指引用户由某一子类目进入Yahoo的浏览性等级结构的其他分支中。
C.新浪
作为首款中文智慧型互动搜索引擎,新浪搜索引擎突破了由GOOGLE、百度为代表的算法致胜的搜索模式。
它在保留了传统算法技术在常规网页搜索的强大功能外,以一个独有的互动问答平台弥补了传统算法技术在搜索界面上的智慧性和互动性的先天不足。
通过调动网民参与提问与回答,新浪搜索引擎能汇集千万网民的智慧,让用户彼此分享知识与经验。
为了使搜索结果更贴合网民的实际需要,新浪搜索引擎独创了“内容直达互动”的功能。
在网页搜索结果页面右侧,新浪特别开辟了“直达特区”。
如用户搜索“王菲”,在直达特区将出现王菲的照片、简介、歌曲下载,有关王菲的问题和答案;用户搜索“瘦身运动”时,将在直达区自动出现网民提出的与瘦身相关系列问题和答案,对用户的问题直接给出搜索结果。
D.搜狐()
搜狐的网络资源目录堪称是我国第一部系统的网站分类法,对其他中主文网络资源目录的发展起到了积极的促进作用。
搜狐网络资源目录的分类体系的编制,基本上坚持了在符合科学性原则的前提下,充分考虑网站资源和用户的查询习惯的原则。
在搜狐的分类体系结构中包括18个大类,涵盖了50000多个不同层次的子类目,形成了一个十分庞大的树状结构,几乎涉及所有的行业或者领域。
它采用了“纵向成枝、横向成网”、“主题法与分面组配法结合”的分类方式,根据网站的主题,首先把网站分为18个大类,再按细分主题层层分下去。
然后,再根据不同用户的使用习惯,以及不同的分类标准,把不同类目下“相关”的类目“链接”起来,从而形成搜狐的“网状”分类体系。
搜狐的网站分类法以主题分类为主设立了娱乐休闲、工商经济、电脑网络、分司企业、教育培训、文学、艺术、体育健身、新闻媒体、卫生健康、科学技术、生活服务、旅游交通、社会文化、政法军事、社会科学、个人主页17个大类,另外结合分面组配的方法设立“国家与地区”类目,把其他17个大类下的所有网站又按所属地域进行分类,因为大多数网站都具有地域性,也便于用户直接查找。
搜狐的网站资源目录同样是按照信息所属的类别,层层点击查找信息,所以用目录时首先要考虑清楚想要查找的信息属于哪个类别。
除此之外,搜狐作为一个综合性很强的搜索网站,还提供多项的检索功能。
搜狐提供强大的关键词检索功能,它采用的是百度的搜索引擎技术。
7.请了解google和baidu在进行关键词检索中语法的异同,并举例说明这两者在针对某一主题进行检索时检索结果的差异以及对检索意图理解准确度的差异。
百度搜索引擎使用了高性能的“网络蜘蛛”程序自动的在互联网中搜索信息,可定制、高扩展性的调度算法使得搜索器能在极短的时间内收集到最大数量的互联网信息。
百度搜索引擎的特点
1.基于字词结合的信息处理方式。
巧妙解决了中文信息的理解问题,极大地提高了搜索的准确性和查全率。
2. 支持主流的中文编码标准。
包括GBK(汉字内码扩展规范)、GB2312(简体)、BIG5(繁体),并且能够在不同的编码之间转换。
3.智能相关度算法。
采用了基于内容和基于超链分析相结合的方法进行相关度评价,能够客观分析网页所包含的信息,从而最大限度保证了检索结果相关性。
4.检索结果能标示丰富的网页属性(如标题、网址、时间、大小、编码、摘要等),并突出用户的查询串,便于用户判断是否阅读原文。
5.百度搜索支持二次检索(又称渐进检索或逼进检索)。
可在上次检索结果中继续检索,逐步缩小查找范围,直至达到最小、最准确的结果集。
利于用户更加方便地在海量信息中找到自己真正感兴趣的内容。
6.相关检索词智能推荐技术。
在用户第一次检索后,会提示相关的检索词,帮助用户查找更相关的结果,统计表明可以促进检索量提升10-20%。
7. 运用多线程技术、高效的搜索算法、稳定的UNIX平台、和本地化的服务器,保证了最快的响应速度。
百度搜索引擎在中国境内提供搜索服务,可大大缩短检索的响应时间(一个检索的平均响应时间小于0.5秒)
8.可以提供一周、二周、四周等多种服务方式。
可以在7天之内完成网页的更新,是目前更新时间最快、数据量最大的中文搜索引擎。
9.检索结