毕业设计软件使用说明书WEB上基于内容的搜索引擎.docx
《毕业设计软件使用说明书WEB上基于内容的搜索引擎.docx》由会员分享,可在线阅读,更多相关《毕业设计软件使用说明书WEB上基于内容的搜索引擎.docx(15页珍藏版)》请在冰豆网上搜索。
![毕业设计软件使用说明书WEB上基于内容的搜索引擎.docx](https://file1.bdocx.com/fileroot1/2022-12/7/4d35f422-13aa-4a36-8261-9b8e9b28155d/4d35f422-13aa-4a36-8261-9b8e9b28155d1.gif)
毕业设计软件使用说明书WEB上基于内容的搜索引擎
WEB上基于内容的搜索引擎
软件使用说明书
系别名称:
专业班级:
学生姓名:
指导教师:
目录
第1章环境要求1
1.1数据库环境要求1
1.1.1硬件要求1
1.1.2软件要求1
1.1.3Internet要求2
1.1.4网络软件要求3
1.2Tomcat环境要求3
1.3JDK环境要求3
第2章数据库安装及配置4
2.1数据库系统安装4
2.1.1系统安装4
2.1.2SP4安装4
2.2配置6
2.2.1系统管理员账号配置6
2.2.2信息系统数据库配置7
第3章Java环境安装与配置8
3.1Java环境安装8
3.2Java环境配置8
第4章WEB服务器(Tomcat)安装与配置10
4.1安装10
4.2配置10
第5章系统使用说明11
5.1网页抓取11
5.2主界面12
5.3查询结果12
第1章环境要求
1.1数据库环境要求
本系统数据库采用Microsoft公司大型关系数据库SQLServer2000企业版+SP4;WEB服务器采用Tomcat6.0,运行环境需要SunJavaJDK1.5以上。
1.1.1硬件要求
表1-1说明安装MicrosoftSQLServer2000或SQLServer客户端管理工具和库的硬件要求。
表1-1硬件要求
硬件
最低要求
计算机
Intel®或兼容机
Pentium166MHz或更高。
内存(RAM)1
企业版:
至少64MB,建议128MB或更多
硬盘空间
数据库引擎要求有95到270MB可用硬盘空间;典型安装要求有250MB可用空间。
AnalysisServices最小安装要求有50MB可用硬盘空间;典型安装要求有130MB可用空间。
EnglishQuery要求有80MB可用硬盘空间。
监视器
VGA或更高分辨率SQLServer图形工具要求800x600或更高分辨率
指针设备
Microsoft鼠标或兼容的指针设备
CD-ROM驱动器
需要
1.根据操作系统的要求,可能需要额外的内存。
2.实际的要求因系统配置和选择安装的应用程序和功能的不同而异。
1.1.2软件要求
表1-2SQLServer2000软件环境要求说明为使用MicrosoftSQLServer2000企业版本或组件而必须安装的操作系统。
表1-2SQLServer2000软件环境要求
SQLServer2000版本或组件
操作系统要求
企业版
WindowsServer2003,标准版1
WindowsServer2003,企业版1
WindowsServer2003,Datacenter版1
Windows2000Server
Windows2000AdvancedServer
Windows2000DatacenterServer
MicrosoftWindowsNTServer4.0ServicePack5
WindowsNTServer4.0SP5或更高版本(企业版)
客户端工具支持
Windows953/98/Me
WindowsNTWorkstation4.0
Windows2000Professional
WindowsXPProfessional
WindowsXPHomeEdition
WindowsServer2003,标准版1
WindowsServer2003,企业版1
WindowsServer2003,Datacenter版1
UNIX、AppleMacintosh和OS/2客户端需要第三方厂商提供的开放式数据库连接(ODBC)客户端软件。
仅连接
Windows95
Windows98
WindowsMe
WindowsNTWorkstation4.0
Windows2000(所有版本)
WindowsXPProfessional
WindowsXPHomeEdition
WindowsServer2003,标准版1
WindowsServer2003,企业版1
WindowsServer2003,Datacenter版1
1.WindowsServer2003要求应用SQLServer2000ServicePack3或更高版本。
2.SQLServer2000个人版用于桌面和移动环境。
个人版未包含标准版的全部功能。
像联机分析处理(OLAP)、数据挖掘和其他数据仓库功能等AnalysisServices包括在个人版中,但这些功能不能在Windows98或WindowsMe上安装。
3.仅在客户端连接中支持;不包括图形工具支持。
1.1.3Internet要求
表1-3说明与使用MicrosoftSQLServer2000相关的Internet要求。
表1-3SQLServer2000Internet环境要求
组件
要求
Internet软件
MicrosoftSQLServer2000所有安装都需要MicrosoftInternetExplorer5.0。
Microsoft管理控制台(MMC)和HTML帮助也需要MicrosoftInternetExplorer5.0。
最小安装已足够,而且InternetExplorer不必是默认浏览器。
InternetExplorer5.0要求的例外情况:
如果使用"仅连接"选项而且不连接到要求加密的服务器,则带ServicePack2的MicrosoftInternetExplorer4.01就足够了。
1.1.4网络软件要求
MicrosoftWindowsXP、Windows2000、Windows98、Windows95、WindowsMe和WindowsNT都具有内置网络软件。
只有在使用BanyanVINES或AppleTalkADSP时,才需要其它网络软件。
NovelNetWareIPX/SPX客户端支持由Windows网络的NWLink协议提供。
1.2Tomcat环境要求
在本系统中,要求微软Windows操作系统、SunJDK环境。
1.3JDK环境要求
在本系统中,MicrosoftWindows操作系统。
第2章数据库安装及配置
本系统数据库采用Microsoft公司大型关系数据库SQLServer2000企业版+SP4。
2.1数据库系统安装
本章介绍MicrosoftSQLServer2000中文企业版的安装与配置情况。
2.1.1系统安装
在系统满足MicrosoftSQLServer2000中文企业版的系统软件、硬件要求环境的基础上,可以实施安装。
将MicrosoftSQLServer2000安装盘放入光驱
如果没有自动安装请双击光盘根目录中的Autorun.exe选择安装SQLServer2000组件。
如图2-1所示。
在图2-1中,选择“安装SQLServer2000组件”按照提示信息进行安装。
图2-1SQLServer2000第一个安装界面
安装过程结束后,还需要对数据库系统进行配置,并进行补丁的修补。
这些内容可以参见以后的各个章节说明。
2.1.2SP4安装
由于MicrosoftSQLServer2000数据库管理系统推出时间较长,系统发现一些漏洞,为了保证系统数据库的安全,建议用户必须尽快进行补丁修补。
目前,微软提供的最新补丁为SP4。
下再地址为:
下载后文件名为:
SQL2000-KB884525-SP4-x86-CHS.EXE。
安装时,首先运行此文件,首先出现如图2-2所示画面。
在图2-2中,需要选择补丁文件的解压路径。
在选择好合适的解压路径后,按照提示要求,选取【下一步】,继续安装过程。
图2-2选择文件解压路径
注:
在SP4安装完成后,如图2-3所示。
要尽快重新启动计算机,使得所作的补丁生效。
图2-3安装完毕
2.2配置
在数据库系统安装全部完毕后,需要对数据库进行各种配置。
2.2.1系统管理员账号配置
管理员账号是对数据库管理操作的最大权限用户,其安全性是极其重要的。
管理员账号的修改试用企业管理器。
在【开始】菜单上,选取【程序】、【MicrosoftSQLServer】、【企业管理器】,如图2-4所示,启动企业管理器,出现如图2-5所示窗口。
在图2-5中,选择【SQLServer组】-〉【数据库服务器】,打开当前数据库服务器。
接着,在如图2-5所示的窗口中选择【安全性】-〉【登录】。
图2-4启动企业管理器
图2-5选择服务器
在如图2-5所在窗口中,选择管理员用户【sa】,并单击鼠标右键,选择【属性】,出现如图2-6所示窗口输入新的密码,并【确定】,就更改了管理员的密码。
图2-6密码修改
2.2.2信息系统数据库配置
在系统交付使用时,提供的是一个完整的数据库,将这个数据库添加到实际使用环境中,需要在数据库服务器上利用企业管理器将这个数据库添加到数据库系统中。
添加信息系统数据库的方法是在如图2-5所示的画面中,选中【SQLServer组】-〉【〈数据库服务名〉】,并单击鼠标右键,选中【所有任务】-〉【附加数据库】,出现如图2-7所示的窗口。
选择【
】,选择数据库文件名“db_BlodMay_Data.MDF”,单击【确定】,之后,若系统正确的附加了数据库,完成数据库的配置。
若出现错误信息,可参见错误提示,进行改正,再附加此数据库。
图2-7附加新数据库
第3章Java环境安装与配置
Java是SunSoftware公司提出的一种面向对象的程序设计语言,由于其具有跨平台的特点,得到了广泛的应用。
在本系统中,需要安装SunJava5版以上(设计环境为J2SEDevelopmentKit5.0Update5中文版,简称JDK5)。
此软件环境可以从Sun的Java网站免费下载。
3.1Java环境安装
本系统介绍的为J2SEDevelopmentKit5.0Update7中文版安装过程。
安装程序名为:
jdk-1_5_0_07-windows-i586-p.exe。
从文件名中可以看出,其适用于Windows操作系统。
双击如上安装程序,启动安装界面,如图3-1所示。
在稍后的时间后,会出现准备安装界面。
在准备安装界面后出现Sun公司对本软件的许可证协议窗口,在此界面中选择“我接受该协议许可协议中的条款”,并点击【下一步】按钮,开始自定义安装过程。
在安装过程中,按照提示信息进行相关的操作。
图3-1JDK5安装向导
在图3-1所示的安装过程完成后,选择【下一步】,出现jre安装窗口,可以选择自己jre路径,也可按照默认的路径进行安装。
Jre安装完毕,出现浏览器注册窗口,一般选择默认浏览器即可,直接选择【下一步】,继续安装。
接着出现复制文件窗口,安装文件复制完成后,提示安装完毕。
单击【完成】,则完成整个的Java安装。
3.2Java环境配置
一般情况下(特别是新安装的操作系统)不需要对Java环境做出额外的设置,但有些情况下需要的环境变量进行设置。
为了稳妥起见,建议在安装JDK后,进行环境变量的配置。
JDK设置主要有三部分:
JAVA_HOME、PATH、CLASSPATH。
设置方法为在桌面上选择“我的电脑”,单击鼠标右键,选择【属性】,出现系统属性设置的窗口。
在此窗口中,选择“高级”页-〉【环境变量】,选择【系统变量】-〉【新建】,在图3-2中的变量名位置填入“JAVA_HOME”,变量值位置填入JAVASDK安装的路径。
采用同样的方法,在变量名位置输入“CLASSPATH”,变量值输入“.;%JAVA_HOME%\lib;%JAVA_HOME%\jre\lib;”如图3-3所示。
再选择【系统变量】-〉path-〉【编辑】,如图3-4所示,在变量值的最前面插入“%JAVA_HOME%\bin;”。
完成以上设置,则将JAVA的环境配置完成了,请选择【确定】按钮,保存此设置,返回到设置前的窗口状态。
图3-2JAVA_HOME设置
图3-3CLASSPATH设置
图3-4PATH设置
第4章WEB服务器(Tomcat)安装与配置
Tomcat软件是一个开源项目,可以从Tomcat网站免费下载。
本系统由于采用JDK及J2EE最新技术,需要5.5以上版本支持。
本系统在现场首次安装时,将采用Tomcat6.0版本。
其可以从Apache网站下载。
下载时,需要注意的是选择Windows平台支持的相应包。
Tomcat软件包有两个安装版本,一个为安装程序型,一个为ZIP压缩文件型。
4.1安装
在信息管理系统服务器中,对于压缩文件型Tomcat软件包,可以直接解压到某一个文件夹中,如“d:
\tomcat60”中,若安装文件型,则执行相应的安装文件,并选择合适的路径安装。
注:
信息管理系统在首次现场调试安装时默认的安装路径为“D:
\apache-tomcat-6.0”。
如图4-1所示。
4.2配置
在Tomcat系统安装完毕后,其对外提供的WEB服务端口默认为“8080”,为了系统中使用的方便性,将8080端口更改为80端口。
更改的方法为用文本编辑器打开如图4-1所示的server.xml文件,找到“图4-1Tomcat安装路径与配置
第5章系统使用说明
所有环境配置好以后,将光盘中的程序拷入到Tomcat下,如D:
\apache-tomcat-6.0\webapps下。
启动Tomcat服务器,D:
\apache-tomcat-6.0\bin\startup.bat。
启动SQLserver2000服务器。
5.1网页抓取
网页抓取是通过系统后台管理来实现的。
网页抓取主要有三个方面:
搜集新出现的网页;搜集上次出现有所改变的网页;发现上次发现现在不存在的网页,并从库中删除。
网页的抓取需要进入系统后台管理进行。
步骤如下。
打开浏览器,在地址栏中输入“http:
//localhost:
8080/luceneSearch/admin/index.jsp”,系统会进入登陆界面,在本系统中系统管理员的用户名为“admin”,密码为“111”,登陆后台管理界实现网页的抓取和和保存。
后台管理界面如图5-1所示。
图5-1登录页面
选择“导航菜单”下的爬虫配置,选择右边导航“爬虫管理”,填写相应信息。
在“网页抓取种子”后输入所要抓取的网页地址,如“”,设置好网页保存的目录以及索引存放目录,其他默认。
按“抓取网页”按钮。
如果中途想暂停抓取请点“暂停抓取”按钮即可。
查看当前抓取的所有网页地址,请点击导航菜单中的“网址管理”下的“查看网址”选线即可。
5.2主界面
完成网页抓取和保存的工作后,就可以进入搜索界面进行搜索了。
进入搜索界面请打开浏览器,在地址栏中输入“http:
//localhost:
8080/luceneSearch/index.jsp”。
前台搜索结果提供类似XX和Google的效果,实现了网页内容摘要、关键字的高亮显示、网页的URL信息、分页、以及网页的简单快照等功能。
输入关键字,点击“搜索一下”按钮即可进行查询。
搜索界面如图5-2所示。
图5-2搜索界面
5.3查询结果
当用户输入查询关键字以后,查询结果变会返回给用户。
查询结果显示了分页、网页快照、URL导航、内容摘要、中文分词,以及相关搜索等。
查询结果界面如图5-3所示。
图5-14后台企业页面