ImageVerifierCode 换一换
格式:PPT , 页数:64 ,大小:3.90MB ,
资源ID:13128705      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/13128705.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(第六章信息检索PPT格式课件下载.ppt)为本站会员(wj)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

第六章信息检索PPT格式课件下载.ppt

1、将信息素材按学科或事物性质系统地加以排列。主题排检技术:以规范化的自然语言为标识符号来标引信息内容的排检技术时序排检技术:按时间的顺序组合信息素材的技术,多用于编制年表、年谱等检索工具。地序排检技术:按一定时期的行政区域来排列信息素材的技术。,36,6.3.1 手工信息检索的技术与方法,3、手工信息检索方法顺查法:一种以信息检索课题起始年代为起点,按时间顺序由远而近地查找信息的方法。倒查法:一种逆时间顺序由近而远地查找信息的方法抽查法:一种针对研究课题发展的特点,抓住学科发展迅速、发表文献较多的年代进行查找的方法。追溯法:又叫回溯法,是以某一篇文献末尾所附参考文献的线索进行追溯查找。循环法:先

2、用检索工具查出一批文献,然后再利用这些文献末尾所附参考文献的线索进行追溯查找的方法。,37,6.3.2机械信息检索技术与方法,机电信息检索系统 继手检穿孔卡片之后,出现了机检穿孔卡片和选卡机。这就形成了机电信息检索系统。光电信息检索系统 主要是以缩微胶卷(片)检索方式出现的。缩微胶卷(片)的检索方式大致可以分为两种类型:(1)寻址检索方式(2)编码检索方式,38,6.3.3计算机信息检索技术与方法,一、联机信息检索信息用户利用终端设备,通过通讯网络与世界各地的信息检索系统联机,进行人机对话,从检索系统的数据库中查找出用户所需信息的全过程。优点:检索速度快;检索范围广而全面;检索途径多、质量高;

3、检索内容新、实时性强;检索辅助功能完善、使用方便,检索结果输出方式灵活、实用。缺陷:主机负担重,一旦出现故障,则整个网络都将瘫痪;信息组织方式以线性为主,不够灵活;联机检索不像Internet是面向最终用户的,操作也没有后者方便。,39,6.3.3计算机信息检索技术与方法,联机信息检索系统的结构:由检索服务机构、国际通讯网络及终端三部分构成。联机信息检索的技术原理:一个典型的计算机信息系统,能完成数据收集、分析、加工处理、存储、传递通信和检索信息的全过程。联机信息检索的服务方式:a、定题信息提供b、专题回溯检索c、联机订购原文d、电子邮件,40,6.3.3计算机信息检索技术与方法,(二)光盘信

4、息检索特点:使用光盘检索系统,可免联系检索系统所必须使用的电讯设备,节省了电讯费和联机系统使用费,还可免除由通信线路传输过程中所造成的失误。光盘系统向用户提供相当于联机信息检索系统功能的软件。光盘存储容量大、耐用、复制费用低如果光盘数据库量不够多,则信息资源就显得有限,购买大量光盘数据库,又受到经费限制。光盘检索不如联机检索系统,因为光盘只能定期提供。数据库费用大,41,6.3.3计算机信息检索技术与方法,(二)光盘信息检索光盘信息检索系统由微机、驱动器及连接设备、CD ROM数据库(光盘)及其检索软件构成。选在驱动器时主要考虑以下性能:a 速度:一般在185ms-500ms之间b 查找速度:

5、一般在250ms-400ms之间c 数据缓冲区越大,可直接从存储器存取的数据就越多,节省查询时间d 数据传送速度:有单速、双速乃至40倍以上的驱动器。,42,6.3.3计算机信息检索技术与方法,(三)网络信息检索特点:信息量更大需要处理各种不同的语言(大多是自然语言)信息检索的范围更宽(多学科、多领域)信息检索的时效性要求更高检全率较高,而检准率较低,43,6.3.4 信息检索技术演进,信息检索是一个具有浓重技术色彩的研究领域,其技术经历了快速而巨大的演变和进步;检索对象:结构化书目信息无结构化或半结构化全文文本多媒体信息信息组织方式:传统的线性文本组织超文本/超媒体组织检索匹配技术:关键词(

6、字面)匹配基于概念匹配概念语义匹配与推理检索方式:手工检索计算机化联机实时网络检索环境:单机网络平台,集中网络分布式网络,44,6.3.5 大型综合性检索系统,大型综合性检索系统:中国知识基础设施工程(CNKI,http:/);万方数据资源系统(http:维普资讯有限公司数据库系统;中国高等教育文献保障系统CALIS(http:/);联机检索系统Dialog(http:联机计算机图书馆中心OCLC(http:/www.oclc.org);,45,46,47,48,49,50,常用的大型数据库:中国人民大学书报资料中心复印报刊资料全文数据库;国家科技图书文献中心(NSTL)数据库(http:北京

7、文献服务处(BDS)全文信息检索系统(http:上海市图书馆全国报刊索引数据库;ProQuest系统全文数据库(http:/,51,常用的大型数据库:/,52,6.4 搜索引擎,搜索引擎(Search Engine)搜索引擎是提供给用户进行关键词、词组或自然语言检索的工具,简言之,就是一种在互联网上查找信息的工具。工作的基本原理是:用户提出检索要求,搜索引起代替用户在数据库中进行检索,并将检索结果反馈给用户。检索的结果:www上的主页、新闻组中的文章、软件的存放地址及作者、企业网站、个人主页等。,53,6.4.1 搜索引擎的发展阶段,第一代:根据词频搜索的原理开发第二代:“超链分析”技术第三代

8、:以竞价排名商业模式为特征下一代:社区化搜素“知识共享社区+搜索引擎”,54,6.4.1 搜索引擎的发展阶段,(1)基于web内容特征的排序技术 主要考虑用户所查询的关键词在结果网页中的出现的频率和出现的位置等因素,并以此来评价命中网页与用户查询请求之间的相关度大小,作为排序依据。,55,6.4.1 搜索引擎的发展阶段,56,6.4.1 搜索引擎的发展阶段,(2)基于网页链接结构的排序技术 最早出现在1998年,主要根据网页被链接或被引用的情况来判断页面信息的权威性和质量,以此来优化对搜索结果的排序,如Google中的PageRank算法。,57,58,59,60,(3)通过关键词竞价的排名搜索,引擎通过将关键词拍卖,让网站或网页所有者对其价格进行竞争的办法来产生搜索结果的排序,61,6.4.1 搜索引擎的发展阶段,(4)基于知识共享的社区化搜索 机器搜索社区搜索 百度知道 雅虎知识堂 新浪爱问,62,63,64,

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1