ImageVerifierCode 换一换
格式:DOCX , 页数:11 ,大小:421.69KB ,
资源ID:6521745      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/6521745.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(基于认知观的信息检索基础理论研究.docx)为本站会员(b****6)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

基于认知观的信息检索基础理论研究.docx

1、基于认知观的信息检索基础理论研究基于认知观的信息检索基础理论研究杨秀丹/李皓2012-11-12 14:26:21来源:图书情报工作(京)2010年24期【英文标题】On the Basic Theory of Information Retrieval Based on Cognitive Viewpoint【作者简介】杨秀丹,女,1970年生,教授,发表论文数10篇。河北大学管理学院保定071002李皓,男,1983年生,硕士研究生,发表论文3篇。河北大学管理学院保定071002【内容提要】对认知信息检索的德尔文的意义构建理论、贝尔金的ASK理论、威尔逊的信息行为模型、萨拉萨维克的认知相关

2、性层次模型、英格沃森的认知观和基于整合认知理论的信息检索模型等理论及模型分别进行评述,得出结论:基于整合认知理论信息检索具有较好发展前景,认知信息检索需要与系统导向和用户导向的信息检索不断融合,形成统一的认知信息检索系统。The paper mainly analyses and criticizes theories of cognitive field, including Dervins sense-making theory, Belkins ASK theory, Wilsons information behavior model, Saracevics multilevel co

3、gnitive relevance model, Ingwersens cognitive theory and integrated cognitive theory, and concludes that there is a better future for cognitive field and information retrieval research, user-based information retrieval and cognitive information retrieval need to be integrated together to form a unif

4、ied cognitive information retrieval system.【关 键 词】信息检索/认知范式/社会认知范式/整合认知理论Information retrieval; Cognitive paradigm; Social-cognitive paradigm; Integrated cognitive theory依据库恩(Kuhn)范式理论,贝尔金(Belkin)把情报学理论划分为物理范式和认知范式两大类。研究范式从系统驱动转向认知驱动意味着情报学对用户及其认知研究的深化。而信息检索作为情报学研究的核心内容之一,同样具有系统导向和用户认知导向两大发展阶段。情报学与信息

5、检索发展的历史证明,离开对用户的研究而仅仅依靠技术不可能最终解决用户信息需求和利用问题。认知范式从认知视角研究信息检索参加者(包括信息生产者、信息处理者、信息检索者及信息用户)的认知结构、信息行为及人机交互、情境、多元表示等。从1977年德梅(Marc de Mey)首次提出认知观(Cognitive Viewpoint)概念至今,出现了众多的需要进行梳理和总结的研究成果,本文在认知观理论发展脉络的基础上探讨信息检索用户和认知研究的相关问题,试图给出一个相对系统的描述和解释。1 认知信息检索的历史沿革1.1认知信息检索相关概念1.1.1认知观及认知信息检索认知科学认为,人类具有感知、认识外界的

6、认知能力,认知行为是人从外界环境获取信息、加工信息,调整自己行为适应环境的过程。认知理论应用到情报学(包括信息检索)领域即形成情报学(包括信息检索)的认知观。情报学中的认知观最早由德梅提出:“任何信息的处理,无论是知觉的或符号的,都是通过信息处理设备,由人的世界模型系统或概念体系实现的”1。对信息处理主体而言,德梅所说的概念体系是对世界的描述,即世界模型。世界模型由个人的认知结构组成,认知结构在特定情境中受到个人或组织的经验、教育等多种因素制约。德梅认知观提出后即受到福尔曼(Forhmann)、霍兰德(Hjorland)、泰迦(Taija)等学者的批评。泰迦指出,其缺陷在于缺乏宏观社会视角和信

7、息处理的社会文化背景,没有形成明确的问题概念化方法2。由此,在德梅认知观基础上融合社会认知维度形成社会认知观理论。社会认知观倾向于在社会文化、组织、工作任务情境中研究用户的认知结构、信息需求等方面。社会认知观代表人物为英格沃森(Ingwersen),他与贾维林(Jrvelin)等提出了认知信息检索的概念,继而在研究交互式认知信息检索模型之时提出多元表示准则(The Principle of Polyrepresentation),进一步深化和拓展了社会认知观的情境理论,并在此基础上提出整合认知理论的信息检索研究模型,进一步丰富了社会认知观的概念内容。认知信息检索发展历史并不长,目前还没有一个明

8、确的定义。本文认为,认知信息检索是认知观和社会认知观整合认知理论在信息检索中的应用,以认知科学方法研究信息检索者认知空间、信息检索系统的信息空间及交互界面,是与传统系统导向信息检索和用户导向信息检索相区别的检索范式。1.1.2相关性及情境相关性(relevance)是认知信息检索研究的基本概念之一。就目前的信息检索系统和行为而言,可简单认为,相关性主要是指检索系统针对用户的信息需求从文档集合中检出的文档与用户需求之间的一种匹配关系。关系、直觉、多维和动态是其特征。萨拉萨维克(Saracevic)以认知理论为基础提出信息检索相关性的5个层级:系统相关性、主题相关性、认知相关性、情境相关性、情感相

9、关性3。考斯金(Cosijn)和英格沃森从社会和组织的感知与策略方面分析相关性的维度4。尽管相关性研究有待深化,但可以说相关性研究推动了认知信息检索的发展。情境(context)是认知信息检索的另一个基本概念。认知信息检索研究把用户看作动态的变量,即用户是在其感知的工作任务和信息获取行为的情境中进行检索行为。情境是指包括检索者具有的知识结构、信息检索交互经验等内在的信息素养以及检索者所处时间、地点、社会文化、组织环境、工作任务等外部环境的集合。情境与检索所涉及的工作任务、动机、情感、偏好、系统以及领域相关,用户处在与其积累的经验、文化、组织等情境和当前检索交互的情境之中,产生认知层面的交互才是

10、有效的信息检索交互。因此,可以说情境是影响检索者认知行为和检索效果的重要外部变量。1.2系统导向、用户导向与认知信息检索的分野与融合英格沃森在其1992年出版的专著信息检索交互(Information Retrieval Interaction)中,把信息检索研究方法划分为三类:传统信息检索(即系统导向的信息检索)、用户导向的信息检索和信息检索交互的认知方法5,这三个方法也映射着信息检索发展的三个阶段。第一阶段,系统导向的信息检索是把用户需求作为常量,用户须按照系统的程序进行操作。它的核心要素是文本表征、系统对象和检索技术,形成严谨的信息检索系统,侧重于通过实验研究改进算法提高检索系统性能。系

11、统导向的信息检索将计算机技术与检索技术融合取得了丰盛的成果,仍然是目前人们生产和使用的主要信息检索产品,但在用户和相关性方面的深化上遇到瓶颈。第二阶段,用户导向的信息检索把用户由信息检索系统常量变为具有多种需求、信息行为的变量,从数理统计、社会调查等方法研究用户信息需求、查询和获取行为,代表人物有泰勒(Taylor)、霍温斯(Hewins)、斯宾克(Spink)等。第三阶段,认知导向的信息检索主要研究信息检索过程中用户认知行为、影响因素及检索模型。认知信息检索在某些方面带有浓厚的用户导向范式色彩,但多数情报学家认为用户导向的信息检索与认知信息检索在研究内容和方法上存在区别。用户导向的信息检索是

12、把用户作为客观对象,而认知导向的信息检索则是把用户作为信息吸收和利用的主体。当然,认知导向与系统导向、用户导向的信息检索并不是完全割裂的,而是发展和继承的关系;同时,前者也不可能取代后者,在信息检索系统实际应用中三者应该是相互融合的,共同促进信息检索系统检索效率和质量的提高。1.3认知信息检索的理论研究历程正如前文所述,信息检索发展初期主要以系统观为核心,到20世纪70年代,人们认识到系统观存在“过分关注系统,而缺乏用户研究”6的缺陷,系统导向的信息检索需要寻找新的突破口。与此同时,认知科学迅速兴起并被引入到情报学,给信息检索带来新的生机,产生了基于认知观的信息检索。本文认为,认知信息检索的理

13、论研究经历了三次较为明显的历史阶段:认知观形成、认知观发展成熟、社会认知观和整合认知理论兴起阶段。认知观形成阶段是指认知心理学应用于信息检索研究中的初始阶段。此时,认知观处于萌芽状态。1977年德梅、1978年贝尔金分别从认知角度分析信息的概念,德尔文(Dervin)以信息使用为核心提出意义构建理论等。可以说20世纪70年代是认知信息检索的理论研究的起始阶段,最大的贡献是将系统导向的信息检索中用户需求作为常量的假设转变为变量的假设。20世纪80年代是认知观发展成熟时期。此时,德梅、德尔文、布鲁克斯(Brookes)、贝尔金、英格沃森等众多学者进一步丰富和发展在形成阶段提出的认知观理论,取得了一

14、大批有影响的研究成果。认知观逐渐走向成熟,对于信息检索的影响为提出相关性、情境等概念,进一步深化用户作为变量的属性研究。20世纪90年代进入社会认知观和整合认知理论阶段。认知观研究从个体信息行为转向社会整体信息传递过程。1995年霍兰德(Hjorland)和阿尔布兰森(Albrechtsen)发表领域分析:情报学的新起点,引入领域分析方法并以其作为社会认知方法的基础7。英格沃森在前人研究基础上提出将认知信息检索与系统导向信息检索进行融合的整合认知理论,推动认知观及社会认知观理论在信息检索理论研究与系统实现中的应用。2 基于认知观的信息检索主要理论认知信息检索是情报学认知观理论的应用领域之一。德

15、梅的认知观概念为认知信息检索提供了基本假设:信息检索过程存在交互作用,信息传递与接受都存在知识结构的变化,并以改善知识结构为目标。信息检索的实质是用户认知结构的改善。下面针对相关理论和模型分别进行分析。2.1德尔文的意义构建理论特定情境中的需求是用户信息检索行为产生的驱动力,而信息问题的解决需要进行意义的构建。1972年,德尔文等提出意义构建理论(Sense Making Theory)8。德尔文重点研究信息利用中用户的“意义构建”过程,建立“特定情境(时空)认知差异信息使用”三阶段模式,可以描述为:用户信息需求存在于某一特定时空范围内,用户信息查找行为是在特定情境中进行的,断层是信息行为构建

16、的意义即信息问题,需要建立沟通的桥梁才能出现满足用户需求的结果。如图1所示: 图1德尔文的意义构建理论德尔文主张用意义构建方法研究和理解用户、构建满足用户信息需求的系统。她的观点在20世纪末期不断发展,结合数据收集和分析技术,形成了对用户信息活动整体理解的比较成熟的理论,是推动认知信息检索的发展的最初理论基础。2.2贝尔金的ASK理论信息检索研究离不开对用户知识状态、信息需求及其关系的研究。用户知识状态是贝尔金的重要研究方向,他于1982年提出“知识非常态理论”(Anomalous State of Knowledge,ASK),认为检索者的信息需求产生的原因是认为自身存在着知识非常态,但通常

17、检索者不能准确描述这种状态9,即用户的知识结构与其信息需求之间存在“鸿沟”,正因如此用户无法准确查找到其所需要的信息。ASK理论认为信息需求是产生认知不确定性的原因。根据ASK理论,为了解用户知识状态,需要研究用户所处的情境(包括知识背景、经验等),加强与用户的沟通。ASK理论在认知观发展中具有承上启下的理论作用,是认知信息检索的理论基础之一。2.3威尔逊的信息行为模型研究认知信息检索必须考虑到用户的信息行为。信息行为是与人类信息来源和渠道相关的主动或被动行为。20世纪80-90年代,英国学者威尔逊(Wilson)提出多个信息查找和检索行为模型。其中1996年的信息行为模型较具代表性,如图2所

18、示10:图2 威尔逊信息行为模型信息行为模型的核心是信息需求和信息获取行为,实际上是用户针对信息需求的问题解决模型。人的行为离不开特定时空的情境,情境是人类信息需求产生的背景和环境。信息需求产生后,激发机制导致信息查询、利用行为,同时信息行为受到中介变量的影响。威尔逊在模型中提出了中介变量、激发机制、信息查找行为的概念,对用户信息检索行为的发生过程与机理具有较好的解释作用。其中,中介变量是指影响特定情境中个人的信息需求的变量,如心理方面、人口方面、人际关系和环境方面的影响要素。激发机制包含两个阶段:信息用户由于特定情境产生信息需求,在工作、生活情境压力下是否产生信息查找行为;在中介变量的影响下

19、权衡内在风险回报、追求自我实现的心理努力,最终在中介变量影响与激发机制作用下产生信息查找行为。信息查找行为包括注意和检索两种行为,而检索则经历被动检索、主动检索和持续检索三个不同层次。查找得到的信息被用户使用,并反馈到情境中。2.4萨拉萨维克的相关性层级模型萨拉萨维克认为,信息检索的发展方向应该是在穆尔斯(Mooers)信息检索基础上增加用户交互和情境因素3,并研究提出信息检索相关性的5个维度,分别是系统、主题、认知、情境和情感。其中,系统相关性通过算法实现,揭示查询请求与系统中信息标引的匹配程度;主题相关性揭示查询的主题与检出文献的主题间的关系;认知相关性揭示用户知识状态和信息需要与检索到的

20、文献的关系;情境相关性揭示环境、任务、问题域与系统检出文本之间的关系;情感相关性则揭示用户的意图、目的和动机和系统检索到的文本间的关系。相关性5个层级的划分实质上为基于认知观的信息检索系统设计指明了方向和最高的标准信息检索系统要满足用户认知需求,促进用户认知改善。相关性的5个层级之间存在由系统导向到认知导向程度之间的递进关系,如图3所示:图3 萨拉萨维克提出的相关性层级也就是说系统相关性是相关性最低层级,也是最低要求;认知相关性、情境相关性和情感相关性是信息检索评价的高层,更深入检索者认知心理需求。在系统实现方面,传统的信息检索系统基本上是利用布尔模型、概率模型和向量空间模型等算法实现的,实质

21、是按照关键词词频确定权重进行词的字面匹配运算,只能完成系统相关性要求。对于主题相关性,采用关键词匹配的一些系统也可以部分实现,但由于标引等问题,关键词的匹配并不意味着主题相关性,也不意味着认知相关性及以上层次的相关性。因此,实践中,信息检索相关性问题仅仅在最底层的相关性层次得到实现,认知、情境与情感相关性并没有得到很好解决。2.5英格沃森的认知观理论英格沃森认知理论受到布鲁克斯知识方程和贝尔金ASK理论的影响,其理论贡献主要体现在如下方面:潜在信息(Potential Information,PI)。英格沃森在信息检索交互中引入“潜在信息”概念。PI是信息理解与交流过程中产生的新信息,对信息接

22、收者(包括处于不确定状态的信息接收者)的认知是潜在的。英格沃森在布鲁克斯知识方程的基础上提出新的认知方程:PII+K(S)K(S+S)PI该方程假设信息接收者感知潜在信息。其中,PI是信息接收者对I的感知,I受到真实的知识状态(包括问题域和不确定性状态)K(S)影响。上述作用将K(S)转化为新的知识状态K(S+S)。知识状态转变创造的信息对其他信息接受者是新的潜在信息PI。五维度。英格沃森在贝尔金指出的情报学5个领域基础上提出5个维度的概念,包括处理正式信息与非正式信息的交流、社会内部及个人信息需求的产生和发展、信息系统研究方法和技术、知识创造和信息系统表达方式、相关性和信息价值五个领域,如图

23、4所示(5个领域分别用数字表示):图4 英格沃森5维度模型提出五维度的英格沃森已经开始关注用户信息需求产生与外界的关系以及信息检索交互过程中用户所处的不同社会内部环境的影响。认知信息检索交互模型。1996年,英格沃森形成认知信息检索交互理论11,他在信息检索交互的认知观:认知理论的要素一文中引入信息空间多元表示概念。多元表示概念描述用户当前的信息需求、问题状态与领域工作任务或兴趣结构之间的因果关系。信息检索中全部交互活动和信息查找都可以视为认知过程,认知行为在全部信息处理要素中均有体现。英格沃森在特德(Turtle)和克劳夫特(Croft)信息空间网络模型的基础上整合用户认知空间的描述和界面功

24、能,建立了如图5所示的多元表示的全局模型。信息检索多元表示全局模型由3部分构成:用户的认知空间、系统的信息空间和用户查询的交互界面。用户认知空间的多元表示要素垂直排列、自下到上显示了信息需求产生的原因及过程。认知空间的多元表示包含用户认知结构、检索交互经验、知识状态、问题域、信息需求等方面。图5 信息检索多元表示全局模型2.6霍兰德的领域分析框架1995年,丹麦学者霍兰德与阿尔布兰森为解决认知观中社会维度缺失的问题,将领域分析方法引入进来,并把领域分析范式作为学科的基本理论7。领域分析方法主要是从社会角度理解用户信息需求、行业或学科的信息系统功能。霍兰德认为领域分析是一个认识论的框架,是知识组

25、织、知识结构、合作模式、语言交流形式、信息系统和相关性标准在社会信息交流及其角色中的反应。2002年,霍兰德描述了领域分析的11种方法12,主要包括文献规则和主题,分类,信息标引,经验用户知识,文献计量,信息结构和服务的历史研究,文献类型研究,不同范式、假设的认识论和批判研究,语言和知识领域研究,交流结果和机构知识研究,认知、知识表示研究等。可以说,领域分析方法将信息作为一种社会现象,以社会研究方法结合领域分析方法研究信息需求、处理和利用问题。2.7整合认知理论2005年,英格沃森和贾维林在转折:情境中的信息查询与检索中对传统认知观进行修正,提出整体认知理论(Holistic Cognitiv

26、e Theory)的概念13。2008年,他们在论信息检索的整合认知理论中在扩展系统导向信息检索模型的同时,把整体认知理论改为整合认知理论(Integrated Cognitive Theory)14。整合认知理论是在系统导向的信息检索界面基础上增加社会文化、组织情境,用户信息检索是在特定的信息查找、工作任务过程、与工作相关或不相关的情境中进行的,在图6左侧的2个要素中体现:图6 英格沃森信息检索整合框架信息处理发生在信源与信宿之间的不同水平上,认知参加者的信息交流受到过去和现在的经验及社会、组织、文化环境影响。因此,信息传递和交流总是在特定情境中的进行的。在信息检索整合框架的6个要素中,认知

27、参加者要素可以细分为:参加者类型、感知的工作任务、感知的检索认知3个子要素。这样,图6的信息检索整合框架增加至9个维度。这9个维度可以分为3类:社会组织任务维度(包括自然工作任务维、自然检索任务维2个维度)、参加者维度(包括参加者特征维、感知工作任务维、感知检索任务维、文献维4个维度)、算法维度(包括算法搜索引擎维、算法接口维、获取和交互维3个维度)。该框架实际上是认知信息检索与系统导向信息检索的整合,为基于认知理论的信息检索系统研究提供理论依据。3 基于整合认知理论的信息检索系统基于整合认知理论的信息检索系统是以计算机为物质基础,利用认知理论设计具有智能化检索功能的人机交互检索系统。这样的信

28、息检索系统具有更加符合用户认知行为特征、与用户信息需求相关度更高、用户为中心、人机交互等优势,对信息检索系统理论研究、开发与设计、用户服务等具有重要的指导价值。近年来,信息检索出现很多新的发展趋势,如跨语言信息检索、语义信息检索、基于本体的检索等,但是多数的信息检索系统仍然利用传统信息检索模型,即布尔模型、向量空间模型和概率模型及其改进模型作为算法基础。其中向量空间模型在系统导向的信息检索系统中占据主导地位。可以说系统导向的信息检索并没有退出信息检索实践领域,相反仍然占据信息检索系统的核心领域;认知信息检索理论和模型仍处于发展的初期。但也应看到,认知观理论给情报学、信息检索理论研究提供新的角度

29、,揭示出信息检索绝对不仅是一种简单的物理或机械式的匹配活动,更需要从用户认知视角建立整合认知理论的信息检索模型。而且,随着认知科学、人工智能和专家系统的发展,存在突破系统范式真正建立认知检索系统的可能和具体的实现方案。整合认知信息检索系统的实现需要长期的发展过程。目前的突破是在系统导向信息检索模型基础上,在模型设计、系统构建、检索交互中增加认知维度和社会认知维度的情境要素。英格沃森提出的嵌入情境和评估标准的信息检索模型,可以看做是整合认知理论信息检索模型的雏形,如图7所示:图7 嵌入情境的信息检索模型信息用户在特定的社会组织文化情境、工作任务情境、查找任务中根据特定的工作任务或兴趣,并针对特定

30、的信息检索情境进行信息查找和获取行为。该信息检索模型实际上是整合认知信息检索与系统导向信息检索模型的综合,是基于认知观的信息检索模型系统实现的初步尝试。4 结论和展望信息检索的最高目标是支持人类通过更好地获取信息而完成特定的工作任务。认知理论为信息检索发展提供了新的思路和方法。由于认知信息检索理论引入检索者认知变量并具有人性价值理念的优势,更加符合人类信息检索行为认知过程的实际情况,因此认知信息检索具有良好的发展前景。但是,不可否认,认知信息检索系统尚处于理论观念的革新和系统模型构建阶段。未来认知信息检索的发展,还需要与系统主导信息检索系统模型进行融合,才能真正实现认知信息检索模型在实际系统中

31、的应用。【参考文献】1Mey M D. The cognitive viewpoint: Its development and its scope. International Workshop on the Cognitive Viewpoint. Ghent: Ghent University, 1977.2Talja S. Constituting information and user as research objects. 2010-04-15. http:/www.uta.fi/lisaka/ConstitutingFTP.htm.3Saracevic T. Information Science. Journal of the American Society for Information Science, 1999,50(12):1051-1063.4Cosijn E, Ingwersen P. Dimensi

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1