互联网推荐系统比较研究.docx

资源描述

互联网推荐系统比较研究.docx

《互联网推荐系统比较研究.docx》由会员分享，可在线阅读，更多相关《互联网推荐系统比较研究.docx（14页珍藏版）》请在冰豆网上搜索。

互联网推荐系统比较研究.docx

互联网推荐系统比较研究

互联网规模和覆盖面的迅速增长带来了信息超载（informationoverload）的问题:

过量信息同时呈现使得用户无法从中获取对自己有用的部分,信息使用效率反而降低.现有的很多网络应用,比如门户网站、搜索引擎和专业数据索引本质上都是帮助用户过滤信息的手段.然而这些工具只满足主流需求,没有个性化的考虑,仍然无法很好地解决信息超载的问题.推荐系统（recommendersystem）作为一种信息过滤的重要手段,是当前解决信息超载问题的非常有潜力的方法.推荐系统与以搜索引擎为代表的信息检索（informationretrieval）系统最大的区别在于:

1）搜索注重结果（如网页）之间的关系和排序,推荐还研究用户模型（userprofile）和用户的喜好,基于社会网络（socialnetwork）进行个性化的计算（personalization）;2）搜索的进行由用户主导,包括输入查询词和选择结果,结果不好用户会修改查询再次搜索.而推荐是由系统主导用户的浏览顺序,引导用户发现需要的结果.高质量的推荐系统会使用户对该系统产生依赖.因此,推荐系统不仅能够为用户提供个性化的服务,而且能够与用户建立长期稳定的关系,提高用户忠诚度,防止用户流失.

推荐系统最典型的应用是在B2C电子商务领域,具有良好的发展和应用前景,商家根据用户的兴趣、爱好推荐顾客可能感兴趣或满意的商品（如书籍、音像等）.顾客的需求通常是不明确的、模糊的,如果商家能够把满足用户模糊需求的商品推荐给用户,就可以把用户的潜在需求转化为现实需求,从而达到提高产品销售量的目的.目前,几乎所有的大型电子商务系统,如Amazon,eBay等,都不同程度地使用了各种形式的推荐系统.其中Amazon研究电子商务的推荐系统长达10年时间.各种提供个性化服务的Web站点,如电影、音乐网站,也需要推荐系统的大力支持.表1中按照应用领域分类列举了一些典型的商用推荐系统.

Table1Mainstreamcommercializedrecommendersystems

表1主流的商用推荐系统一览表

在学术界,自20世纪90年代中期出现第一批关于协同过滤的文章以来,推荐系统在电子商务、网络经济学和人类社会学等领域一直保持很高的研究热度并逐渐成为一门独立的学科.各种推荐算法涵盖包括认知科学、近似性理论、信息检索、管理科学、市场营销建模等在内的众多研究领域.近几年来,国际学术界针对计算机网络信息整合的推荐相关的研究大量出现:

1）ACM设立推荐系统年会（ACMrecommendersystems）;2）计算机领域的人机交互、数据挖掘和机器学习顶级会议（SIGCHI,KDD,SIGIR,WWW等）中,推荐算法的文章逐年增加;3）国际数据分析领域的高阶期刊（如IEEETrans.onKnowledgeandDataEngineering,ACMTrans.onInformationSystem等）刊载数篇推荐系统方面的文章.信息领域做推荐系统领先的研究单位（学者）包括:

纽约大学（AlexanderTuzhilin）、明尼苏达州立大学的GroupLens研究小组（JosephA.Konstan,JohnRiedl等）、美国密歇根大学（PaulResnick）、卡内基梅隆大学（JaimeCallan）、微软研究院（RyenW.White）等.其中,美国密歇大学在2006年开授了由PaulResnick主讲的推荐系统的课程.推荐系统,结合社会网络和语义网络的研究,面向互联网发展中出现的新问题和新技术需求,具有广泛的研究和应用前景.

本研究调研了推荐系统在计算机网络和信息领域的主流研究与应用进展.本文第1节中给出推荐系统的形式化定义.第2节根据推荐算法的类别分类陈述最新的学术进展.第3节讨论使用的数据集以及实验评测方法,对当前推荐系统的研究难点进行归纳并对比各种推荐方法的优、缺点.第4节对推荐系统有待深入的研究点和发展趋势进行初步预测.

1　推荐系统概念和形式化定义

目前被广泛引用的推荐系统的非形式化概念是Resnick和Varian在1997年给出的:

"它是利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程".推荐有3个组成要素:

推荐候选对象、用户、推荐方法。

通用的推荐系统模型流程如图1所示.用户可以向推荐系统主动提供个人偏好信息或推荐请求,或者用户不提供,而是推荐系统主动采集.推荐系统可以使用不同的推荐策略进行推荐,如将采集到的个性化信息和对象数据进行计算得到推荐结果,或者直接基于已建模的知识数据库进行推荐.推荐系统将推荐结果返回给用户使用.

此外,文献[7]给出了推荐系统的形式化定义:

设C是所有用户（user）的集合,S是所有可以推荐给用户的对象（object）的集合.实际中,C和S集合的规模通常很大,如上百万的顾客以及上亿种歌曲等.设效用函数u（）可以计算对象s对用户c的推荐度（如提供商的可靠性（vendorreliability）和产品的可得性（productavailability）等）,即u:

C*S?

R,R是一定范围内的全序的非负实数,推荐要研究的问题就是找到推荐度R最大的那些对象s*,如式

（1）.

用户和对象的度量与采样可以使用不同的属性和特征,这根据实际面对的问题不同而不同.推荐算法研究的中心问题是效用度u的计算,并非遍历整个C*S的整个空间,而是分布到一个流形子空间（manifold）上.对于某个数据集而言,必须先对u进行外推（extrapolation）,也就是说,对象必须具备用户以前作的评分（rating）,未评定（unrated）的对象的评分必须先根据已标注的对象进行标注外推后才可以使用.各类推荐算法在外推和评分预测（ratingpropagation）上采用了不同的策略,设计了不同的效用函数,这些将在下一节中分类介绍.

2　现有的推荐算法

推荐算法是整个推荐系统中最核心和关键的部分,在很大程度上决定了推荐系统类型和性能的优劣.目前,对推荐系统的分类并没有统一的标准,很多学者从不同角度对推荐方法进行了不同的划分.但主流的推荐方法基本包括以下几种:

基于内容推荐、协同过滤推荐、基于知识推荐和组合推荐.本节我们将分类讨论推荐算法的研究成果,下一节我们将讨论这几类推荐算法各自的优、缺点和推荐系统研究的重点、难点问题.

2.1　基于内容的推荐

基于内容的推荐（content-basedrecommendation）是指根据用户选择的对象,推荐其他类似属性的对象作为推荐,属于Schafer划分中的Item-to-ItemCorrelation方法.这类算法源于一般的信息检索方法.不需要依据用户对对象的评价意见.对象使用通过特征提取方法得到的对象内容特征来表示,系统基于用户所评价对象的特征,学习用户的兴趣,从而考察用户资料与待预测项目相匹配的程度.

对象内容特征（Content（s））的选取在目前的研究中以对象的文字描述为主,比如信息检索中最经典的文本特征是词频-倒排文档频率（termfrequency-inversedocumentfrequency,简称TF-IDF）.另一方面,用户的资料模型ContentBasedProfile（c）取决于所用机器学习方法,常用的有决策树、贝叶斯分类算法、神经网络、基于向量的表示方法等,数据挖掘领域的众多算法都可以应用.结合对象内容特征和用户资料模型,最终的效用函数可以定义为：

Score的计算有不同的方法,比如使用最简单的向量夹角余弦的距离计算方法:

最后得到的u数值用于排序对象,将最靠前的若干个对象作为推荐.

基于内容推荐的其他研究还包括自适应过滤和阈值设定等,前者关注如何通过不断到来的对象增量地计算ContentBasedProfile（c）,使其更加准确;后者研究用户查询文字和对象特征的匹配方法,从而更精确地计算Content（c）.

2.2　协同过滤推荐

协同过滤推荐（collaborativefilteringrecommendation）技术是推荐系统中最为成功的技术之一,它于20世纪90年代开始研究并促进了整个推荐系统研究的繁荣.大量论文和研究都属于这个类别.

协同过滤的基本思想是:

找到与当前用户ccur相似（比如兴趣和口味相似）的其他用户cj,计算对象s对于用户的效用值u（cj,s）,利用效用值对所有s进行排序或者加权等操作,找到最适合ccur的对象s*.其基本思想非常易于理解,在日常生活中,我们往往会利用好朋友的推荐来进行一些选择.协同过滤正是把这一思想运用到推荐系统中来,即基于其他用户对某一内容的评价向目标用户进行推荐.

基于协同过滤的推荐系统可以说是从用户的角度进行推荐的,并且是自动的,也就是说,用户所获得的推荐是系统从用户购买或浏览等行为中隐式获得的,不需要用户主动去查找适合自己兴趣的推荐信息,如填写一些调查表格等.其另外一个优点是对推荐对象没有特殊的要求（而基于内容的推荐需要对推荐对象进行特征分析）,能够处理非结构化的复杂对象,如音乐、电影等.同时,研究用户之间的关系需要大量的用户访问行为的历史数据,与社会网络研究有交叉点,有丰富的研究基础和广阔的前景.对协同过滤最早的研究有Grundysystem,后来的研究成果包括Tapestrysystem,GroupLens,Ringo,PHOAKSsystem,Jestersystem]等.总体而言,此类推荐算法可以分为两类:

启发式（heuristic-basedormemory-based）方法和基于模型（model-based）的方法.

1）　启发式方法

启发式方法的基本思想是使用与新用户c相似的用户c′对一个对象s的评价来预测s对新用户c的效用,进而判断是否推荐s给c.显然,启发式方法的研究主要包括两点:

（1）计算用户之间的相似度;

（2）对所有与用户c相似的用户c′对对象s的评分进行聚合计算,以得到s对新用户c的效用的统计预测方法.

在用户相似度sim（c,c′）这个研究点上,主流的思路是根据用户对同一对象的评分的差异来判断用户兴趣的相似性.评分属于用户的浏览历史行为,可以是打分、观看次数、停留时间等.最基本的两种计算sim（c,c′）的方法是基于关联的（correlation-based）和基于余弦距离的（cosine-based）方法.基于关联的方法研究用户c和c′共同评分过的所有对象的评分相似度来计算关联.而基于余弦距离的方法直接把评分作为向量来计算余弦距离,进而得到用户相似度.

统计预测方法的计算公式可以形式化地表示如下:

之前的研究设计了很多计算aggr的启发式函数,几个比较典型的例子是:

这3类aggr函数都是利用以前用户的评价和用户之间的相似度来启发式地计算效用值.其中,式（5）是最简单的形式;式（6）简单地引入用户相似度加权,是应用最广的方法;考虑到不同的用户在不同情况下作的评分可能有不同的尺度,式（7）提出进行平均归一化的操作以消除这种尺度影响.

除了这两个研究点之外,近年来一些学者同时也发展了其他启发式方法,以提高启发式推荐的性能,如缺省投票（defaultvoting）、用户倒排评分（inverseuserrequency）、实例扩展（caseamplification）和主流加权预测（weighted-majorityprediction）等.

2）　基于模型的方法

这类方法利用用户c对众多对象的评分来学习一个c的模型（model）,然后使用概率方法对新的对象s的推荐效用进行预测.文献[7]对这种方法的形式化描述如式（8）所示:

这样,基于模型的方法把一个用户归类到一种模型下或者一个类型中.其他的算法还包括利用机器学习方法和统计模型、贝叶斯模型、概率相关模型、线性回归模型和最大熵模型.Shani在文献中还把推荐选择看作序列决策问题（sequentialdecisionproblem）,使用马尔可夫决策过程方法（Markovdecisionprocesses）加以解决.图模型方法,包括概率隐形语义分析（probabilisticlatentsemanticanalysis）和LDA（latentdirichletallocation）,也应用于协同过滤推荐算法的研究.

2.3　基于知识的推荐

基于知识的推荐（knowledge-basedrecommendation）在某种程度上可以看成是一种推理（inference）技术.它不是建立在用户需要和偏好基础上推荐的,而是利用针对特定领域制定规则（rule）来进行基于规则和实例的推理（case-basedreasoning）.例如,文献[34]中利用饭店的菜式方面的效用知识,推荐饭店给顾客.效用知识（functionalknowledge）是一种关于一个对象如何满足某一特定用户的知识,因而能够解释需求和推荐的关系,用于推荐系统.效用知识在推荐系统中必须以机器可读的方式存在（ontology本体知识库）,例如quickstepandfoxtrotsystems使用关于学术论文主题的ontology本体知识库向读者作推荐.

2.4　组合推荐

组合推荐（hybridrecommendation）的一个最重要原则就是通过组合后应能避免或弥补各自推荐技术的弱点（见第3.4节）.研究和应用最多的是内容推荐和协同过滤推荐的组合.尽管从理论上有很多种推荐组合方法,但不同的组合思路适用于不同的应用场景.我们将研究人员提出的组合思路大致分为如下3类:

1）后融合:

融合两种或两种以上的推荐方法各自产生的推荐结果.如使用基于内容的方法和协同过滤方法分别得到推荐列表,融合列表的结果决定最后推荐的对象.

2）中融合:

以一种推荐方法为框架,融合另一种推荐方法.如以基于内容的方法为框架,融合协同过滤的方法,或者以协同过滤的方法为框架,融合基于内容的方法.

3）前融合:

直接融合各种推荐方法.如将基于内容和协同过滤的方法整合到一个统一的框架模型下.

2.4.1　后融合组合推荐

在后融合组合推荐中,最简单的做法就是分别用基于内容的方法和协同过滤推荐方法去产生一个推荐预测结果,然后用某种方法组合其结果.文献[37]使用了评分结果的线性组合,而文献[38]使用了投票机制来组合这些推荐结果.除此之外,也可以分别考察两个推荐列表,判断使用其中的哪个推荐结果.比如,Daily　Learnersystem计算推荐结果的可信度,然后选择一个列表的结果.这种结果层次上的融合我们称为后融合组合推荐.

2.4.2　中融合组合推荐

目前,中融合的组合推荐主要有两种,以基于内容的方法为框架,融合协同过滤的方法和以协同过滤的方法为框架,融合基于内容的方法.前者利用降维技术把基于内容的对象特征进行精简化.例如,文献[40]使用了LSI（latentsemanticindexing）算法,在基于内容的框架中使用精化的用户特征向量.后者为了克服协同过滤的稀疏问题（详见第3.3节）,把用户当作对象,使用基于内容的特征提取方法把用户本身的特征（如年龄、工作情况等人口统计学特征（demographicfeatures））使用到相似度计算中,而不是仅仅依赖用户的点击行为.Good等人在文献[41]中引入多种不同的用户描述符来归类用户,挖掘用户的内在联系,从而得到更好的推荐效果.文献[42]使用独立的基于内容的特征来补偿用户提供的简单的rating,也属于此类方法.

2.4.3　前融合组合推荐

近年来,这类推荐方法最受学者的关注.在文献[36]中,研究者把用户的年龄和电影的类型放到一个统一的分类器中训练学习.另外一种方法使用了贝叶斯混合效果回归模型,并通过马尔可夫蒙特卡洛方法得到这个模型的参数.文献[43]将用户和对象的特征都放到一个统计模型下来计算效用函数,研究者使用用户属性z、对象属性w及其交互关系（如选择关系）x来计算效用r.对象j对于用户i的效用值rij计算式可以表示为

这其中的3种正态分布的变量分别用于描述数据的噪声、用户属性的异质性和对象属性的异质性.式（9）表述效用值是由这几个因素共同决定的.这3种分布的3个参数由马尔可夫蒙特卡洛方法估算得到.

近年来,一些方法比较的工作讨论并实验了各种方法与组合策略,得出结论:

组合策略能够取得比纯基于内容或协同过滤方法更好的效果.这种在方法层次上融合的方法我们称为前融合组合推荐.

3　推荐系统的重点、难点问题和主流算法对比

3.1　推荐系统的评测标准数据集

推荐系统学术研究常用的数据集包括:

1）　MovieLens

MovieLens数据集中,用户对自己看过的电影进行评分,分值为1~5.MovieLens包括两个不同大小的库,适用于不同规模的算法.小规模的库是943个独立用户对1682部电影作的10000次评分的数据;大规模的库是6040个独立用户对3900部电影作的大约100万次评分.

2）　EachMovie

HP/Compaq的DEC研究中心曾经在网上架设统关闭了一段时间,其数据作为研究用途对外公布,MovieLens的部分数据就是来自于这个数据集的.这EachMovie电影推荐系统对公众开放.之后,这个推荐系个数据集有72916个用户对1628部电影进行的2811983次评分.早期大量的协同过滤的研究工作都是基于这个数据集的.2004年HP重新开放EachMovie,这个数据集就不提供公开下载了.

3）　BookCrossing

这个数据集是网上的Book-Crossing图书社区的278858个用户对271379本书进行的评分,包括显式和隐式的评分.这些用户的年龄等人口统计学属性（demographicfeature）都以匿名的形式保存并供分析.这个数据集是由Cai-NicolasZiegler使用爬虫程序在2004年从Book-Crossing图书社区上采集的.

4）　JesterJoke

JesterJoke是一个网上推荐和分享笑话的网站.这个数据集有73496个用户对100个笑话作的410万次评分.评分范围是-10~10的连续实数.这些数据是由加州大学伯克利分校的KenGoldberg公布的.

5）　Netflix

这个数据集来自于电影租赁网址Netflix的数据库.Netflix于2005年底公布此数据集并设立百万美元的奖金（Netflixprize）,征集能够使其推荐系统性能上升10%的推荐算法和架构.这个数据集包含了480189个匿名用户对大约17770部电影作的大约10亿次评分.

6）　UsenetNewsgroups

这个数据集包括20个新闻组的用户浏览数据.最新的应用是在KDD2007上的论文.新闻组的内容和讨论的话题包括计算机技术、摩托车、篮球、政治等.用户们对这些话题进行评价和反馈.

7）　UCI知识库

UCI知识库是Blake等人在1998年开放的一个用于机器学习和评测的数据库,其中存储大量用于模型训练的标注样本,在文献[49]中被用于推荐系统的性能测试数据.

3.2　推荐系统的性能评测方法

推荐系统的性能指标一般有推荐的效果/精确度（effectiveness）和推荐的效率（efficiency）,使用的指标有meanabsoluteerror（MAE）,rootmeansquarederror（RMSE）和correlation.由于不同的研究工作针对不同的问题,使用不同的数据集,所以具体评测方法变化很大.比较普遍的评测方法来自于机器学习等领域的一般方法,比如数据集被分割为训练集（probeset）和测试集（quizset）.推荐算法的模型在训练集上进行学习和参数调整,然后在测试集合上计算精确度和运行效率,从而达到评测目的.文献[23]使用两种评测方法来比较几种协同过滤的算法性能,第1种评测得到每次推荐绝对误差的平均值,第2种评测计算整个推荐列表的推荐精度.

3.3　推荐系统的重点、难点问题

随着近年来对推荐系统研究的开展,很多研究中的重点、难点问题得到研究者的关注和共识,主要包括:

1）　特征提取问题

虽然在信息检索中,文本等对象特征的提取技术已经很成熟,但是推荐系统的对象不一定具有文本特征或者文本不足以作为描述,此时特征的选择出现了问题.尤其是网络上广泛存在的多媒体数据如音乐、视频、图像等,自动化的特征提取方法需要结合多媒体内容分析领域的相关技术.另一个问题是特征的区分性问题,大规模数据情况下不同对象的特征错配会影响系统性能.

2）　模型过拟合问题（可扩展性问题）

推荐系统中推荐算法无法完全掌握用户每个方面的兴趣和需求,因为用户之前没有对足够多类别的对象进行评价.过拟合现象是指系统推荐给用户的对象与用户刚刚看过的不是太相似,就是太不相关.模型过拟合（过学习）的问题本质上来自于数据的不完备性,这在实际应用中是无法完全避免的.在信息检索领域这类问题广泛存在,解决的主要方法是引入随机性,使算法收敛到全局最优或者逼近全局最优.随机方法包括遗传算法等.DailyLearner相关的文献[15,39]针对这个问题考察了被推荐的对象的相关性（relevant）和冗余性（redundancy）,认为被推荐的对象首先不能与用户看过的对象重复（冗余）,其次必须有相关性以相互联系.推荐的多样性是必不可缺的.

3）　新用户问题

系统没有存储或者存储很少新用户的信息,包括查看对象的历史记录和新用户对对象的评分,基于模型的方法无法获得训练数据而基于规则的方法难以进行推理.近期一些研究特别针对这个问题提出了解决方法.文献[52,53]利用对象熵（entropy）、受欢迎程度（popularity）、用户个性属性等来改进效果.

4）　新对象问题

新用户和新对象问题都属于冷启动问题.在推荐系统尤其是协同过滤系统中,新对象加入数据库后必须等待一段时间才有用户查看并进行评价（点击、打分、评论等都是评价的手段）.在评价达到一定数量之前无法对此对象进行分析和推荐.不同于新用户问题,这类问题一般考虑使用组合推荐的方法来应对.

5）　稀疏问题

在任何大型的推荐系统中,对于一个用户,总有大量的对象没有经过用户的评价或者查看,而且这类数据常常比已经有此用户评价的数据量更大.用户之间由于选择的差异性非常大造成稀疏情况,即任意两个用户的评分差别都非常大.文献[38]提出初步的解决方法,将用户的年龄、国籍、性别等个人信息增加作为用户相似度计算的根据,称为基于人口统计学的过滤方法（demographicfiltering）.文献[26,54]使用主分量分析（SVD）降维方法尝试把稀疏的关系矩阵降维到低维,以得到用户之间潜在的关系.

3.4　各类推荐方法的对比

各类推荐方法都有其各自的优、缺点,针对不同的数据集,效果也有所不同.每种方法因为算法本身的特征可能不适合在所有数据集上作推荐.如在基于内容的推荐方法中,自动化的特征提取方法很难应用于多媒体数据,即使在容易提取特征的文本数据的情况下,也无法仅仅通过词频统计的方式区分文档质量.除此之外,为用户推荐的内容仅限于与该用户曾经选择的对象相似的对象,结果多样性差.而对于没有选择过任何对象的新用户,推荐尤其困难.协同过滤的方法从某种程度上克服了基于内容方法自动化程度低、推荐结果不丰富等弊端.但是,协同过滤是基于大量历史数据集的,因而存在稀

展开阅读全文