电子商务推荐系统的研究与实现.docx

上传人:b****8 文档编号:10244169 上传时间:2023-02-09 格式:DOCX 页数:86 大小:68.52KB
下载 相关 举报
电子商务推荐系统的研究与实现.docx_第1页
第1页 / 共86页
电子商务推荐系统的研究与实现.docx_第2页
第2页 / 共86页
电子商务推荐系统的研究与实现.docx_第3页
第3页 / 共86页
电子商务推荐系统的研究与实现.docx_第4页
第4页 / 共86页
电子商务推荐系统的研究与实现.docx_第5页
第5页 / 共86页
点击查看更多>>
下载资源
资源描述

电子商务推荐系统的研究与实现.docx

《电子商务推荐系统的研究与实现.docx》由会员分享,可在线阅读,更多相关《电子商务推荐系统的研究与实现.docx(86页珍藏版)》请在冰豆网上搜索。

电子商务推荐系统的研究与实现.docx

电子商务推荐系统的研究与实现

天津大学

硕士学位论文

电子商务推荐系统的研究与实现

姓名:

盖亮

申请学位级别:

硕士

专业:

计算机应用技术

指导教师:

冯志勇

20061201中文摘要

随着电子商务应用的不断扩大,个性化服务也得到越来越多的重视,大量的

商务软件产品都声称支持个性化。

电子商务推荐系统是智能信息服务的体现,它

能够在了解用户的短期和长期需求的基础上对用户定制信息的搜索和发送机制,

并向用户有针对性的推荐商品。

现有的推荐方法暴露出数据稀疏性问题,冷开始

问题以及推荐质量低下等问题,这些问题使得当前的普通推荐系统不能准确的挖

掘用户的兴趣,并将其最感兴趣的商品提供给用户。

本文提出一种集成语义信息的新型推荐方法,该方法提出建立商品的语义关

联模型,该模型的结构通过一个行业语义信息训练中心的训练得到,最终产品的

语义信息被提取出来集成到现有的基于项目的协同过滤方法中。

该方法利用了协

同过滤技术的利用其他用户的行为来提高信息的广度和精确度的特点,同时融合

了语义过滤技术深层挖掘用户隐含兴趣的优点。

本文利用RDF形式的本体来表达

商品信息以及用户偏好信息,并设计了一种基于决策树的用户语义偏好模型,该

模型基于商品行业离线建立,在线应用,定期更新,增强了推荐系统的实时性能。

在上述工作的基础上,设计和开发了集成语义信息的电子商务推荐系统。

系统基于B/S模式,为客户和系统管理员提供了一系列的浏览和操作。

结果显示

该系统的集成语义推荐比已有的各种推荐系统更加符合现实世界中的个性化推

荐,它能够深层次挖掘用户兴趣迎合用户偏好,很大程度上克服了推荐质量低下

的问题。

关键词:

推荐系统协同过滤语义关联模型用户偏好RDFABSTRACT

W‰theadventureofE-commerceapplications,personalizationhasassumedall

enormousindustrialimpact,whichhascausedtheappearanceofamenagerieof

commercialproducts,claimingsupporttothepersonalizationprocess.Personalization

demonstratesthepotentialofintelligentinformationservicesthatarecapableof

automaticallylearningabouttheshortandlongtermneedsofusers,andof

customizingthesearchanddeliveryofinformationtotheseusers.Current

recommendationmethodsexposesomequalityproblems,suchasDataSparsity

problemandNew-Itemproblem,theseproblemsmakeordinaryrecommendation

systemscannotmineusers’interestsandprovidemostproperitemstothem.

Inthispaper,wedescribeanewrecommendationmethod,inthismethod,a

productSemanticRelevanceModelissetup,thestructureofthismodelisacquired

bythetrainingofanIndustrySemanticTrainingCenter,finallysemanticinformation

thatextractedfromproductsisintegratedwithcurrentItem-BasedCollaborative

Filteringapproach.ThemethodmakesUSeofcharacteristicofItem-Based

CollaborativeFilteringapproach,whichimprovestheextensionandprecisionof

recommendationinformationthroughbehaviorsofotherUSers,andcombines

SemanticFilteringapproach,whichcandeeplymineusers’connotativeinterests.In

thispaper,productinformationanduserpreferenceinformationaredemonstratedin

RDFforms,andanewuserSemanticPreferenceModelwhichisbasedondecision

treeisdesigned,themodelissetupoff-line,appliedon-line,updatedperiodicly,which

improvessystemrealtimeperformanceeffectively.

Finally,weimplementtherecommendationalgrithems,designanddevelopan

E-commerceRecommendationSystemofIntegratedSemanticInformation,whichis

basedonB/SpaRemandprovidesaseriesofoperationstOusersandadministrators.

KEYWORDS:

RecommendationSystem,CollaborativeFiltering,Semantic

RelevanceModel,UserPrefefence,RDF独创性声明

本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的

研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他入已经发表

或撰写过的研究成果,也不包含为获得叁鲞基茎或其他教育机构的学位或证

书而使用过的材料。

与我一同工作的同志对本研究所做的任何贡献均已在论文中

作了明确的说明并表示了谢意。

学位论文作者签名:

缔签字日期:

年月日

学位论文版权使用授权书

本学位论文作者完全了解..苤姿盘堂有关保窖、使用学位论文的规定。

特授权墨鲞基堂:

.可以将学位论文的全部或部分内容编入有关数据库进行检

索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。

同意学校

向国家有关都门或机构送交论文的复印侔和磁盘。

f保密的学位论文在解密后适用本授权说明)

学位论文作者签名:

姿苏导师签名:

签字日期:

Z川年二月l臼签字日期:

≯刁年工月f日第一章绪论

1.1研究背景

第一章绪论

随着Internet和电子商务的迅速发展,人们能够获得的信息越来越多,这

一方面为我们的决策提供了更多的信息参考,但同时由于太多的信息量,用户花

费在检索信息上的时间也更多了。

为适应信息量急剧增加,迫切需要相应信息检

一索技术产生。

特别是在电子商务的虚拟环境下,由于供应链和物流的发展,商家在网上所

能提供的商品种类和数量非常之多,但用户不可能通过一个小小的计算机屏幕一

眼就知道感兴趣的商品。

通常来说,用户既不愿意花太多时间漫无边际在网上寻

·找自己想要的商品,也不可能像在物理环境下那样检查商品的质量。

在这种情况

下,用户就很希望电子商务系统能够具有一种类似采购助手的功能,可以根据用

户的兴趣爱好自动地推荐给每个用户他们可能感兴趣而且满意的商品。

在这种情况下,电子商务个性化推荐系统(PersonalizedRecommendation

SystemforE-Commerce)应运而生。

电子商务个性化推荐技术,尤其是协同过滤

技术,构成了现有电子商务个性化推荐系统的基础。

在这里,之所以强调个性化,

是因为需要推荐系统能为每个用户推荐适合他们偏好和兴趣的产品,而不是千篇

一律的推荐。

电子商务推荐系统具有良好的发展和应用前景。

目前,几乎所有大型的电子

商务系统,如Amazon,CDNOW,eBay,dangdang等,都不同程度的使用了各种形

式的推荐系统。

各种提供个性化服务的Web站点也需要推荐系统的大力支持.在

日趋激烈的竞争环境下,电子商务推荐系统能有效保留用户,提高电子商务系统

的销售。

成功的电子商务推荐系统将会产生巨大的经济效益。

1.2电子商务推荐系统的研究内容与研究现状

’1.2.1研究内容

电子商务推荐系统的研究内容和研究方向主要包括Ⅲ嘲.

1).推荐技术研究:

目前主要的推荐技术主要包括基于内容的过滤和协同过第一章绪论

滤两种。

由于基于内容的过滤自身的局限性嘲嘲,协同过滤推荐技术是当前研究

的主流。

2).实时性研究:

在大型电子商务推荐系统中,推荐系统的伸缩能力和实时

性要求越来越难以保证。

如何有效满足推荐系统的实时性要求得到了越来越多研

究者的关注。

·

3).推荐质量研究:

在大型电子商务系统中,用户评分数据极端稀疏。

用户

评分数据的极端稀疏性使得推荐系统无法产生有效的推荐,推荐系统的推荐质量

难以保证。

4).多种数据多种技术的集成:

当前大部分的电子商务推荐系统都只利用了

一一部分可用信息来产生推荐。

随着研究的深入,新型电子商务推荐系统应该利用

尽可能多的信息,收集多种类型的数据,有效集成多种推荐技术,从而提供更加

有效的推荐服务。

5).数据挖掘技术在推荐系统中的应用:

随着研究的深入,各种数据挖掘技

术(主要包括关联规则挖掘、序列模式挖掘、聚类分析、Bayesian分类等)在推

荐系统中得到了广泛的应用.基于Web挖掘的推荐系统得到了越来越多研究者

的关注。

6).用户隐私保护研究:

由于推荐系统需要分析用户的购买习惯和兴趣爱

好,涉及到用户隐私问题,如何在提供推荐服务的同时有效保护用户隐私值得作

进一步深入的研究。

7).推荐系统可视化研究:

推荐系统的目的是为用户提供服务,因此必须为

用户提供友好的可视化服务界面.主要包括推荐结果可视化研究和推荐结果解释

研究等方面的内容。

1.2.2研究现状

推荐系统中的推荐技术主要包括基于内容的过滤和协同过滤两种。

基于内容

的过滤是信息检索领域的重要研究内容∞儿引。

基于内容过滤的推荐系统需要分析

资源内容信息…哺1,根据用户兴趣建立用户档案(profile),然后根据资源内

容与用户档案之间的相似性向用户提供推荐服务憎3。

文uw提出使用智能代理技术

分析用户的特定需求,提供推荐服务。

Salton等人提出根据用户反馈自动更新用

户档案u¨。

Bayesian概率模型∞。

、遗传算法归副以及其它机器学习技术也被广泛

应用于用户档案的建立和更新.基于内容过滤的实验型推荐系统主要包括Malone

等人提出的电子邮件信息过滤系统u”。

Stanford大学提出的信息过滤工具

SIFTu制、音乐过滤系统LyricTime¨副。

SIFTER原形系统¨驯等。

基于内容过滤的推荐技术具有一定的局限性u儿制。

这主要表现在必须分析资第一章绪论

源的内容信息,因此对音乐、图像、视频等信息无能为力;无法分析信息的质量;

无法提供新颖的推荐。

针对上述问题,研究者提出了协同过滤推荐技术

‘3m73‘1砌‘1引。

在早期的协同过滤推荐系统中,用户之间需要相互了解对方的兴趣

爱好啪【删。

随着研究的深入,研究者提出了自动化协同过滤推荐技术n钔‘211‘翻‘2引。

推荐系统的推荐质量是推荐系统成功的关键。

经典协同过滤推荐技术根据用

户之间的相似性产生推荐结果Ⅲ儿划。

Karypis等人瞄叫憎¨提出根据项之间的相似

性提供推荐服务,从而有效提高推荐质量。

文脚。

中提出通过图搜索计算用户最

近邻居的优化算法。

文哪。

提出对用户最近邻居和项均采用不同权重的方法改进

推荐质量。

文瞄副对各种用户间相似性度量方法进行了分析,提出了各种改进方

法。

用户评分数据的稀疏性是导致推荐系统推荐质量下降的主要原因删唧’。

文瞄叼

中提出使用奇异值分解技术减少项空间的维数,从而有效改善用户评分数据的稀

疏性。

文日u中提出通过对稀疏数据的关联分析可以有效提高推荐质量。

文淄儿”1提

出使用智能代理技术可以增加用户评分数据的稠密度。

随着电子商务规模的扩大,推荐系统的实时性研究逐渐成为研究热点,得到

了越多越多研究者的关注u儿副。

Sarwar等人嵋划提出了基于关联规则挖掘的推荐系

统。

文‘吲中提出了基于Bayesian分类挖掘的推荐系统。

文‘34H3钉‘361中提出使用聚

类分析将用户划分为不同的组,从而有效减小搜索空间。

文¨¨中提出通过项聚

类分析,从而在用户评分数据的子集上搜索最近邻居。

文嵋引中提出使用奇异值

分解技术减少项空间的维数,提高最近邻居搜索速度。

文嘲1提出了通过RecTree

方法有效减小搜索空间,从而满足推荐系统的实时性要求。

传统的协同过滤推荐技术根据用户显式评分产生推荐结果,用户使用不方

便,许多研究者提出可以通过web挖掘技术获取用户隐式评分‘1儿羽。

文‘3钔‘删提出

通过web日志挖掘提供推荐服务。

文H¨提出通过UP/,聚类产生推荐的方法。

文Ⅲ1提

出通过Web使用挖掘和Web使用内容挖掘提高推荐质量的方法。

各种数据挖掘方法

如关联规则挖掘技术‘433‘3引、聚类挖掘技术‘训‘451被广泛的应用于Web日志分析中

以提高推荐精度。

协同过滤推荐技术也存在自身的不足u儿副。

主要表现在用户评分数据比较少

的时候推荐质量比较低。

因此基于多种数据多种技术的有效集成得到研究者的重

视u儿副。

Balabanovic等人…。

提出通过基于内容的过滤和协同过滤的复合型推荐

系统提高推荐质量。

文m’中提出基于Web使用挖掘和web内容挖掘的推荐系统。

文旧训∞副中提出同时使用智能代理技术和协同过滤技术提供推荐服务的方法。

H副中提出在推荐系统中增加产品语义信息,从而提高推荐系统的推荐质量。

推荐系统是信息检索和信息过滤领域的研究热点,得到了许多著名研究机构第一章绪论

和研究者的关注,以下是主要的研究型推荐系统实例:

1).TYPESTRY:

是XeroxPARC研究中心提出的一个研究型协同过滤推荐系

统口1,用于过滤电子邮件、推荐电子新闻。

TYPESTRY系统提供电子文档

存储、用户评价存储和协同过滤推荐服务。

在TYPESTRY系统中,设计了一种类

似于SQL的查询语言TQL,用户的查询请求中必须明确指出与自己兴趣爱好相似

的其他用户。

由于用户之间必须了解对方的兴趣爱好,因此TYPESTRY推荐系统

只适用于用户群体比较小的场合。

2).ACF:

ActiveCollaborativeFiltering系统是Carnegie-Mellon大学开

发的主动协同过滤推荐系统L20J,,用于电子文档推荐。

ACF系统通过指针实现协同

过滤推荐服务,指针包含指向电子文档的超链接、电子文档的上下文信息以及用

户撰写的电子文档评论。

在才cT系统中,用户可以通过主动的方式将创建的指针

推荐给其他可能感兴趣的用户,也可以将创建的指针保存在系统中供其他用户查

看。

ACF系统也只适用于用户群体比较小的场合。

3).GroupLens:

由MIT开发的自动协同过滤推荐系统u引u剀。

用于新闻组信息推荐。

GroupLens系统通过用户的评分信息自动搜索用户的最近

邻居,然后根据最近邻居的评分信息产生最终的推荐结果,适合于用户数量比较

大的场合。

GroupLens系统具有极好的开放性,用户可以通过GroupLens系统提供

的API函数晦]GroupLens服务器提供评分信息,请求推荐结果。

同时,GroupLens

系统提供三种客户端工具EmacsGnus、NN和NewsWatcher达到上述目的。

’.

4).MovieLens:

是Minnesota大学开发的研究型自动协同过滤推荐系统H儿酬

珏劓,用于推荐电影。

与GroupLens不同,MovieLens系统是一个基于Web的推荐系

统,系统通过浏览器的方式进行用户评分数据收集与推荐结果显示,用户使用更

加方便。

5).Ringo:

由MIT媒体实验室开发的研究型协同过滤推荐系统咄。

,用于提

供个性化的音乐推荐服务。

Ringo系统可以向用户推荐用户最喜欢的音乐,预测

用户最不喜欢的音乐,也可以预测用户对特定音乐的评分。

6).VideoRecommender:

是BellCore开发的协同过滤推荐系统嵋¨,用

于电影推荐。

VideoRecommender系统通过电子邮件的方式收集用户评分数据,

提供推荐服务.在VideoRecommender系统中,不仅可以预测用户最喜欢的电影,

也可以预测用户对特定电影的评分。

在VideoRecommender系统提供推荐结果时,

同时向用户提供用户最近邻居的电子邮件联系方式,以及用户与最近邻居的相似

度等信息。

7).FAB:

是Stanford大学数字图书馆项目组开发的基于内容的过滤和协同

过滤的复合型推荐系统m。

,用于推荐Web页面。

其特点是综合了基于内容过滤的第一章绪论

推荐和协同过滤推荐的优点,同时支持两种类型的推荐服务。

FAB系统主要包括

页面收集代理,个人推荐代理和中心路由器.页面收集代理从Web上收集特定

主题的页面,个人推荐代理从特定主题中选择用户感兴趣的页面推荐给用户。

人推荐代理根据文档内容信息建立用户的用户档案,然后根据用户档案之间的相

似性搜索用户的最近邻居。

产生的推荐结果可以基于用户档案中的文档内容信

息,也可以基于用户最近邻居的评价信息(协同过滤)。

1.2.3存在的问题

推荐系统在实际的电子商务系统中也得到了广泛应用。

但是,随着电子商务

系统规模越来越大,推荐系统也面临着一系列挑战,主要包括u儿21j—

1).数据稀疏性问题和冷开始问题:

在推荐系统建立初期,由于系统资源还

没有获得足够多的评价,系统很难利用这些评价来发现相似的用户,这就是数据

稀疏性问题;而如果一个新项目没有人去评价它,那么它便得不到推荐,推荐系

统就失去了作用,也就是冷开始问题。

数据稀疏性和冷开始问题是影响推荐系统

推荐质量的关键问题。

2).实时性与推荐质量之间的平衡:

推荐系统的推荐精度和实时性是一对矛

盾。

大部分推荐技术在保证实时性要求的同时,是以牺牲推荐系统的推荐质量为

前提的畸m6¨川㈨。

在提供实时推荐服务的同时,如何有效提高推荐系统的推荐

质量,需要做进一步深入的研究。

3).新型电子商务推荐系统体系结构研究:

当前大部分的电子商务推荐系统

都只是一个单一的工具,只能提供一种推荐模型H副m。

但由于电子商务系统本

身的复杂性,不同场合需要不同类型的推荐。

需要研究新型电子商务推荐系统体

系结构,收集多种类型的数据,提供多种推荐模型,满足不同类型

的推荐需求。

4).推荐结果解释研究:

电子商务推荐系统为了说服用户,需要向用户解释

推荐产生的原因。

目前的电子商务推荐系统只能通过简单的销售排行、向用户提

供其他用户对商品的评价评分信息等方式来达到上述目的…嵋儿m。

需要进一步研

究更加有效的方法向用户解释产生推荐的原因,从而增加用户对推荐系统的信任

程度,说服用户听从推荐系统的推荐。

1.3本文工作

面对电子商务推荐系统存在的一系列问题,尤其是推荐系统的推荐质量问

题,本文提出了集成语义信息的电子商务推荐系统,该系统对商品提取针对行业第一章绪论

的语义信息,将商品所蕴涵的语义作为推荐过程中考虑的重要因素,同时针对用

户的兴趣爱好进行偏好提取和偏好过滤,最终完整准确而又人性化的产生个性化

的推荐结果。

本文的主要创新点如下:

1、提出商品的语义关联模型以及语义训练中心。

通过结合语义相似性以及产

品分类学的方法,提出商品语义关联模型来进行基于语义的产品相关性分析。

对行业的关联模型的建立是通过语义训练中心来进行的,这种模型比现有的推荐

方法提供了更多的显式语义。

2、改进了基于项目的协同过滤推荐算法。

对不同产品的语义信息进行相似度

计算,结合原有协同过滤算法,综合语义过滤技术与协同过滤技术来对欲推荐的

商品计算预测权值。

试验证明该集成语义过滤和协同过滤两种方法的推荐算法在

克服现有推荐方法的数据稀疏性问题和冷开始问题上面,具有重大意义。

3、设计了一种基于决策树的用户语义偏好模型。

用户偏好模型的学习阶段可

以离线进行,模型的应用阶段是针对用户的偏好过滤,推荐模型的建立有效的增

强了推荐系统的实时性能,一定程度上克服了实时性与推荐质量之间的平衡问

题。

4、提出了如何利用本体表达商品信息以及用户偏好信息。

本文利用商品所属

行业名,商品属性信息和语义信息等来为虚拟商品创建RDF文件,该文件代表了

对应的商品,通过将该文件置于公共站点,各个电子商务代理商获取该文件后解

析并且导入本地系统,实现了虚拟商品的购入和购出。

本文也利用用户访问过的

商品所属行业名、此行业中的访问商品的累计频率、以及时间信息等来为用户创

建一个RDF动态兴趣偏好。

RDF(resourcedescriptionframe)是一种用来在万

维网中描述资源的语言。

它专门用于表达关于Web资源的元数据,比如Web页面

的标题、作者和修改时间,Web文档的版权和许可信息,某个被共享资源的可用

计划表等。

然而,将“Web资源(Webresource)抑这一概念一般化后,RDF可被

用于表达关于任何可在Web上被标识的事物的信息,即使有时它们不能被直接从

Web上获取。

比如关于一个在线购物机构的某项产品的信息(例如关于规格、价

格和可用性信息),或者是关于一个Web用户在信息递送方面的偏好的描述。

RDF

用于信息需要被应用程序处理而不是仅仅显示给人观看的场合。

RDF提供了一种

用于表达这一信息、并使其能在应用程序间交换而不丧失语义的通用框架。

既然

是通用框架,应用程序设计者可以利用现成的通用IiDF解析器(RDFparser)以

及其他通用的处理工具。

能够在不同的应用程序间交换信息意味着对于那些并非第一章绪论

信息的最初创建者的应用程序也是可利用这些信息。

推荐系统服务器可以通过监

视用户对商品的访问购买过程,将相应的偏好信息写入用户的RDF偏好文件中。

1.4本文结构

第一章,阐明本文课题的选题背景和研究现状,并说明本文的主要内容和创

新点。

第二章,介绍电子商务推荐系统的作用,分类,构成,主要的推荐技术。

第三章,详细阐述了集成语义信息的电子商务推荐系统的系统设计,并给出

关键的集成语义信息的协同过滤技术的算法设计和性能试验。

第四章,阐述如何在集成语义信息的电子商务推荐系统中记录用户动态偏

好、构建和应用用户语义偏好模型,以及表达和解析用户偏好。

第五章,描述了结合协同过滤和语义过滤推荐,实现电子商务个性化推荐系

统的整体应用背景,系统分析和设计以及功能。

第六章,对本文的研究工作进行总结,提出存在问题,并对未来该领域研究

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 经管营销 > 生产经营管理

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1