基于用户网络购物行为的信息推送系统研究开题报告.docx
《基于用户网络购物行为的信息推送系统研究开题报告.docx》由会员分享,可在线阅读,更多相关《基于用户网络购物行为的信息推送系统研究开题报告.docx(7页珍藏版)》请在冰豆网上搜索。
基于用户网络购物行为的信息推送系统研究开题报告
管理科学与工程学院
本科生毕业论文(设计)开题报告
题目:
基于用户网络购物行为的信息推送系统研究
学生姓名:
学号:
专业:
信息管理与信息系统班级:
指导教师:
管理科学与工程学院
2017年2月25日
一、选题背景、目的和意义
1.1选题背景:
随着我国互联网技术的快速发展,互联网硬件设施得到快速普及。
中国互联网络信息中心(CNNIC)在京发布第39次《中国互联网络发展状况统计报告》(下称《报告》)。
这份《报告》显示,截至2016年12月,我国网民规模达7.31亿,普及率达到53.2%,超过全球平均水平3.1个百分点,超过亚洲平均水平7.6个百分点。
全年共计新增网民4299万人,增长率为6.2%。
中国网民规模已经相当于欧洲人口总量。
其中,手机网民规模达6.95亿,占比达95.1%,增长率连续3年超过10%。
而台式电脑、笔记本电脑的使用率均出现下降,手机不断挤占其他个人上网设备的使用。
并指出,我国网民规模经历近10年的快速增长后,红利逐渐消失,网民规模增长率趋于稳定。
2016年,中国互联网行业整体向规范化、价值化发展,同时,移动互联网推动消费模式共享化、设备智能化和场景多元化。
1.2选题目的及意义
为便于人们网购,实现网购多元化,对用户网购行为进行研究实现信息推送被认为是解决人们所喜好的网购需求的重要途径。
要解决信息推送的问题,首先要从信息获取技术着手,从传统的“PULL”信息拉取方式转变为“PUSH”的信息推送形式[1]。
传统的基于PULL技术的信息服务模式,存在以下三个缺点:
(1)信息利用效率低下。
在面对海量影视节目、视频节目、电视资源等信息时,用户没有耐心也没有时间去检索排在后面的信息资源,即便是利用搜索功能,也会对搜索出的众多结果无所适从。
因此,节目信息资源利用率十分低下。
(2)时效性差。
当信息提供方有即时更新的信息时,用户无法第一时间获取自己感兴趣的信息。
(3)操作难度大。
因为当电视机被“网络化”后,获取信息的操作势必复杂化、“电脑化”。
这就要求用户有一定的专业知识背景。
如今人们生活节奏越来越快,基于传统的“PULL”信息获取方式给人们快速获取信息造成障碍。
要克服信息利用效率低下、时效性差、操作难度大的缺点,就要求我们研究如何快速有效的获取和预测智能机用户的兴趣主题和兴趣度并采取高效、便捷的推送技术将用户感兴趣的节目内容资源及时呈现给用户,从而改善用户体验。
因此,对基于用户网购行为的信息推送系统的研究具有重要的理论价值和商业意义。
采用“PUSH”的信息推送形式可以实现从传统的“人找信息”到“信息找人”的转变[1]。
现有个性化信息推送模型,都是针对获取互联网内容的电脑用户。
电脑用户可以很方便的参与对网络内容的显式评价反馈,同时还可通过Cookie、BookMark等众多途径记录用户浏览行为。
二、文献综述
2.1国内研究现状
目前,推送技术是国内外学者研究的一个热点,它对推送质量有着直接的影响。
当前应用比较广泛的推送技术主要有以下三种:
RSS(ReallySimpleSyndication)推送技术、Agent推送技术、协同过滤推送技术。
RSS推送技术是基于XML技术的互联网内容发布和集成技术。
它是通过用户手动添加感兴趣内容的站点地址来被动获取相关主题信息。
这种技术的优点就是用户一旦设置好兴趣源地址,直接等待感兴趣信息送到跟前,在一定程度上提高了信息获取效率。
但是不足之处是用户无法对推送的信息进行反馈和选择,无法保证用户个性化需求。
最近几年,国内学者对Agent推送技术做了不少研究,比较有代表性的有林小勇提出了一个基于多Agent的个性化信息推送系统的模型[2];杜军平等人实现了基于Agent的电子商务交易平台中分布式信息推拉[3]。
随着研究的深入,发现Agent推送技术存在着各个Agent兼容性差、安全性和可靠性不高等问题。
协同过滤推送技术是目前被学者研究最多也是应用最广泛的一种推送技术,协同过滤技术主要包括基于用户过滤、基于项目过滤以及基于模型过滤这几种方法。
这些方法各自都有自己的优缺点和具体的应用领域。
许多学者利用协同过滤推送技术做出了卓有成效的研究:
针对数据稀疏性问题,李聪、邢春晓等人提出了基于领域最近邻的协同过滤推送算法[4];针对数据稀疏情况下预测精度不高的问题,郭艳红等人提出一种稀疏矩阵下的个性化改进策略。
[5]
2.2国外研究现状
应用RSS推送技术比较典型的系统主要有:
陈峰等人[6]提出的信息服务联盟内容聚合服务方式、WendyG.Wu等人[7]实现的图书指南系统以及HaoHan等人[8]实现的网络新闻提取系统。
Agent推送技术本质是一个计算实体,它能够感知周围环境的变化,可以自主进行推断、计算等行为。
Agent这个概念是由麻省理工学院Minsky[9]在“SocietyofMind”一书中提出的。
其具有以下几方面特性:
自治性(Autonomy)、反应性(Reactive)、主动性(Proactive)、社会性(Social)[10]。
为了更好的解决信息过载问题,HengLuo[11]、WangHM[12]等人提出了基于协作过滤的信息检索系统。
虽然协同过滤推送技术相对其他推送技术有明显优势,但是也存在着数据的稀疏性、冷启动、和可扩展性差等不足。
2.3参考文献
[1]李勇,徐振宁,张维明.Internet个性化信息服务研究综述.计算机工程与应用,2002,10(19):
27~28
[2]ZhangYi,CallanJ.,MinkaT..NoveltyandRedundancyDetectioninAdaptiveFiltering.In:
Proceedingsof25thAnnualInternationalACMSIGIRConference.Tampere,Finland:
ACM,2002.81~88
[3]RoberrsonS.,WalkerS..ThresholdSettingandPerformanceOptimizationinAdaptiveFiltering.InformationRetrieval,2002,5
(2):
239~256
[4]ChangYe-in,ShenJun-hong,ChenTsu-I..ADataMining-basedMethodfortheIncrementalUpdateforSupportingPersonalizedInformationFiltering.JournalofInformationScienceandEngineering,2008,24
(1):
129~142
[5]ParkH.S.,YooJ.O.,ChoS.B.A..Context-awareMusicRecommendationSystemUsingFuzzyBayesianNetworkswithUtilityTheory.FuzzySystemandKnowledgeDiscovery,2006(4223):
970~979
[6]KarypisG..EvaluationofItem-basedTop-NRecommendationAlgorithms.In:
Proceedingsofthe10thInternationalConferenceonInformationandKnowledgeManagement.NewYork,USA:
ACM,2001.247~254
[7]ChenY.H.,GeorgeE.I.ABayesianModelforCollaborativeFiltering.In:
Proceedingsofthe7thInternationalWorkshoponArtificialIntelligenceandStatistics.SanFrancisco,USA:
MorganKaufmanPublishers,1999.202~210
[8]UngarL.H.,FosterDP..ClusteringMethodsforCollaborativeFiltering.WorkshoponRecommendationSystem,1998,8(5):
135~140
[9]SomloG.,HoweA..AdaptiveLightweightTextFiltering.In:
Proceedingsofthe4thInternationalSymposiumonIntelligentDataAnalysis.Berlin,Heidelberg:
Springer-Verlag,2001.319~329
[10]杨博,赵鹏飞.推荐算法综述.山西大学学报(自然科学版),2011,12(3):
337~350
[11]施聪莺,徐朝军,杨晓江.TFID算法研究综述.计算机应用,2009,29(6):
167~170
[12]王微微,夏秀峰,李晓明.一种基于用户行为的兴趣度模型.计算机工程与应用.2012,48(8):
56~61
三、课题研究内容和方法
3.1研究的主要内容及重点解决的问题
本文结合上述背景和推送技术的国内外研究现状,研究适合用户网购行为的信息推送技术。
研究内容包括以下几个方面:
(1)多维度兴趣主题的细粒度划分深入分析智能机用户网购行为,就会发现用户的兴趣主题比较分散。
为了比较准确和全面分析用户兴趣,本文将每个用户的兴趣主题细粒度的划分为多个具体的兴趣特征。
(2)建立基于时间因素的动态用户兴趣模型用户兴趣模型的建立包括两个部分的工作:
用户兴趣模型的表示和用户兴趣模型的更新。
(3)混合推送技术的研究基于内容的推送技术的不足之处就是需要较好的文本分类技术作为支撑,并且只能推送相似内容,无法发现新的内容;而基于协同过滤技术也存在着在系统刚开始使用时,由于数据稀疏性,存在着很难通过计算找到目标用户的相似用户和可扩展性差的不足。
(4)对改进后的用户兴趣模型和混合推送技术验证实验。
(5)网购信息推送系统的实现收集用户的行为兴趣数据。
3.2研究的主要内容技术路线
(1)挖掘兴趣特征与兴趣主题的所属关系,使兴趣特征形成兴趣主题,通过兴趣主题最终形成用户的兴趣偏好。
相应的,通过计算用户兴趣特征的兴趣度来计算用户兴趣主题的兴趣度,最终形成用户的兴趣模型。
目前用户兴趣都是二维兴趣向量表示,仅仅是对用户某个兴趣主题相对应的兴趣度进行了描述。
但是人的主观认识会随着时间的推移会转移和发展,每时每刻的关注点都会不尽相同。
同理,用户的兴趣以及兴趣度也会随着时间的推移发生改变,减弱或者增强。
用户兴趣的二维向量表示是静止的,不能够动态的反映出用户兴趣的实时变化。
因此可以在用户兴趣表示方法中加入时间因素这一维度,给用户的兴趣打上时间标签,可以很好的区分用户兴趣的变迁。
这一研究为后面用户兴趣模型的更新提供了新的途径。
在此基础上选取适当的数学方法将此划分表述为能够被计算机处理的方式,为构建一个新的用户兴趣模型建立基础。
(2)在完成兴趣主题多维度细粒度划分的基础之上,综合应用数据挖掘技术和人工智能等多学科的理论和方法,建立基于用户的兴趣模型,对各粒度进行定量分析,在已有的兴趣模型的基础上,建立新的基于时间因素的层次向量空间用户兴趣模型。
(3)混合推送技术是针对上述两种技术各自不足而提出的,扬长避短,提高推送质量。
混合推送技术是将上述两种技术进行组合或者融合从容产生不同的混合推送策略,根据实际的应用背景选择恰当的混合策略。
本文在此研究基础上结合精伦智能机的特点提出基于用户兴趣度的混合推送技术。
(4)为了检验用户兴趣模型和混合推送技术的科学性、有效性,我们进行验证实验。
在验证实验中,以收集的用户行为信息为基础数据,分别通过相应的评价指标来验证用户模型和混合推送技术的可行性和优越性。
(5)通过用户兴趣模型的处理,形成用户兴趣数据库,然后通过基于兴趣度混合推送技术,将用户感兴趣的兴趣主题以个性化界面的形式呈现给用户。
3.3论文写作大纲
论文题目:
基于用户网络购物行为的信息推送系统研究
一:
目录
二:
摘要
三:
关键词
四:
研究目的与意义
五:
研究背景
六:
国内外研究现状
七:
研究内容与技术
八:
论文难点与改进
九:
总结
十:
参考文献
3.3课题研究方法及步骤
为了比较准确和全面分析用户兴趣,本文将每个用户的兴趣主题细粒度的划分为多个具体的兴趣特征。
挖掘兴趣特征与兴趣主题的所属关系,使兴趣特征形成兴趣主题,通过兴趣主题最终形成用户的兴趣偏好。
相应的,通过计算用户兴趣特征的兴趣度来计算用户兴趣主题的兴趣度,最终形成用户的兴趣模型。
目前用户兴趣都是二维兴趣向量表示,仅仅是对用户某个兴趣主题相对应的兴趣度进行了描述。
但是人的主观认识会随着时间的推移会转移和发展,每时每刻的关注点都会不尽相同。
同理,用户的兴趣以及兴趣度也会随着时间的推移发生改变,减弱或者增强。
用户兴趣的二维向量表示是静止的,不能够动态的反映出用户兴趣的实时变化。
因此可以在用户兴趣表示方法中加入时间因素这一维度,给用户的兴趣打上时间标签,可以很好的区分用户兴趣的变迁。
这一研究为后面用户兴趣模型的更新提供了新的途径。
在此基础上选取适当的数学方法将此划分表述为能够被计算机处理的方式,为构建一个新的用户兴趣模型建立基础
四、课题研究进度及安排
第一阶段:
论文定题并收集阅读相关文献资料。
(2017年2月下旬)
第二阶段:
审查、修改并完成开题报告。
(2017年2月下旬至2017年3月初)
第三阶段:
查资料、调查研究,与导师沟通以完成论文初稿。
(2017年3月)
第四阶段:
在导师指导下,补充和完善论文初稿。
(2017年4月)
第五阶段:
进一步修改并定稿。
(2017年5月)
第六阶段:
答辩。
(2017年6月)
五、对开题报告的意见
指导教师对开题报告的评语:
指导教师签名:
年月日
开题报告会评审组提出的主要问题、建议及意见:
评审组组长签名:
年月日