ImageVerifierCode 换一换
格式:DOCX , 页数:12 ,大小:3.57MB ,
资源ID:7613282      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/7613282.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(0310推荐系统学习总结.docx)为本站会员(b****6)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

0310推荐系统学习总结.docx

1、0310推荐系统学习总结以下内容为对推荐系统这本书的整理,在此感谢作者。推荐系统1、推荐系统概述1.1 什么是推荐系统推荐系统的作用:i)用于解决当信息过载的时候,用户不能准确、高效的找到自己所需要的信息。ii)用于引导新用户或对目标不明确的用户发觉所需要的信息。推荐系统的任务:通过发掘用户的行为,找到用户的个性化需求,从而将长尾商品准确地推荐给需要的用户,帮助用户发现那些他们感兴趣但很难发现的商品。1.2 推荐系统有哪些应用应用领域代表企业推荐内容电子商务亚马逊、阿里巴巴、口袋购物根据用户历史记录,进行个性化推荐。根据物品之间的相关度,进行物品的关联推荐。基于位置等的服务大众点评、美团、出门

2、问问利用用户的位置信息以及用户的上下文信息,进行O2O业务中的旅店、餐馆等的推荐。个性化广告Google、XX、秒钟对应计算广告学,依据用户的历史信息进行广告的精准定位投放。个性化推荐(视频、音乐、输入法、阅读)豆瓣、优酷土豆、Netflix、YouTube根据用户历史记录,进行个性化推荐。根据物品之间的相关度,进行物品的关联推荐。社交网络QQ、Facebook、Twitter利用用户的社交网络信息对用户进行个性化的商品推荐。利用信息流进行绘画推荐。利用用户的各种属性信息(包括用户基本资料,用户的聊天内容)进行好友和群组推荐。1.3 推荐系统评测评价指标:用户满意度、准确度、覆盖度、新颖度、惊

3、喜度、信任度、实时性、健壮性1.4 推荐系统和搜索引擎、分类目录的区别及发展推荐系统和搜索引擎、分类目录的目标一致,都是一种用来帮助用户快速的发现有用信息的工具。但推荐系统和搜索引擎、分类目录也具有如下的不同点。类型需求不同点方法不同点搜索引擎、分类目录用户输入关键词、句子等信息信息检索推荐系统用户的需求不明确从用户的历史行为数据出发,为用户的需求和兴趣建立模型;在冷启动的情况下,通过热门内容引导等方式进行首次推荐目前,信息的极度爆炸使得人们找到他们需要的信息将变得越来越难。传统的搜索技术是一个相对简单的帮助人们找到信息的工具,也广泛的被人们所使用,但搜索引擎并不能完全满足用户对信息发现的需求

4、,原因一是用户很难用恰当的关键词描述自己的需求,二是基于关键词的信息检索在很多情况下是不够的。而推荐引擎的出现,使用户获取信息的方式从简单的目标明确的数据的搜索转换到更高级更符合人们使用习惯的上下文信息更丰富的信息发现。如下图,是推荐引擎的工作原理图。二、推荐系统的冷启动问题2.1 冷启动分类i)用户冷启动。如何给新用户做个性化推荐的问题。ii)物品冷启动。如何将新的物品推荐给可能对它感兴趣的用户。2.2 解决方法2.2.1 利用用户属性信息(对应i)1)用户注册提供的年龄、性别等信息。2)用户社交网络中,进行用户的社交网络计算,比如通过好友信息,将好友喜欢的物品推荐给用户。比如通过位置信息,

5、将周边朋友喜欢的物品推荐给用户。2.2.2 引导式启动(对应i) 1)提供非个性化的推荐。比如热门排行榜、周边排行榜等。然后等到用户数据收集到一定的时候,在切换为个性化推荐。2)对话式推荐。将搜索引擎技术和推荐技术进行融合,通过问答式交互,一步步引导用户发现自己的需求。2.2.3 利用物品内容信息(对应ii) 1)通过物品之间的相似度计算,推荐给喜欢过和它们相似的物品。2)其中,相似度计算过程中,VSM(向量空间模型)是最常用的内容数据相似度计算模型。但是,对于语言中的歧义现象(一词多义,一义多词),VSM效果不好,LDA(潜在语义分析)技术很好的解决了这个问题。LDA的基本思想大体如下:首先

6、确定内容的话题分布,然后在话题分布的基础上计算关键词的相关性。2.2.4 引入专家知识(对应ii)引入专家只是,通过一定的高效方式迅速建立起物品的相关度信息。比如个性化音乐电台应用Pandora公司,通过让音乐人对几万首歌曲进行400多个特征的标注,然后在此基础上进行歌曲之间的相似度计算。视频公司Jinni利用相似的想法设计了电影基因系统。三、推荐系统中可利用的特征3.1 利用用户行为信息i)用户日志(用户ID,用户使用的设备,用户登录地点,用户输入内容), ii)注册时的基本属性信息iii)用户点击记录,购买记录,3.2 利用用户标签信息3.2.1 标签的作用i)打标签作为一种重要的用户行为

7、,蕴含了很多用户兴趣信息。我们在进行用户的个性化推荐系统过程中,需要深入了解用户为什么标注、怎么标,只有这样才能发觉用户意图。同时,通过对整体用户行为标签的分析挖掘出重要信息。ii)标签形式简单,方便进行算法处理、方便用户快速、准确地了解内容。3.2.2 标签的内容标签的内容种类繁多,比如图片标签,标签内容为:时间、人物、动作行为。书籍标签为:书籍的类别、书籍的核心关键词、作者等。餐馆标签为:餐馆环境等级、服务员服务态度、饭菜质量、价格等。即依据不同的需求进行标签的标注。3.3 利用上下文信息在不同的场景下,不同的上下文信息对推荐系统的影响很大。时间信息,比如在冬天网购,根据历史记录给推荐出来

8、T恤等夏季衣服就是错误的。地点信息,比如你现在居住在北京寻找餐馆,依据历史记录给你推荐出来的是河南地区的餐馆等。3.3.1 时间信息3.3.2 地点信息3.4 利用社交网络信息3.4.1社交网络的优点i)解决冷启动问题;ii)好友推荐可以增加推荐的信任度。3.4.2社交网络的类型i)双向确认的社交网络数据代表企业:QQ,人人网,Facebook,特点:熟人网络ii)单向关注的社交网络数据代表企业:微信,新浪微博,Twitter特点:陌生人网络iii)基于社区的社交网路数据代表企业:豆瓣小组特点:i)依据某一特点进行聚集(比如:共同兴趣,同一学校,同一公司等);ii)用户之间没有明确的关系4、推

9、荐系统的技术4.1 基于关联规则据4.2 基于协同过滤的推荐4.2.1基于用户的协同过滤算法(User-based collaborative filtering)步骤:1)找到和目标用户兴趣相似的用户集合。采用用户对同一商品的正负反馈情况确定。2)找到这个集合用户喜欢,且没有被用户发现的物品推荐给目标用户。采用集合内用户投票的机制等确定。4.2.2基于物品的协同过滤算法(Item-based collaborative filtering)这种算法是目前业界应用最多的算法,亚马逊、YouTube、阿里巴巴等均采用此算法。步骤:1)计算物品之间的相似度。若同一用户点击了物品A,同时也点击了物品

10、B,则认为A和B之间存在联系,即通过同一用户的点击物品关联度来确定物品之间的相似度。2)根据物品的相似度和用户的历史行为给用户生成推荐列表。4.2.3两者的综合比较UserCFItemCF性能新闻等时效性快的系统、论文等群体行为区分度明显的系统。电子商务网站、个性化推荐网站(音乐、视频、书籍)等具有长尾物品丰富、用户个性化需求强烈的领域。侧重反映内容小群体行为。当个人行为发生变化时,不能立即反映出来。用户的历史行为。当个人行为发生变化时,立即反映出来。性能适用于用户较少的场合,因为计算用户相似度矩阵代价很大。适用于物品数明显少于用户数的场合,因为计算物品相似度矩阵代价很大。推荐理由无法给出明确

11、的推荐理由可以通过用户历史行为和物品之间的相似度给出明确的行为4.3 基于内容的推荐如何给用户推荐自己喜欢的物品,除了4.2提到的基于协同过滤的算法外,还可以按照如下这样的思路:首先,将用户按照兴趣进行划分;然后,基于不同的兴趣,推荐用户喜欢的物品。这就是隐语义模型的核心思想,即:通过隐含特征联系用户兴趣和物品。常见的名词包括:LFM、LDA、LSA、pLSA等。基于兴趣的分类有如下三个问题:1)如何给物品分类?采用基于用户行为统计的自动聚类方法。同4.2.2 ItemCF中计算物品之间的相似度类似。(通过同一用户的点击物品关联度来给物品分类)。2)如何确定用户对哪些类的物品感兴趣,以及感兴趣

12、的程度?通过用户对不同类别中物品的正负反馈来确定,并通过反馈的程度来确定对物品的感兴趣程度。3)对于一个给定的类,选择哪些属于这个类的物品推荐给用户,以及如何确定这些物品在类中的权重?利用用户的历史行为信息和物品之间的关联度进行确定。备注:鉴于LDA技术内容繁多,在这里不做讲解。5、推荐系统推荐引擎架构主要包括3部分,如下图。i)该部分负责从数据库或者缓存中拿到用户行为数据,通过分析不同行为,生成当前用户的特征向量。不过如果是使用非行为特征,就不需要使用行为提取和分析模块了。该模块的输出是用户特征向量。 ii)该部分负责将用户的特征向量通过特征-物品相关矩阵转化为初始推荐物品列表。 iii)该部分负责对初始的推荐列表进行过滤、排名等处理,从而生成最终的推荐结果。六、图示例更新记录时间更新内容备注2015年3月10日初稿完成初稿包括六部分。1、推荐系统概述2、推荐系统的冷启动问题3、推荐系统中可利用的特征4、推荐系统的技术5、推荐系统6、图示例

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1