推荐算法Word文档格式.docx
《推荐算法Word文档格式.docx》由会员分享,可在线阅读,更多相关《推荐算法Word文档格式.docx(14页珍藏版)》请在冰豆网上搜索。
寻找当前产品的同类产品中,当前用户尚未查看(或购买点评等)的产品,推荐给用户。
而根据提取产品的不同原则,又可以分为相似推荐和热门推荐。
实现过程如下:
(1)建立产品标签
细化的标签体系,有助于完整描述产品,以及定位产品。
标准化的标签体系,利于进行产品分类和相似度计算。
(2)划定产品分类
产品分类即根据产品本身的功能、属性等标签,将其划分到对应类别中去。
具体可参见电商网站的产品分类。
(3)提取潜在产品清单,进行推荐
提取潜在产品清单可以有两种基准,一是产品差异度,二是产品热门度。
●基于类内产品差异度(高度相似)
对于类内产品,基于产品标签的差异度,可计算产品之间的差异程度。
两个产品差异度可用“距离”的概念来描述。
例:
牛奶
脱脂
大小
进口
牛奶1
1
0(100ml)
牛奶2
2(500ml)
计算差异度后,提取差异度最小的10个产品作为Top10相似产品。
根据用户当前浏览产品,从中搜索其尚未浏览的产品进行推荐。
这种处理方案的计算量较大,当一个产品分类中有n个产品时,就会产生
次差异度计算。
●基于类内产品热门度(高度热门)
对于类内产品,根据浏览量(购买量)大小,提取Top10的热门产品。
1.2关联品类产品推荐
关联品类包含两层意思:
一种是直接相关的,比如牙膏和牙刷是必须配套使用的关系,牙膏和牙粉是可以互相替代的关系,漱口水是对牙膏的作用进行补充的关系。
还有一种间接相关的情况。
例如,实际中,可能存在这样的情况:
25岁的浙江女、30岁北京男、50岁南京女等10人的购买记录中,都购买了(A品牌)红酒、开瓶器、酒杯。
其中1个人还买了芝士,9个人还买了牛排;
于是,认为“红酒+开瓶器+酒杯”的组合与“牛排”之间存在关联关系。
于是,当用户在购物车添加了(B品牌)红酒、酒杯、开瓶器时,比起A品牌红酒,用户可能更愿意接受推荐给他的牛排。
通过关联规则算法可以实现这些产品间关联关系的提取:
●这种“关联”反映的是用户需求的相似性,与用户个体的属性和偏好无关。
●这里的“关联”可以是产品类之间的关联。
因为一旦细化到产品本身,可能由于过度具象而无法提取规则。
如在上例中,如果考虑品牌和牛排的品类等级,上述10个人可能购买了10种牛排,就无法提取关联产品。
●但当有足够的数据支持时,可以把这种关联进化到产品粒度。
(产品品类关联)实现过程如下:
(1)基于品类标签,建立购买清单
原始的购买清单是产品的,要将其提炼为品类的购买清单。
根据产品标签体系,提取品类标签。
购买清单(组合)
产品品类
清单1
A
B
C
清单2
D
清单3
(2)提取关联品类
关联规则算法可采用Apriori算法,一种使用频繁项集的先验知识,使用一种称作逐层搜索的迭代方法。
(实现过程
在进行关联规则分析时,要剔除参与促销活动的产品,避免因促销活动带来的虚假关联。
根据当前用户浏览产品品类,从关联品类中提取热门产品进行推荐。
2基于用户的推荐方法
2.1共同偏好人群产品推荐
共同偏好人群是指,这群人的人口、购买习惯、产品偏好接近,因此,同好人群的选择也可以向当前用户进行推荐。
也有网站为了简化用户分群过程,要求用户自己给自己打标签,从而实现分群。
(1)建立用户标签
细化的标准化的标签体系,是对用户进行划分的重要依据。
(2)用户聚类
K-MeansClustering是效率比较高的聚类方法。
算法原理:
对于每一个cluster,我们可以选出一个中心点(center),使得该cluster中的所有的点到该中心点的距离小于到其他cluster的中心的距离。
即实现类内相似度最高,类间相似度最低。
(
当用户浏览某个产品时,提取对应品类下,当前用户的同类用户,浏览(购买)量最多的Top10产品作为潜在产品清单,从中搜索其尚未浏览的产品进行推荐。
2.2当前用户曾经购买产品推荐
基于用户的购买记录,提取其曾经购买的对应品类产品,可根据购买评价和购买次数进行排序,从而实现推荐。
3整体框架
基于当前用户浏览产品进行产品推荐,可以将产品和用户两个维度交叉使用。
提取了要推荐给用户的产品后,如何输出给用户,不同的网站有不同的形式。
以下通过案例进行摘录。
4案例
4.1一号店
●【PPT】1号店电商大数据挖掘实践
●1号店利用大数据挖掘每个用户模型和算法很重要
4.1.1产品品类及同类产品推荐
4.1.2关联产品品类及产品推荐
4.2京东
●揭秘京东大数据
4.2.1产品品类
4.2.2关联品类
4.2.3同品类同用户类推荐
4.2.4同类热门推荐
4.2.5基于历史浏览、购买记录推荐
登录状态下浏览了保温杯、洗面奶、速溶咖啡后的“猜你喜欢”。
4.2.6用户自己给自己归类,从而实现推荐
4.3淘宝
淘宝页面显示相对杂乱。
登录后,在个人页面,显示“根据浏览,猜我喜欢”
4.4亚马逊