京东搜索排序白皮书111114.docx
《京东搜索排序白皮书111114.docx》由会员分享,可在线阅读,更多相关《京东搜索排序白皮书111114.docx(12页珍藏版)》请在冰豆网上搜索。
京东搜索排序白皮书111114
京东搜索排序文档
京东搜索团队
2013年11月
目录
京东搜索排序文档1
京东搜索介绍2
1、排序算法2
1.1文本相关性2
1.2类目3
1.3商品质量3
1.4用户搜索反馈4
1.5店铺服务质量4
1.6作弊4
1.7个性化排序5
2、非默认排序5
3、搜索结果页展示5
4、属性筛选规则6
附录1:
京东搜索作弊行为评判标准6
一、虚假交易6
二、错放类目和属性7
三、更换商品8
四、标题乱填关键字8
五、重复铺货10
QA:
常见问题10
京东搜索介绍
随着京东商品数量的增长,京东搜索怎样排序?
如何做可以让商品得到更多曝光机会是各个商家特别关心的事情。
与其他电商搜索类似,京东搜索排序就是将匹配关键词的商品按照对用户需求满足程度依次展示,目的是帮助用户快速方便地找到所需商品。
此外,用户还可以按照一定条件对商品进行精确筛选。
下面,我们将从以下几个方面详细介绍京东搜索排序。
1、排序算法
当用户输入关键词进行搜索的时候,系统会根据用户输入的关键词去和系统中的商品做匹配,并根据商品匹配程度和其他相关因素对商品进行排序最后将结果展示给用户。
京东搜索排序考虑的因素如下:
1.1文本相关性
文本相关性即商品的文本描述信息(包括:
商品标题、类目名称、品牌名、图书类商品还有作者、出版社等)和搜索关键词的是否相关或匹配。
文本相关性的计算我们采用评分机制,即跟用户搜索词和商品的匹配程度给予不同的评分,通过评分来判断商品和搜索词的匹配程度。
其中商品标题和关键词的相关度最为重要。
商品标题录入注意事项
卖家为了提高自己商品的搜索曝光率,在商品名称中堆砌和自身商品完全无关的关键词,致使商品标题不规范,不仅会影响该商品的文本相关性得分,还会降低用户体验。
录入标题需要考虑以下原则:
1.用户搜索商品时常用搜索词;2.尽量简洁明了;3.名称中不得有错别字。
被发现存在文本作弊的商品在搜索系统中将被过滤或做降权处理。
举例:
反面例子:
金吉家广博窄书柜抽屉门板随意增减间厅柜可延长隔断不靠墙也稳定正反面通用创意组合书柜5X4列橡木色
用户根本无法找到商品标题重点,名称越短文本相关性越高,无须写乱七八糟的关键字。
正面例子:
乐爱家创意书柜收纳储物柜LF-W-1030细条棕橡
1.2类目
京东搜索因子中,商品的所在类目(商品的分类)是否合理将影响到商品的排序结果。
在京东,所有商品须放置在具体的分类下,例如iphone手机放在“手机”分类下,而iphone充电器则放在“苹果配件”分类下。
在放置商品类目的时候,一定要注意,以防放置在不恰当的类目中,对商品排序造成负面影响。
关键词与类目也存在相关性,关键词与不同类目的相关性不同,通过搜索系统综合计算所得。
关键词搜索排序规则是多个因素综合影响的结果,所以在其他排名因素相同的情况下,类目影响排序的综合得分。
综上所述,放置或优化商品类目时,需确保放于正确且合理类目,才可保证商品在用户精准搜索词下得到有效曝光
1.3商品质量
商品质量不仅影响商品的销量,还影响用户对该商品所属店铺的信任度和认可度。
影响商品质量的因素如下:
a.商品销量
即近期商品销量,其中不同时间的销量进行加权计算;团购销量和虚假交易销量不计算在内(虚假销量查出后会被处罚)。
b.销售额
为防止低质量商品占用重要展示位置,影响用户体验,销售额作为其中一个因素参与商品质量分计算。
c.图片质量
图片是电商网站考量的一个重要因素,是建立商品和用户联系的第一媒介。
影响图片质量的因素有:
图片尺寸,图片像素,是否精美吸引人,图片和商品描述是否一致等等。
建议大家在图片处理上考虑用户习惯以及展示图片大小,避免图片变形或者各种文字信息影响用户体验。
参见《页面商品信息管理规范》
d.用户评论
用户评论反映用户对商品的满意程度;商品质量和好评率成正比。
e.商品属性
商品属性是用户了解商品的重要渠道,商品属性信息和商品不匹配会降低用户体验,商品属性信息和商品的一致性是影响商品排名的另一个重要因素。
为了增大商品展示机会,采销或者商家在录入同一商品属性时有时会录入多个属性;例如泳衣的人群属性选择“女士”也选择“男士”,此类商品一旦发现将按作弊商品进行排序降权处理。
除上述因素外,用户关注度等也是影响商品质量的因素。
1.4用户搜索反馈
用户搜索查询词后点击或购买商品的行为在用户搜索反馈系统中计为该查询词与该商品的一次点击或购买数据。
用户搜索反馈数据反应了用户对搜索结果的满意度,同时反应了对商品的满意度。
反馈数据包括:
某查询词结果中商品的点击量和下单量,用户通过搜索进入商品单品页的平均时间,商品的搜索点击转化率。
对于部分商家恶意刷搜索点击和下单的商品,系统将其视为作弊商品,在排序中进行降权处罚。
同时反馈数据也会剔除这些作弊数据。
1.5店铺服务质量
伴随京东POP的发展,商家的服务质量对京东整体的体验有着举足轻重的影响。
京东搜索希望将有着优质服务质量店铺的商品更多的展示给用户,商家店铺质量评分的状况将影响该商家店铺中的商品在京东搜索的排序结果。
1.6作弊
作弊指通过非正常手段快速提升商品在搜索结果的排序。
作弊行为会严重影响用户的搜索体验,对通过提升自身服务质量的商品或者卖家是不公平的。
为减少作弊行为对搜索的不良影响,被判定为作弊的商品将根据其作弊程度进行降权或者屏蔽处理。
目前京东搜索作弊的主要方式有:
商品标题关键词堆砌、虚假交易、重复铺货、错放类目等。
具体的评判规则见
附录一。
作弊、商品质量分、店铺服务质量分和开放平台卖家积分管理相互影响。
商家的商品如果存在搜索作弊情况,该商家会根据开放平台卖家积分管理规则被扣除相应的积分;卖家积分过低会影响该商家的商品质量分、店铺服务质量分,从而影响该卖家商品搜索排序情况。
《“京东JD.COM”开放平台卖家积分管理规则》已由相关部门颁布,其中第二节一般违规说明中第3条和第6条详细描述了对作弊的具体处罚措施。
1.7个性化排序
为满足各类用户在同一搜索词的不同需求,京东搜索已上线排序的个性化服务,实现搜索千人千面。
个性化上线后,同一搜索词,不同的用户可看到不同的搜索结果。
用户行为个性化是指把用户的浏览数据、购买数据使用到搜索排序中,当用户使用搜索时,可以快捷方便的找到这些商品。
随后用户性别模型、用户购买力模型等数据也会被应用到搜索排序中,使排序多样化,满足不同用户的不同搜索需求。
另外,为减少无货商品对搜索体验的影响,搜索结果中该用户所在地区无货的商品在排序中将被就降权处理。
个性化搜索服务会继续调优,增加买卖匹配的精准性,提升用户搜索体验的同时,为商家带来更精准流量
2、非默认排序
非默认排序指按照价格、销量、评论、上架时间等单一维度排序方式。
非默认排序与前文中提到的关键词与商品类目的相关性有很大的关系。
非默认排序的实现是根据用户输入的搜索词,搜索算法系统会计算出该商品的相关类目。
使用价格&销量&评论等非默认排序时,系统将相关性较差的商品类目过滤,不予以展示。
如果在非默认排序中,采销或商家发现自己的商品未展示,请确认自己商品所处的分类是否合理以及商品标题是否包含过多无用信息。
对于错放类目等作弊行为,系统将进行降权或屏蔽处理。
如:
把沙发坐垫的分类设置为“精品沙发”或“休闲沙发”。
3、搜索结果页展示
搜索结果页针对不同类目设计展示样式,垂直化探索不同类目商品的最佳营销展示。
目前京东搜素垂直化展示已包括服饰鞋帽等类目商品的主从合并展示和图书类商品列表展示。
a.服饰鞋帽类主从商品合并展示
服饰鞋帽类商品主从合并展示是指合并同种商品展示,以增大其他商品的曝光机会,同时方便用户快速浏览同种商品的不同款式。
主从合并的策略是根据商品的主商品编号进行合并。
举例:
由于同款商品不同颜色会默认只展示一个;
b.图书类列表展示
图书类商品列表展示增加商品信息量展示,以满足用户搜索图书类商品的浏览习惯。
4、属性筛选规则
搜索用户经常使用属性筛选功能进一步缩小搜索意图,丰富、准确、体验好的属性筛选给用户带来价值。
京东的商家、运营和搜索团队应共同完善具有用户价值的体验。
属性筛选区仅展示相关性高的类目下属性,多个相关类目下属性重合度高时,采用并集展示。
包括该三级类目合集下的品牌、颜色、尺码、价格等商家填写的商品属性,以及搜索系统挖掘的商品评论标签如“大家说”等
例子:
搜“T恤”,男装的三级类目T恤,女装的三级类目T恤都是相关性高的类目,则搜索后默认属性筛选区将男装T恤类目和女装T恤类目所带属性并集展示,如下:
点击男装T恤类目后的属性区:
点击女装T恤类目后的属性区:
附录
附录1:
京东搜索作弊行为评判标准
一、虚假交易
定义:
虚假交易,是指通过不正当方式提高商品销量,妨害买家权益的行为。
举例(包含但不限于):
1.自己注册买家账户进行购买;
2.朋友间不正常的相互购买(建议走线下交易);
3.公司内部人员不正常的相互购买(建议走线下交易);
4.公司分销商购买(建议走线下交易或分销平台);
5.通过与他人协商,以不正当方式提高商品销量;
6.通过第三方炒作平台提高商品销量;
7.恶意使用不真实的物流单号;
8.通过虚假发货或不发货来进行虚假交易,提高商品销量;
9.通过搭配套餐方式或大幅度改价从而炒作销量的行为;
10.其他非正常交易手段来提高商品销量。
处理:
系统识别后对涉嫌虚假交易的订单不计入搜索排序并同时通知卖家。
申诉:
卖家可在被违规处理之时起总计15天内通过线上违规申诉入口提交违规申诉申请,京东质控部门在3-5个工作日对对申诉给出处理结果。
二、错放类目和属性
定义:
属性错放是指发布商品时填写的品牌、材质、规格等商品属性与商品标题或商品描述不符;类目错放是指商品放置的类目与京东要求放置的类目不一致。
举例(包含但不限于):
1.将卡昂品牌的鞋子发布到达芙妮品牌下;
2.将毛衣错放到“3C数码配件市场”类目。
处理:
系统识别商品错放类目和属性后,自动降低商品质量分,在搜索结果中靠后展现。
待卖家将类目或属性调整正确后,恢复排序。
三、更换商品
定义:
修改原有的商品的标题、价格、图片、详情、材质等变成另外一种商品继续出售。
举例(包含但不限于):
1.将A商品明显更换于B商品,例如将防辐射手机套更换为防辐射孕妇服。
2.商品原来以套装或者组合来卖,现在单个卖
3.商品原来单个卖,现在以组合或套装来卖。
处理:
系统识别商品更换行为后,自动降低商品质量得分,永久在搜索结果中靠后展现。
四、标题乱填关键字
定义:
商户为使发布的商品引人注目,或使客户能更多的搜索到所发布的商品,而在商品名称中滥用品牌名称或和本商品无关的字眼,扰乱京东商城正常运营秩序的行为,京东商城判定其相关商品为乱用关键词商品。
举例(包含但不限于):
1.标题中出现(堆砌)与商品无关的品牌;
2.标题中出现对多个商品的描述,例如标题是“安溪铁观音/西湖龙井/乌龙茶”;
3.活动不匹配,例如商品没有参加团购,在标题写参加团购活动;
4.商家故意在所出售的商品标题中或广告语中使用京东商城正在热推的关键词,并且该关键词和内容与商品无直接关联;
处理:
系统识别商品有标题乱填关键字的现象后,自动降低商品质量得分,在搜索结果中靠后展现。
待卖家将标题调整正确后,恢复排序。
五、重复铺货
定义:
完全相同以及商品的重要属性完全相同的商品,只允许发布一次。
违反以上规则,即判定为重复发布。
举例(包含但不限于):
1.完全相同以及商品的重要属性完全相同的商品以多个sku发布,属于重复铺货;
2.同款商品以附带不同的附赠品或附带品以不同sku分别发布,属于重复铺货。
处理:
系统识别商品重复铺货后,选取销量最好的商品正常排序,其他商品进行屏蔽。
随着京东的迅速发展,对卖家和京东都提出了更高的要求,规范商品信息是平台发展的根本。
让我们一起努力,净化和完善我们共有的家园,为消费者提供更好的服务!
注:
以上图片和举例仅作参考
QA:
常见问题
1:
京东搜索规则和排序,京东类目排名规则?
答:
请参见《京东搜索排序白皮书》
2:
标题中的关键字是越靠前权重越大吗?
答:
不是,标题中关键字尽量简洁清晰明了;
例如:
乐爱家创意书柜收纳储物柜LF-W-1030细条棕橡
3:
商品上架时间是否会影响搜索排名
答:
上架时间会影响排名,最新上架商品会提高展示权重(频繁上下架会按照作弊处理)
4:
搜索页店铺展示规则(搜索部分品牌/店铺会出现商家店铺)
答:
1.用户搜索词命中店铺名称(完全匹配),则直接出该店铺。
2.用户搜索词包含品牌词情况下,出来的店铺必须包含该品牌词才可出店铺
3.如果进行了品牌筛选之外的筛选,则不出店铺。
5:
搜索排名多久更新一次
答:
搜索排名会每天更新。
6:
上传新商品多久可以被搜索到
答:
新上传商品实时就可以搜到,最晚六十分钟可被搜到;
7:
是否有搜索降权的说法,如果有,哪些情况会降权?
答:
请参考附录--京东搜索作弊行为评判标准
8:
广告语会影响排序吗?
答:
广告语如果和所售商品不想干或使用京东商城正在热推的关键词会按照作处理。
9:
工单率,IM回复率会影响排序吗?
答:
工单率,IM回复率暂时不会影响排序,后期会影响(会通知)