百度相关性评估培训资料:基础篇Word文档格式.docx
《百度相关性评估培训资料:基础篇Word文档格式.docx》由会员分享,可在线阅读,更多相关《百度相关性评估培训资料:基础篇Word文档格式.docx(9页珍藏版)》请在冰豆网上搜索。
详细全面 5
5.4有效性:
能否真正满足 5
5.5时效性:
快,更快些 5
5.6便捷性:
找到目标信息要花多少时间和成本 5
5.7权威度:
英雄也要问出处 6
6.评估原则 6
6.1站在大多数用户的角度 6
6.2不同Query需求类型,影响需求满足的关键维度不同 6
6.3结果满足的程度和互联网资源丰富程度有关 6
6.4用户需求的满足是一个完整的过程 6
6.5需求用户的语种优先 6
6.6需求用户的地域优先 7
7.本篇小结 7
1.为什么要搜索
“百度一下”,已经渗透到网民的生活当中。
遇到什么问题,下意识地就想百度一下。
百度一下已成为搜索的代名词。
那我们为什么要搜索?
搜索是希望找到某些东西,这些“东西”,我们称为“信息”。
人们搜索,有着明确的目标,想找到信息,解答疑问,或获取资源。
是什么,怎么评,有何用
本篇说的评估,是指判断搜索结果的质量,衡量结果的好坏。
评估的标准是看搜索结果是否能提供用户想找的信息,满足了用户的需求,以及在多大程度上满足了用户的需求。
这里面包含两个层次:
1.搜索结果是否可以提供用户想找的信息。
如果结果正是用户所找,可以满足用户需求,则是好结果;
如果结果里没有用户想要的信息,没有用户关心的内容,则是差结果。
2.多大程度上满足了用户的需求。
在能满足用户需求的前提下,用户获取信息的成本越低越好,成本包括花费的时间、操作的步骤、用户需要的信息是否可以明显的展现出来等。
百度的使命是“让人们最便捷地获取信息,找到所求”,目标是最大程度的满足用户信息需求,不断完善搜索质量。
相关性评估是提升搜索质量的一个基础且核心步骤,我们需要通过评估来发现目前的缺陷,以提高搜索质量。
搜索引擎相关性评估工作的成果,将影响到包括您在内的数亿百度用户的搜索体验。
3.介绍几个名词
为了便于讲述,引入几个名词。
uQuery,也可称查询词、关键词、搜索词,指用户输入到搜索框想要查找的字词。
以后出现的Query,都会用“【”、“】”括起来。
u用户需求,简称“需求”,是人们输入Query想要寻找的信息。
如搜索【新浪微博】,那用户需求是找
u结果,或搜索结果,指百度根据Query返回的搜索结果,可以指具体某一条,也可以指所有的结果。
uURL,统一资源定位符,也称为网页地址,简称网址。
百度主页的url是
“url指代一条结果,指打开后的页面。
u相关搜索,位于搜索结果页下面,跟您的Query相似的一系列查询词。
搜【新浪】,其相关搜索如下图所示。
u搜索框提示,指输入Query的过程中,搜索框下方会自动出现提示词。
如下图:
4.如何推断需求
4.1推断Query背后的用户需求
用户为搜寻信息而来,推断用户的需求是评估的先决条件。
只有准确地判断出用户需求,用户搜索的目的,才能合理地衡量结果的质量、好坏程度。
多数Query,本身表述清楚,含义明确,以其表达出来的意思为准。
如【让子弹飞 剧情】、
【繁体在线转换】、【舞蹈教学视频】等。
有些Query,要依靠个人的知识、经验、甚至搜索结果来辅助推断。
个人的知识、经验每个人掌握的不同,通过查看搜索结果学习了解背景知识后,便能判断出搜索的目的。
比如如【bl怎么去诺森德】,如果您不玩魔兽世界,单看Query,很难弄明白其搜索意图。
通过查看几个搜索结果后,就能知道用户是找魔兽世界部落的玩家怎么去诺森德。
因此,建议遇到不了解的Query,在判断用户需求的时候,先拿Query到百度、Google等搜索引擎上搜索了解一下。
我们需要尽量揣摩Query背后的搜索意图,在个别情况下,有些搜索词实在无法判断用户想找什么信息,如【asdfasdfasdf】,可以跳过(抛弃)这些词。
4.2站在大多数用户的角度,把握Query的主要需求
百度的用户数以亿计,搜索同一个Query,不同人可能有着不同的需求。
这要求评估时要尽量挣脱个人局限,尽可能站在大多数用户的角度来衡量,把握主要需求。
但我们能看到的只是用户搜索的Query,那怎么推断Query背后的主需求呢?
推荐百度的搜索框提示和相关搜索。
借助有关的查询词,辅助推断用户需求。
举个例子,【天龙八部】有多个含义,游戏、小说、电视剧、佛教本义等,那到底哪个是主需求呢。
看搜索框提示,多是游戏相关,前两个“天龙八部2”、“天龙八部2官网”,而“天龙八部
2”也是网游。
看相关搜索,多数是关于网游的,那么可以推断搜【天龙八部】的主要需求是找网络游戏。
天龙八部的搜索框提示:
天龙八部的相关搜索:
5.评估时要考虑的七个维度
评估,即评价结果的质量,判断结果的好坏程度,看结果能给用户带来多少的帮助和价值。
影响用户获取信息的因素很多,我们列出常见的七种。
说的是不是一回事
相关性,是指结果跟用户需求的匹配程度,两者说的是不是一回事,有没有跑题。
相关,是一个好结果最基本的要求。
后面其它的因素都建立在其之上。
如果不相关,那肯定是糟糕的结果。
不相关的典型情况有下面三种。
①掉了Query中的重要成分。
搜【阈怎么发音】,“阈”没了。
搜【查看netFramework版本】,用户是找怎么查看netFramework的版本。
而结果里“查看”没出现。
②拆散了Query,意思完全偏离。
查【林字有多少笔画】,出来“爨字共有多少笔”。
③含意转变。
搜【李文】,出来“李文和”。
搜【介词】,需求是找语法中的介词,而出来的是“介词的电影”。
抓住主要需求
搜同一个Query,不同用户的需求可能不同。
此时,要站在多数用户的角度来判断,越多人查找的需求越重要。
主要需求是最多人找的,满足主要需求的结果,是最好的结果。
搜【天龙八部】,主要需求是网络游戏,其官方网站“
详细全面
多数的查询,越详细的资料内容越好。
搜【感动的作文】,通常用户会参考多篇作文,这是提
供多篇结果比一篇好。
找某个新闻事件,专题要比单篇好。
搜索某部电视剧,如【一起又看流星雨】
,全集通常比某一集好。
搜索【电脑无法开机】,由于原因有多种,分析地越详尽越好。
能否真正满足
用户需求的满足是完整的过程。
一定要注意用户搜索的最终需求是什么,这个结果能不能满足最终的需求。
搜软件下载,不能看到页面上出现这几个字就到此为止。
用户需求是下载安装使用该软件,要准确地评估,必须尝试下载,看其是否真实可用。
若是冒牌伪装,或者有病毒木马,当然非常糟糕。
搜【小学数学教学论文】,出来列表页,都是小学数字方面的论文,怎么样,很好吧,
先别急,要点击一两篇论文,看看其是否完整有效。
要得到某些资源,有时面临着限制,不能直接获取。
如找某文档,要注册、或花钱才能下载;
想看电影,要装插件。
多数用户都希望直接、免费、快速地得到;
装软件、注册、花钱,大大增加了用户的成本,不能算质量高。
如果稀缺资源甚至唯一,那用户可能愿意用更多的成本来获取资源。
举个严重的例子,这个页面(
载”的链接指向“2010.exe”。
搜【酷狗下载】,出这个页面,怎么样,挺好吧。
可惜的是,它不是酷狗而是酷我。
更要命的是,下载后只要一点击软件,马上自动安装,不能中止!
快,更快些
有些查询,对时间有着较高的要求,期望得到最新的信息。
常见的是突发新闻的搜索。
哪怕没有明确指定什么新闻,给出最新的内容也是很好的。
搜【上海大火】,自20101115后相当长一段时间,都是找20101115发生的胶州路大火。
20110228前后几天搜索【奥斯卡】,主要需求是找83届奥斯卡金像奖。
招聘、交易等对时效性要求高,内容的生成时间极其重要。
如果过期了,是陈旧的信息,那对用户通常没什么价值。
找某方面的招聘信息,若招聘已结束,自然没什么用。
几个月前的物品交易信息,很可能交易已完成,现在找到没多大价值。
找【电脑组装配置单】,两年前的配置单,给用户的帮助很小。
搜【U盘价格】,一年前的价格很难维持到现在。
找到目标信息要花多少时间和成本
便捷性,指从打开页面开始,到寻找到所需信息、达到最终目的,所要花费的时间和成本。
如果页面有十来屏,所需信息不在第一屏,很多人立马放弃。
如果页面凌乱,或广告晃眼,或广告很多,同样影响用户。
好的结果应当在第一屏显著位置给出目标信息,让用户轻易地看到。
英雄也要问出处
权威性考察的是内容发布在不同网站、或内容贡献者的身份给用户的不同感觉。
同样的软件,都能下载,用户更倾向点击自己认识的华军、天空、多特、太平洋等知名软件下载站上的结果。
同样一篇新闻,出现在新浪新闻、新华网上,跟bbs、个人博客上的转载相比,前者当然更权威。
医治健康、法律相关问题,医生、律师的回答,肯定更让人们信服。
官方网站发布的信息,比其它网站更可信。
6.评估原则
6.1站在大多数用户的角度
评估结果的质量,最重要的是站在大多数用户的角度。
从大多数用户需求出发,能让用户快速找到所需,才算好结果。
同一个Query,不同用户可能会有不同的需求,需要分析预判各类需求中,大多数用户更需要哪类需求,其次是哪类需求等。
能满足大多数人的需求,即主要需求的结果,好于仅满足小众需求的结果。
6.2不同Query需求类型,影响需求满足的关键维度不同
上文1.5讲述了评估时要考虑的七个维度,对于不同Query需求类型,影响用户需求满足的关键维度不同。
搜软件,有效性是关键。
找范文例文,丰富程度是关键。
寻新闻事件,时效性是关键。
判断时,要识别把握住关键维度。
6.3结果满足的程度和互联网资源丰富程度有关
评估时,要考虑互联网上已有资源的多少。
搜某人的资料,如果网上到处都有,有很多丰富的内容,如果某结果只是简单的介绍,那它不算好;
如果网上关于该人的信息极少甚至没有,那简短的介绍也很不错。
6.4用户需求的满足是一个完整的过程
用户需求的满足是一个完整的过程,评估时,要跟随用户的脚步,走到最后一步,关注结果是否真正地对用户有帮助。
如搜电视剧,出来视频列表页,要随便点击几个,判断能不能看。
如搜软件下载,要尝试下载,看其是不是有效的。
6.5需求用户的语种优先
百度面向中文用户服务。
一般情况下,中文结果要优于外文结果。
国际企业,如【IBM】、