百度相关性评估培训资料：基础篇Word文档格式.docx

资源描述

百度相关性评估培训资料：基础篇Word文档格式.docx

《百度相关性评估培训资料：基础篇Word文档格式.docx》由会员分享，可在线阅读，更多相关《百度相关性评估培训资料：基础篇Word文档格式.docx（9页珍藏版）》请在冰豆网上搜索。

百度相关性评估培训资料：基础篇Word文档格式.docx

详细全面 5

5.4有效性：

能否真正满足 5

5.5时效性：

快，更快些 5

5.6便捷性：

找到目标信息要花多少时间和成本 5

5.7权威度：

英雄也要问出处 6

6.评估原则 6

6.1站在大多数用户的角度 6

6.2不同Query需求类型，影响需求满足的关键维度不同 6

6.3结果满足的程度和互联网资源丰富程度有关 6

6.4用户需求的满足是一个完整的过程 6

6.5需求用户的语种优先 6

6.6需求用户的地域优先 7

7.本篇小结 7

1.为什么要搜索

“百度一下”，已经渗透到网民的生活当中。

遇到什么问题，下意识地就想百度一下。

百度一下已成为搜索的代名词。

那我们为什么要搜索？

搜索是希望找到某些东西，这些“东西”，我们称为“信息”。

人们搜索，有着明确的目标，想找到信息，解答疑问，或获取资源。

是什么，怎么评，有何用

本篇说的评估，是指判断搜索结果的质量，衡量结果的好坏。

评估的标准是看搜索结果是否能提供用户想找的信息，满足了用户的需求，以及在多大程度上满足了用户的需求。

这里面包含两个层次：

1.搜索结果是否可以提供用户想找的信息。

如果结果正是用户所找，可以满足用户需求，则是好结果；

如果结果里没有用户想要的信息，没有用户关心的内容，则是差结果。

2.多大程度上满足了用户的需求。

在能满足用户需求的前提下，用户获取信息的成本越低越好，成本包括花费的时间、操作的步骤、用户需要的信息是否可以明显的展现出来等。

百度的使命是“让人们最便捷地获取信息，找到所求”，目标是最大程度的满足用户信息需求，不断完善搜索质量。

相关性评估是提升搜索质量的一个基础且核心步骤，我们需要通过评估来发现目前的缺陷，以提高搜索质量。

搜索引擎相关性评估工作的成果，将影响到包括您在内的数亿百度用户的搜索体验。

3.介绍几个名词

为了便于讲述，引入几个名词。

uQuery，也可称查询词、关键词、搜索词，指用户输入到搜索框想要查找的字词。

以后出现的Query，都会用“【”、“】”括起来。

u用户需求，简称“需求”，是人们输入Query想要寻找的信息。

如搜索【新浪微博】，那用户需求是找

u结果，或搜索结果，指百度根据Query返回的搜索结果，可以指具体某一条，也可以指所有的结果。

uURL，统一资源定位符，也称为网页地址，简称网址。

百度主页的url是

“url指代一条结果，指打开后的页面。

u相关搜索，位于搜索结果页下面，跟您的Query相似的一系列查询词。

搜【新浪】，其相关搜索如下图所示。

u搜索框提示，指输入Query的过程中，搜索框下方会自动出现提示词。

如下图：

4.如何推断需求

4.1推断Query背后的用户需求

用户为搜寻信息而来，推断用户的需求是评估的先决条件。

只有准确地判断出用户需求，用户搜索的目的，才能合理地衡量结果的质量、好坏程度。

多数Query，本身表述清楚，含义明确，以其表达出来的意思为准。

如【让子弹飞剧情】、

【繁体在线转换】、【舞蹈教学视频】等。

有些Query，要依靠个人的知识、经验、甚至搜索结果来辅助推断。

个人的知识、经验每个人掌握的不同，通过查看搜索结果学习了解背景知识后，便能判断出搜索的目的。

比如如【bl怎么去诺森德】，如果您不玩魔兽世界，单看Query，很难弄明白其搜索意图。

通过查看几个搜索结果后，就能知道用户是找魔兽世界部落的玩家怎么去诺森德。

因此，建议遇到不了解的Query，在判断用户需求的时候，先拿Query到百度、Google等搜索引擎上搜索了解一下。

我们需要尽量揣摩Query背后的搜索意图，在个别情况下，有些搜索词实在无法判断用户想找什么信息，如【asdfasdfasdf】，可以跳过（抛弃）这些词。

4.2站在大多数用户的角度，把握Query的主要需求

百度的用户数以亿计，搜索同一个Query，不同人可能有着不同的需求。

这要求评估时要尽量挣脱个人局限，尽可能站在大多数用户的角度来衡量，把握主要需求。

但我们能看到的只是用户搜索的Query，那怎么推断Query背后的主需求呢？

推荐百度的搜索框提示和相关搜索。

借助有关的查询词，辅助推断用户需求。

举个例子，【天龙八部】有多个含义，游戏、小说、电视剧、佛教本义等，那到底哪个是主需求呢。

看搜索框提示，多是游戏相关，前两个“天龙八部2”、“天龙八部2官网”，而“天龙八部

2”也是网游。

看相关搜索，多数是关于网游的，那么可以推断搜【天龙八部】的主要需求是找网络游戏。

天龙八部的搜索框提示：

天龙八部的相关搜索：

5.评估时要考虑的七个维度

评估，即评价结果的质量，判断结果的好坏程度，看结果能给用户带来多少的帮助和价值。

影响用户获取信息的因素很多，我们列出常见的七种。

说的是不是一回事

相关性，是指结果跟用户需求的匹配程度，两者说的是不是一回事，有没有跑题。

相关，是一个好结果最基本的要求。

后面其它的因素都建立在其之上。

如果不相关，那肯定是糟糕的结果。

不相关的典型情况有下面三种。

①掉了Query中的重要成分。

搜【阈怎么发音】，“阈”没了。

搜【查看netFramework版本】，用户是找怎么查看netFramework的版本。

而结果里“查看”没出现。

②拆散了Query，意思完全偏离。

查【林字有多少笔画】，出来“爨字共有多少笔”。

③含意转变。

搜【李文】，出来“李文和”。

搜【介词】，需求是找语法中的介词，而出来的是“介词的电影”。

抓住主要需求

搜同一个Query，不同用户的需求可能不同。

此时，要站在多数用户的角度来判断，越多人查找的需求越重要。

主要需求是最多人找的，满足主要需求的结果，是最好的结果。

搜【天龙八部】，主要需求是网络游戏，其官方网站“

详细全面

多数的查询，越详细的资料内容越好。

搜【感动的作文】，通常用户会参考多篇作文，这是提

供多篇结果比一篇好。

找某个新闻事件，专题要比单篇好。

搜索某部电视剧，如【一起又看流星雨】

，全集通常比某一集好。

搜索【电脑无法开机】，由于原因有多种，分析地越详尽越好。

能否真正满足

用户需求的满足是完整的过程。

一定要注意用户搜索的最终需求是什么，这个结果能不能满足最终的需求。

搜软件下载，不能看到页面上出现这几个字就到此为止。

用户需求是下载安装使用该软件，要准确地评估，必须尝试下载，看其是否真实可用。

若是冒牌伪装，或者有病毒木马，当然非常糟糕。

搜【小学数学教学论文】，出来列表页，都是小学数字方面的论文，怎么样，很好吧，

先别急，要点击一两篇论文，看看其是否完整有效。

要得到某些资源，有时面临着限制，不能直接获取。

如找某文档，要注册、或花钱才能下载；

想看电影，要装插件。

多数用户都希望直接、免费、快速地得到；

装软件、注册、花钱，大大增加了用户的成本，不能算质量高。

如果稀缺资源甚至唯一，那用户可能愿意用更多的成本来获取资源。

举个严重的例子，这个页面（

载”的链接指向“2010.exe”。

搜【酷狗下载】，出这个页面，怎么样，挺好吧。

可惜的是，它不是酷狗而是酷我。

更要命的是，下载后只要一点击软件，马上自动安装，不能中止！

快，更快些

有些查询，对时间有着较高的要求，期望得到最新的信息。

常见的是突发新闻的搜索。

哪怕没有明确指定什么新闻，给出最新的内容也是很好的。

搜【上海大火】，自20101115后相当长一段时间，都是找20101115发生的胶州路大火。

20110228前后几天搜索【奥斯卡】，主要需求是找83届奥斯卡金像奖。

招聘、交易等对时效性要求高，内容的生成时间极其重要。

如果过期了，是陈旧的信息，那对用户通常没什么价值。

找某方面的招聘信息，若招聘已结束，自然没什么用。

几个月前的物品交易信息，很可能交易已完成，现在找到没多大价值。

找【电脑组装配置单】，两年前的配置单，给用户的帮助很小。

搜【U盘价格】，一年前的价格很难维持到现在。

找到目标信息要花多少时间和成本

便捷性，指从打开页面开始，到寻找到所需信息、达到最终目的，所要花费的时间和成本。

如果页面有十来屏，所需信息不在第一屏，很多人立马放弃。

如果页面凌乱，或广告晃眼，或广告很多，同样影响用户。

好的结果应当在第一屏显著位置给出目标信息，让用户轻易地看到。

英雄也要问出处

权威性考察的是内容发布在不同网站、或内容贡献者的身份给用户的不同感觉。

同样的软件，都能下载，用户更倾向点击自己认识的华军、天空、多特、太平洋等知名软件下载站上的结果。

同样一篇新闻，出现在新浪新闻、新华网上，跟bbs、个人博客上的转载相比，前者当然更权威。

医治健康、法律相关问题，医生、律师的回答，肯定更让人们信服。

官方网站发布的信息，比其它网站更可信。

6.评估原则

6.1站在大多数用户的角度

评估结果的质量，最重要的是站在大多数用户的角度。

从大多数用户需求出发，能让用户快速找到所需，才算好结果。

同一个Query，不同用户可能会有不同的需求，需要分析预判各类需求中，大多数用户更需要哪类需求，其次是哪类需求等。

能满足大多数人的需求，即主要需求的结果，好于仅满足小众需求的结果。

6.2不同Query需求类型，影响需求满足的关键维度不同

上文1.5讲述了评估时要考虑的七个维度，对于不同Query需求类型，影响用户需求满足的关键维度不同。

搜软件，有效性是关键。

找范文例文，丰富程度是关键。

寻新闻事件，时效性是关键。

判断时，要识别把握住关键维度。

6.3结果满足的程度和互联网资源丰富程度有关

评估时，要考虑互联网上已有资源的多少。

搜某人的资料，如果网上到处都有，有很多丰富的内容，如果某结果只是简单的介绍，那它不算好；

如果网上关于该人的信息极少甚至没有，那简短的介绍也很不错。

6.4用户需求的满足是一个完整的过程

用户需求的满足是一个完整的过程，评估时，要跟随用户的脚步，走到最后一步，关注结果是否真正地对用户有帮助。

如搜电视剧，出来视频列表页，要随便点击几个，判断能不能看。

如搜软件下载，要尝试下载，看其是不是有效的。

6.5需求用户的语种优先

百度面向中文用户服务。

一般情况下，中文结果要优于外文结果。

国际企业，如【IBM】、

展开阅读全文