搜索引擎优化SEO相关知识.docx
《搜索引擎优化SEO相关知识.docx》由会员分享,可在线阅读,更多相关《搜索引擎优化SEO相关知识.docx(10页珍藏版)》请在冰豆网上搜索。
搜索引擎优化SEO相关知识
搜索引擎优化SEO的概念
什么是SEO
SEO是SearchEngineOptimization的简称,中文我们称之为“搜索引擎优化”。
它是指遵循搜索引擎的搜索原理,对网站结构、网页文字语言和站点间互动外交略等进行合理规划部署,以改善网站在搜索引擎的搜索表现,进而使网站获得良好的网站排名。
也能够理解为SEO通过对网站结构、关键字选择、网站内容规划进行调整和优化,提高网站在搜索结果中的自然排名。
让网站从XX、GOOGLE等搜索引擎获得更多潜在客户的网络营销方式,
搜索引擎的工作原理
大型互联网搜索引擎的数据中心一般运行数千台甚至数十万台计算机,而且每天向计算机集群里添加数十台机器,以保持与网络进展的同步。
搜集机器自动搜集网页信息,平均速度每秒数十个网页,检索机器则提供容错的可缩放的体系架构以应对每天数千万甚至数亿的用户查询请求。
企业搜索引擎可依照不同的应用规模,从单台计算机到计算机集群都能够进行部署。
搜索引擎一般的工作过程是:
首先对互联网上的网页进行搜集,然后对搜集来的网页进行预处理,建立网页索引库,实时响应用户的查询请求,并对查找到的结果按某种规则进行排序后返回给用户。
搜索引擎的重要功能是能够对互联网上的文本信息提供全文检索。
搜索引擎通过客户端程序接收来自用户的检索请求,现在最常见的客户端程序确实是扫瞄器,实际上它也能够是一个用户开发的简单得多的网络应用程序。
用户输入的检索请求一般是关键词或者是用逻辑符号连接的多个关键词,搜索服务器依照系统关键词字典,把搜索关键词转化为wordID,然后在标引库(倒排文件)中得到docID列表,对docID列表中的对象进行扫描并与wordID进行匹配,提取满足条件的网页,然后计算网页和关键词的相关度,并依照相关度的数值将前K篇结果(不同的搜索引擎每页的搜索结果数不同)返回给用户,其处理流程如图1所示。
搜索引擎的组成
搜索器
搜索器也确实是我们通常所讲的“蜘蛛”。
它的功能是在互联网中漫游,发觉并搜集信息,它搜集的信息类型多种多样,包括HTML页面、XML文档、Newsgroup文章、FTP文件、字处理文档、多媒体信息等。
搜索器是一个计算机程序,事实上现常常采纳分布式和并行处理技术,以提高信息发觉和更新的效率。
商业搜索引擎的搜集器每天能够搜集几百万甚至更多的网页。
搜索器一般要不停地运行,要尽可能多、尽可能快地搜集互联网上的各种类型的新信息。
因为互联网上的信息更新专门快,因此还要定期更新差不多搜集过的旧信息,以幸免死链接和无效链接。
另外,因为Web信息是动态变化的,因此搜集器、分析器和索引器要定期更新数据库,更新周期通常约为几周甚至几个月。
索引数据库越大,更新也越困难。
互联网上的信息太多,即使功能强大的搜集器也不可能搜集互联网上的全部信息。
因此,搜集器采纳一定的搜索策略对互联网进行遍历并下载文档,例如,一般采纳以宽度优先搜索策略为主、线性搜索策略为辅的搜索策略。
在搜集器实现时,系统中维护一个超链队列,或者堆栈,其中包含一些起始URL,搜集器从这些URL动身,下载相应的页面,并从中抽取出新的超链加入到队列或者堆栈中,上述过程不断重复队列直到堆栈为空。
为提高效率,搜索引擎将Web空间按照域名、IP地址或国家域名进行划分,使用多个搜集器并行工作,让每个搜索器负责一个子空间的搜索。
为了便于今后扩展服务,搜集器应能改变搜索范围。
分析器
对搜集器搜集来的网页信息或者下载的文档一般要首先进行分析,以用于建立索引,文档分析技术一般包括:
分词(有些仅从文档某些部分抽词,如Altavista)、过滤(使用停用词表stoplist)、转换(有些对词条进行单复数转换、词缀去除、同义词转换等工作),这些技术往往与具体的语言以及系统的索引模型紧密相关。
索引器
索引器的功能是对搜索器所搜索的信息进行分析处理,从中抽取出索引项,用于表示文档以及生成文档库的索引表。
索引项有元数据索引项和内容索引项两种:
元数据索引项与文档的语意内容无关,如作者名、URL、更新时刻、编码、长度、链接流行度等等;内容索引项是用来反映文档内容的,如关键词及其权重、短语、单字等等。
内容索引项能够分为单索引项和多索引项(或称短语索引项)两种。
单索引项关于英文来讲是英语单词,比较容易提取,因为单词之间有天然的分隔符(空格);关于中文等连续书写的语言,必须进行词语的切分。
在搜索引擎中,一般要给单索引项给予一个权值,以表示该索引项对文档的区分度,同时用来计算查询结果的相关度。
使用的方法一般有统计法、信息论法和概率法。
短语索引项的提取方法有统计法、概率法和语言学法。
为了快速查找到特定的信息,建立索引数据库是一个常用的方法,立即文档表示为一种便于检索的方式并存储在索引数据库中。
索引数据库的格式是一种依靠于索引机制和算法的专门数据存储格式。
索引的质量是Web信息检索系统成功的关键因素之一。
一个好的索引模型应该易于实现和维护、检索速度快、空间需求低。
搜索引擎普遍借鉴了传统信息检索中的索引模型,包括倒排文档、矢量空间模型、概率模型等。
例如在矢量空间索引模型中,每个文档d都表示为一个范化矢量V(d)=(t1,w1(d)…ti,w1(d)…tn,wn(d))。
其中ti为词条项,wi(d)为ti在d中的权值,一般被定义为ti在d中出现频率tfi(d)的函数。
索引器的输出是索引表,它一般使用倒排形式(InversionList),即由索引项查找相应的文档。
索引表也可能记录索引项在文档中出现的位置,以便检索器计算索引项之间的相邻或接近关系(proximity)。
索引器能够使用集中式索引算法或分布式索引算法。
当数据量专门大时,必须实现实时索引(InstantIndexing),否则就无法跟上信息量急剧增加的速度。
索引算法对索引器的性能(如大规模峰值查询时的响应速度)有专门大的阻碍。
一个搜索引擎的有效性在专门大程度上取决于索引的质量。
检索器
检索器的功能是依照用户的查询在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制。
检索器常用的信息检索模型有集合理论模型、代数模型、概率模型和混合模型等多种,能够查询到文本信息中的任意字词,不管出现在标题依旧正文中。
用户接口
用户接口的作用是为用户提供可视化的查询输入和结果输出界面,方便用户输入查询条件、显示查询结果、提供用户相关性反馈机制等,其要紧目的是方便用户使用搜索引擎,高效率、多方式地从搜索引擎中得到有效的信息。
用户接口的设计和实现必须基于人机交互的理论和方法,以适应人类的思维和使用适应。
在查询界面中,用户按照搜索引擎的查询语法制定待检索词条及各种简单或高级检索条件。
简单接口只提供用户输入查询串的文本框,复杂接口能够让用户对查询条件进行限制,如逻辑运算(与、或、非)、相近关系(相邻、NEAR)、域名范围(如edu、com)、出现位置(如标题、内容)、时刻信息、长度信息等等。
目前一些公司和机构正在考虑制定查询选项的标准。
在查询输出界面中,搜索引擎将检索结果展现为一个线性的文档列表,其中包含了文档的标题、摘要、快照和超链等信息。
由于检索结果中相关文档和不相关文档相互混杂,用户需要逐个扫瞄以找出所需文档。
搜索引擎的市场份额
闻名的搜索引擎
做搜索引擎优化SEO的好处
最佳网络品牌塑造效果
最好的排名位置
最全最好的推广
最高的性价比
优良的转化率
长期的效果
SEO相关专业术语
SEO
SEO是SearchEngineOptimization的简称,中文我们称之为“搜索引擎优化”。
它是指遵循搜索引擎的搜索原理,对网站结构、网页文字语言和站点间互动外交略等进行合理规划部署,以改善网站在搜索引擎的搜索表现,进而增加客户发觉并访问网站的可能性的如此一个过程.搜索引擎优化也是一种科学的进展观和方法论,它随着搜索引擎的进展而进展,同时也促进了搜索引擎的进展。
SEM
搜索引擎营销(SearchEngineMarketing,简称SEM):
是一种新的网络营销形式。
SEM所做的确实是全面而有效的利用搜索引擎来进行网络营销和推广。
SEM追求最高的性价比,以最小的投入,获最大的来自搜索引擎的访问量,并产生商业价值。
那个地点的SEM不包括竞价排名、购买关键词广告等付费手段。
竞价排名
竞价排名服务,是由客户在搜索引擎上为自己的网页购买关键字排名,按点击计费的一种服务。
客户能够通过调整每次点击付费价格,操纵自己在特定关键字搜索结果中的排名;并能够通过设定不同的关键词捕捉到不同类型的的目标访问者。
PPC广告
PPC是英文PayPerClick的缩写形式,其中文意思确实是点击付费广告。
点击付费广告是大公司最常用的网络广告形式。
这种方法费用专门高,但效果也专门好。
比如搜狐和新浪首页上的banner广告。
这种形式的广告是如此收费的:
起价+点击数x每次点击的价格。
越是闻名的搜索引擎,起价越高,最高可达数万甚至数十万。
而每次点击的价格在0.30元左右。
提供点击付费的网站特不多,要紧有各大门户网站(如搜狐、新浪)搜索引擎(Google和XX),以及其他扫瞄量较大的网站,比如提供软件下载的华军等等。
SE
搜索引擎体验(SEOExperience,简称SE):
是搜索引擎算法对网站的评价,算法对网站评价好排名好。
算法是如何样评价网站的呢?
大量优质外链、原创性文章,高频率更新、网站结构好算法、用户体验等符合算法的对网站的评价就好。
ALEXA
ALEXA是一家专门公布网站世界排名的网站。
Alexa的网站世界排名要紧分两种:
综合排名和分类排名。
Alexa排名是目前常引用的用来评价某一网站访问量的一个指标。
综合排名也叫绝对排名,即特定的一个网站在所有网站中的名次。
Alexa每三个月公布一次新的网站综合排名。
此排名的依据是用户链接数(UsersReach)和页面扫瞄数(PageViews)三个月累积的几何平均值。
分类排名,一是按主题分类,比如新闻、娱乐、购物等,Alexa给出某个特定网站在同一类网站中的名次。
二是按语言分类,目前共分20种语言,比如英文网站、中文网站[Chinese(simpl)和Chinese(trad)]等,给出特定站点在所有此类语言网站中的名次。
UE
用户体验(userExperience,简称UE):
是一种纯主观的在用户使用一个产品(服务)的过程中建立起来的心理感受。
具体到网站优化SEO上,一个网站用户体验好就也确实是讲用户在网站上专门容易找到需求的信息,同时没有阻碍用户扫瞄信息的障碍物如弹窗,广告等无用信息。
PageRank
PageRank简称PR。
它是迷恋Google的人们用来测试其站点在Google中的排名的一种度量标准。
SEO和搜索引擎营销(SEM)专家也使用那个术语描述网页在SERP中的排名以及Google依照排名算法给予站点的分数。
不管如何定义,PageRank差不多上SEO的重要部分。
爬行器(Spider)
爬行器在英文中称为Robot,通常我们还称它为蜘蛛,每个搜索引擎都有自己的爬行器。
它们是搜索引擎用来抓取网页的工具。
它是一个软件或者讲一系列自动程序(显然,不是一部机器)。
沙盒效应(sandboxeffect)
用来Google和其他搜索引擎处理新站点的方法。
它们会对那些链接流行度迅速攀升的网站进行考核和冷处理。
网页能够展现它要的内容,但会被放在“沙箱”里面,而对任何搜索请求都可不能得到最高排名。
假如其后来的流行度通过一段时刻还保持不变,或者逐渐上升,那么搜索引擎就开始取消冷处理同时给链接流行度更高的权重,使得搜索排名上升。
沙盒效应通常在1各月到6各月不等,这也是什么缘故网站优化需要较长的时刻,特不是新网站。
黑帽SEO(BlackhatSEO)
用