野狼网站内部优化手册汇总.docx
《野狼网站内部优化手册汇总.docx》由会员分享,可在线阅读,更多相关《野狼网站内部优化手册汇总.docx(59页珍藏版)》请在冰豆网上搜索。
野狼网站内部优化手册汇总
野狼网络传媒有限公司
网
站
内
部
优
化
手
册
2015年4月27日最后修改by野狼
封皮优化手册版本号------------------------------------------第1页
目录主目录------------------------------------------------第2页
前言网站内部优化--------------------------------------------第3页
第一章网站功能优化-------------------------------------------第3页
1.1网站地图-------------------------------------------第7页
1.2RSS源----------------------------------------------第7页
1.3robots.txt-----------------------------------------第7页
1.4伪静态---------------------------------------------第7页
1.5静态生成-------------------------------------------第7页
1.6404页面--------------------------------------------第7页
1.7XXPING-------------------------------------------第7页
1.8站内搜索-------------------------------------------第7页
第二章网站配置技巧-------------------------------------------第4页
2.1标题撰写-------------------------------------------第7页
2.2关键词选择-----------------------------------------第7页
2.3描述书写-------------------------------------------第7页
2.4关键词布局-----------------------------------------第7页
2.5301永久重定向--------------------------------------第7页
2.6302临时重定向--------------------------------------第7页
2.7二级域名--------------------------------------第7页
第三章目录结构优化-------------------------------------------第4页
3.1扁平化结构----------------------------------------第7页
2.2伪静态配置-----------------------------------------第7页
第四章链接结构优化-------------------------------------------第5页
4.1导航优化-------------------------------------------第7页
4.2面包屑导航-----------------------------------------第7页
4.3蜘蛛陷阱-----------------------------------------第7页
4.4链接工厂-----------------------------------------第7页
4.5隐藏链接-----------------------------------------第7页
4.6nofollow的使用------------------------------------第7页
第五章内容优化----------------------------------------------第6页
4.1图片ALT标签----------------------------------------第7页
4.2H等强调标签---------------------------------------第7页
4.3锚文本----------------------------------------第7页
4.2日常更新-----------------------------------------第7页
第六章改版处理-----------------------------------------------第6页
7.1改版注意事项--------------------------------------第7页
7.2301重定向-----------------------------------------第8页
前言
野狼出教程是一直以来的梦想,一直都想把自己的优化经验传递给每一个需要的人,最早有这样的想法应该是2012年的下半年,曾经也出过一些PPT之类的,说是准备出视频教程。
可是真的太忙了,毕竟客户至上是每一个服务型公司必须要做的事情。
但是,我们始终都没有忘记那个梦想和承诺。
千里之行始于足下,所以决定一点一点的写,一点一点的出。
但是为什么从当初的视频教程,到PPT教程,再到现在的文字教程,原因有两个:
1、文字教程编辑更随意。
因为文字的话我们可以很轻松的去写,把自己的想法完全写出来,如果是PPT的教程估计会是一个框架,很多人可能会看了之后还是不懂。
写成文字的教程,我们就可以随心所欲。
2、我们优化的网站也需要一些文章去更新。
平时我们更新文章的时候都是绞尽脑汁,不知道怎么确定主题,不知道用户需要哪些类型的东西。
现在根据这个思路,可以有计划地去更新网站,何乐而不为呢。
综上所述,目前的状况来讲,写一个文字教程对我们来说是比较适合的,等于说是双赢:
一方面我们更新了自己的网站,另一方面是也能兑现我们的承诺,让更多的人学到野狼纯白帽SEO的技巧。
我们这套文字教程将希望有这样的特色:
1、语言平实。
说实在话让说文绉绉的话我们也不会,也没有这个精力去做,那就只能靠着感觉,平实的去叙说每一个细节。
只有这样的阐述能让我们舒服,希望你能够喜欢这样的叙述吧。
2、讲解详细。
以前写过一个《野狼纯白帽SEO教程》总共有6节,只有6篇的文章,在我们的网站上有发布,有兴趣的话可以去看看。
写过之后感到很不满意,因为文章内容太笼统了,像是高手论道,而不是教程了。
所以这一次,痛定思痛一定要仔细的讲解每一个细节,做成百科全书的样子(^-^希望如此吧,野狼努力!
)。
3、交互式更新。
这个教程将会不断地完善,通过网友的意见和建议,不断地更新最新版。
因为搜索引擎的变化比较快,所以我们会根据搜索引擎的变化情况以及网友们反馈的情况添加或者是修改很多东西。
教程会同步更新在野狼的网站上,也会不断地完善并替换以前的版本。
再次也欢迎大家能够给我们多提意见。
这个教程将会分为《网站内部优化手册》和《网站外链优化手册》两部分。
《网站内部优化手册》是由野狼SEO员工内部教程完善而来,并且会成为我们给客户优化网站的操作手册,在实践中不断地完善,在使用的过程中建议要稍微学一些技术。
也欢迎加入我们的QQ交流群中!
网站优化手册内容将同步发布在QQ群和网站中,欢迎积极讨论!
第一章网站功能优化
【简述】网站功能优化,就是网站需要添加一些功能,使之更适合网站优化的要求。
这一章会讲到的有我们常见的功能和不常见的功能,例如常见的功能有:
网站地图、robots.txt、RSS源、伪静态、静态生成、404页面、站内搜索、XX分享;还有一些不常见的功能例如:
XXPING等。
这些功能其实都是要在网站建设的时候考虑到的,但是我们很少看到有网站会拥有全部的功能。
如果你的网站是刚做好,或者是还没有做好,那么建议你让网站建设公司尽最大努力完成这些功能,他会对网站后期的优化起到至关重要的作用。
1.1网站地图
概述
网站地图,也叫站点地图。
普遍的格式有两种一种是HTML(或htm)的,另外一种是XML的。
一般来讲,XX亲来的网站地图是html的,而谷歌亲睐的是XML地图,所以XML地图又被叫做谷歌地图,也有人叫HTMl的地图叫XX地图。
网站地图的作用
给你的网站添加地图有很多好处:
1.为搜索引擎蜘蛛提供可以浏览整个网站的链接简单的体现出网站的整体框架出来给搜索引擎看;
2.为搜索引擎蜘蛛提供一些链接,指向动态页面或者采用其他方法比较难以到达的页面;
3.作为一种潜在的着陆页面,可以为搜索流量进行优化;
4.如果访问者试图访问网站所在域内并不存在的URL,那么这个访问者就会被转到“无法找到文件”的错误页面,而网站地图可以作为该页面的“准”内容。
怎样添加网站地图
网站地图有三种常见的添加方法:
程序本身自带、SiteMapX软件、小爬虫在线工具。
三种方式优劣如下:
1.程序本身自带:
这是最好的一种办法,会根据网站的更新自动进行更新,减少了很多人工的操作,建议所有的网站都要在设计的时候加上站长地图;
2.SiteMapX软件:
如果程序没有自带的话,野狼一般是采用这种方式添加站长地图的,他可以写入FTP账号信息,自动抓取生成并且上传到网站空间,但是他的地图是有广告的,最好是人工去掉。
软件下载网址:
;
3.小爬虫在线工具:
在线生成站长地图,用起来比较方便,不用安装程序,但是他的在线版本的有时候会不能使用,比较纠结。
偶尔凑合一下还可以。
网址为-xml.org/;
创建网站地图的技巧
网站地图的作用非常重要,它不仅要满足访问用户的需求,还要取悦搜索引擎蜘蛛。
在设计上也有一些技巧来让用户和蜘蛛都获得满意:
1.网站地图要包含最重要的一些页面
如果网站地图包含太多链接,人们浏览的时候就会迷失。
因此如果网站页面总数超过了100个的话,就需要挑选出最重要的页面。
建议挑选下面这些页面放到网站地图中去:
1)产品分类页面。
2)主要产品页面。
3)FAQ和帮助页面。
4)位于转化路径上的所有关键页面,访问者将从着陆页面出发,然后沿着这些页面实现转化。
5)访问量最大的前10个页面。
6)如果有站内搜索引擎的话,就挑选出从该搜索引擎出发点击次数最高的那些页面。
2.网站地图布局一定要简洁,所有的链接都是标准的HTML文本,并且要尽可能多的包含关键字
不要使用图片来做网站地图里的链接,这样蜘蛛就不能跟随了。
一定要使用标准的HTML文本来做链接,链接中要包括尽可能多的目标关键字。
比如:
可以使用“无公害除草剂、杀虫剂和杀菌剂”来代替“我们的产品”为标题。
3.尽量在站点地图上增加文本说明
增加文本会给蜘蛛提供更加有索引价值的内容,以及有关内容的更多线索。
4.在每个页面里面放置网站地图的链接
用户一般会期望每个页面的底部都有一个指向网站地图的链接,你可以充分利用人们的这一习惯。
如果网站有一个搜索栏的话,那么可以在这个搜索栏的附近增加一个指向网站地图的链接,甚至可以在搜索结果页面的某个固定位置放置网站地图的链接。
5.确保网站地图里的每一个链接都是正确、有效的
如果在网站地图里出现的链接是坏链和死链,对搜索引擎的影响是非常不好的。
如果链接比较少,你可以把所有的链接都点一遍,以确保每一个链接是有效的。
如果链接比较多,可以使用一些链接检查工具来检测。
6.可以把sitemap写进robots.txt里
在引擎爬虫进来抓取网页的时候,会首先查看robots.txt、如果首先把sitemap写进robots.txt里那么在效率上会大大提高,从而获得SEM的好感。
本文网址:
/535.html由野狼网络发布,转载请注明
1.2RSS源
RSS源概述
RSS(简易信息聚合,也叫聚合内容)是一种描述和同步网站内容的格式。
一个RSS文件就是一段规范的XML数据,该文件一般以rss,xml或者rdf作为后缀,当然你也可以用html,asp,php作为后缀,但是文本内容格式是比较固定的,是XML数据,要不其他软件或者是使用者会看不懂的。
添加RSS源的好处
1、搜索引擎会认为有rss源的网站有更好的用户体验。
2、有利于提高网站用户粘性,订阅该网站的用户会第一时间看到网站更新的内容。
3、配合XX的ping功能使用,RSS数据提交给搜索引擎后,能加快搜索引擎收录与信息的推广。
怎样添加RSS文件
1、网站程序自带。
有很多程序就是自带这种功能的,野狼做的网站都有这样的功能。
2、自己在程序里边开发。
比如说我们网站的就是自己开发的,其实很简单,就是读取数据库数据,然后把栏目和文章列表弄出来,你可以把网站地图的程序复制一份,然后根据RSS的XML数据格式,做一个。
数据格式可以参照我们网站的RSS源:
3、弄一个固定的,手动更新。
就是跑别人网站上下载一个,然后根据格式,把网址和链接改成自己的,可以定期更新,也可以在有新文章发布的时候更新一下。
1.3robots.txt
robots.txt概述
网站的标准配置是要在根目录下有一个robots.txt的文件,用来说明让不让蜘蛛抓取,或者是给搜索引擎一个指引,告诉他哪些网页可以抓取,哪些不可以,告诉他们网站地图在什么地方等等。
robots.txt是一个协议,这个协议不具有强制性,有些搜索引擎也会不遵守(一般都会遵守的)。
当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面。
XX官方建议,仅当您的网站包含不希望被搜索引擎收录的内容时,才需要使用robots.txt文件。
如果您希望搜索引擎收录网站上所有内容,请勿建立robots.txt文件。
robots.txt设置方法
直接看范例吧:
我们的网站robots.txt文件
User-agent:
*
Allow:
/
第一行的意思是,这个协议适用的范围是对准所有搜索引擎有效,你也可以用Baiduspider(XX网页搜索引擎)、Googlebot(谷歌网页搜索引擎)
第二行的意思是,允许抓取全部的页面,如果你AllOW后边加个/bin/就是允许ALLOW目录被抓取,当然不想让抓取的可以写成Disallow:
/bin/。
每一条规则占一行。
可以用多条规则。
如果你不想太深究这个问题,可以用站长之家提供的工具生成一个robots.txt吧!
网址是/
1.4伪静态
什么叫伪静态?
伪静态是相对于静态而言的。
我们知道web1.0的时候网页都是一个一个的,没有数据库之类的,这个时候的每一个网页都是一个文件,但是web2.0年代,动态网页出现了,一个文件后边的参数不一样,网页数据就不一样,这样的网站就叫做动态网站。
例如,静态网页的网址一般是:
/535.html,而动态网站的网址一般是这种形式的。
伪静态其实就是通过特点的技术(其实就是配置服务器的一些参数)让用户可以用静态页面的网址形式去访问动态网站。
配置伪静态的前提条件
1、程序支持伪静态。
有很多程序后台可以有伪静态选项,选择了之后网站的内部链接就会变成静态的形式,这样配置一下伪静态功能就可以直接使用了。
如果是程序不支持伪静态,就会相对麻烦,要去修改程序里的链接,有的程序比较复杂就很难修改了。
总结一下程序要支持伪静态,就是方便把网站内链变成静态的形式。
2、空间支持伪静态功能。
伪静态功能的支持可以有很多种实现方法,具体的可以咨询空间提供商。
不同主机环境下的伪静态配置方法
1、Apache(一般支持PHP的程序)。
.htaccess文件用记事本打开输入例如以下下代码(具体要根据网站程序的不同去配置,一般大型的开源程序都带的有):
#以下是配置规则
RewriteEngineOn
RewriteBase/
RewriteCond%{REQUEST_FILENAME}!
-f
RewriteCond%{REQUEST_FILENAME}!
-d
RewriteRule./index.php[L]2、
需要提醒的是:
.htaccess这种文件名在win系统的电脑上是不能直接创建的,可以去网上下载一个,修改后上传到网站根目录。
2、IIS6+ISAPI_Rewrite3。
这一种可以用.htaccess文件也可以用httpd.conf
3、IIS6+ISAPI_Rewrite2。
4、IIS7。
一般是用webconfig.具体的配置方法要问空间商,因为每一个伪静态组件的版本的写法不太一样.
1.5静态生成
静态生成技术原理
静态生成技术原理就是:
利用各种WEB编程语言如ASP、PHP、JSP等在后台将数据生成为一个一个的静态页面,例如HTML,HTM文件。
一般来讲静态页面是用WEB程序读取模板文件,并读取数据库数据,然后用数据替换模板中特定的标签并组合成新的数据文件输出为静态页面文件。
静态生成技术的优点:
1、可以实现前后台分开。
后台数据的调整和变动,数据库停止等都不会影响网站的正常使用。
2、加快页面打开浏览速度,静态页面无需连接数据库打开速度较动态页面有明显提高。
3、有利于搜索引擎优化SEO,Baidu、Google都会优先收录静态页面,不仅被收录的快还收录的全,搜索引擎比较喜欢收录静态页面。
4、减轻服务器负担,浏览网页无需调用系统数据库。
5、网站更安全,HTML页面不会受Asp相关漏洞的影响。
静态页面从理论上讲是没有攻击漏洞的
静态生成技术的缺点:
当然静态生成技术也会有一些缺点在,如果说有些网站有特殊要求,就不能用静态生成技术去做网站了,可以考虑做成伪静态的。
1、数据更新之后需要生成一下才能看到网页。
2、功能性要求强的页面不能用静态的,例如搜索页面,还有一些数据需要同步更新的页面都河南永纯静态的页面。
我们应该选择伪静态还是真静态?
1、使用真静态和假静态对SEO来说没有什么区别
2、使用真静态可能将导致硬盘损坏并将影响论坛性能
3、使用伪静态将占用一定量的CPU占有率,大量使用将导致CPU超负荷
4、最重要的一点,我们要静态是为了SEO
综上所述:
1、使用真静态的方法可以直接排除了,因为无论怎么生成,对硬盘来说都是很伤的。
2、既然真伪静态的效果一样,我们就可以选择伪静态了。
3、但是伪静态大量使用会照成CPU超负荷。
4、所以我们只要不大量使用就可以了。
5、既然静态只是给SEO看的,我们只需要伪静态给SEO就行了,不需要给用户使用。
6、所以我们只要在专门提供给SEO爬的Archiver中使用伪静态就可以了。
7、谢谢大家耐心看我写的文章。
8、有何不解的地方或是有不同的看法欢迎提出。
关于伪静态和真静态的评论
真正的静态化和伪静态还是有本质的区别的。
为浏览用户处理一个纯粹htm和一个调用多个数据的php在CPU的使用率方面明显前者少。
记得原来有个人说html下载硬盘读写频繁,他这么说好像读取数据库不用读写磁盘似的,何况还有一大堆缓存的零散php也是放在硬盘的,这些读取不用磁盘操作么?
可笑。
读取单个htm+图片Flash等附件就可以实现的目的,何苦要读数据库又要读php缓存文件又要重新整合数据输出再+图片Flash等附件这么大费周章呢?
CMS首页不需要很多的互动的,论坛那一套不应该拿到这里来用,相反应该更多考虑的是:
美观!
兼容!
信息的直观!
性能!
还有稳定!
1.6404页面
什么是404页面?
404页面,就是网站服务器在访客请求页面不存在时显示的提醒页面,默认的页面会提示“404NOTFOUND”或“您查找的页面不存在”。
当然这个页面是可以自定义的。
HTTP404错误意味着链接指向的网页不存在,即原始网页的URL失效,这种情况经常会发生,很难避免,比如说:
网页URL生成规则改变、网页文件更名或移动位置、导入链接拼写错误等,导致原来的URL地址无法访问;当Web服务器接到类似请求时,会返回一个404状态码,告诉浏览器要请求的资源并不存在。
404页面的做法
1、Apache服务器404页面的设置方法
在.htaccess 文件中加入代码:
ErrorDocument 404 /Error.html 建立一个简单的html404页面命名 Error.html 把 Error.html放置在网站根目录即可。
2、IIS/ASP.net下设置404错误页面
首先,修改应用程序根目录的设置,打开 “web.config” 文件编辑,在其中加入如下内容:
此例中“error.asp”为系统默认的404页面,“notfound.asp”为自定义的404页面,使用时请修改相应文件名。
然后,在自定义的404页面“notfound.asp”中加入:
<%
Response.Status = “404 Not Found” %>
这样,便可以保证IIS能够正确地返回“404”状态码
404页面的好处
1:
引导用户不要关闭网站,增强用户体验。
2:
防止网站出现死链接。
404页面做法注意事项
1、一定不要将404错误直接转向到网站首页,这将可能导致你的网站首页不被收录;
2、/Error.html 前面请不要带主域名(错误的写法:
1.7XXping
什么是Ping服务
ping是基于XML_RPC标准协议的更新通告服务,用于博客把内容更新快速通知给XX,以便XX及时进行抓取和更新。
Ping服务使用方法
你可以采取手动通知和自动通知两种方式使用ping服务:
手动ping:
访问页面,在输入框中输入博客地址或者feed地址,点击“提交博客”按钮即可。
自动ping:
如果您的博客程序支持自动ping功能,您只需把XX的Ping服务地址配置到你的Blog发布后台或者客户端程序中,就可以实现自动通知的功能。
XXping服务的地址为:
/RPC2
自动Ping的XML_RPC
发送给XXPing服务的XML-RPC客户请求需要包含如下元素:
RPC端点:
/RPC2
调用方法名:
weblogUpdates.extendedPing
参数:
(应按照如下所列的相同顺序传送)
博客名称
博客首页地址
新发文章地址
博客rss地址
Ping请求包的例子
weblogUpdates.extendedPing xml-rpc请求举例:
POST/ping/RPC2HTTP/1.0
User-Agent:
request
Host:
Content-Type:
text