Apache的ReWrite的应用Word格式文档下载.docx
《Apache的ReWrite的应用Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《Apache的ReWrite的应用Word格式文档下载.docx(20页珍藏版)》请在冰豆网上搜索。
%{SERVER_PORT}/$1[L,R]
//fully.qualified.domain.name/$1[L,R]
被移动过的DocumentRoot说明:
通常,网站服务器的DocumentRoot直接对应于URL"
/"
,但是,它常常不是处于最高一级,而可能只是众多数据池中的一个实体。
比如,在Intranet站点中,有/e/www/(WWW的主页)、/e/sww/(Intranet的主页)等等,而DocumentRoot指向了/e/www/,则必须保证此数据池中的所有内嵌的图片和其他元素对后继请求有效。
只须重定向URL/到/e/www/即可。
这个方案看起来很简单,但只是有了mod_rewrite模块的支持,它才简单,因为传统的URLAliases机制(由mod_alias及其相关模块提供)只是作了一个前缀匹配,DocumentRoot是一个对所有URL的前缀,因而无法实现这样的重定向。
而用mod_rewrite的确很简单:
RewriteEngine?
on
^/$/e/www/[R]
后缀斜杠的问题说明:
每个网管对引用目录后缀斜杠的问题都有一本苦经,如果遗漏了,服务器会产生一个错误,因为如果请求是/~quux/foo而不是/~quux/foo/,服务器会去找一个叫foo的文件,而它是一个目录,所以就报错了。
事实上,大多数情况下,它自己会试图修正这个错误,但是有时候需要你手工纠正,比如,在重写了许多CGI脚本中的复杂的URL以后。
解决这个微妙问题的方案是让服务器自动添加后缀的斜杠。
对此,必须使用一个外部的重定向,使浏览器正确地处理后继的对诸如图片的请求。
如果仅仅作一个内部的重写,可能只对目录页面有效,而对内嵌有使用相对URL的图片的页面则无效,因为浏览器有请求内嵌目标的可能。
比如,如果不用外部重定向,/~quux/foo/index.html页面中对image.gif的请求,其结果将是/~quux/image.gif!
。
所以,应该这样写:
RewriteBase?
/~quux/
^foo$foo/[R]
又懒又疯狂的做法是把这些写入其宿主目录中的顶级.htaccess中,但是须注意,如此会带来一些处理上的开销。
%{REQUEST_FILENAME}-d
^(.+[^/])$$1/[R]
集群网站的同类URL规划说明:
我们希望在一个Intranet集群网站中,对所有WWW服务器建立一个同类的一致性的URL规划,也就是,所有的URL(对单个服务器来说,是本地的依赖于此服务器的!
)是独立于服务器的!
我们需要的是一个具有独立于服务器的一致性规划的WWW名称空间,即,URL不需要包含正确的物理的目标服务器,而由集群本身来自动定位物理的目标主机。
首先,目标服务器的信息来自(产生)于包含有用户、组以及实体的外部地图,其格式形如:
user1server_of_user1
user2server_of_user2
:
:
这些信息被存入map.xxx-to-host文件。
其次,如果URL在一个服务器上无效,需要引导所有的服务器重定向URL
/u/user/anypath
/g/group/anypath
/e/entity/anypath
到
http:
//physical-host/u/user/anypath
//physical-host/g/group/anypath
//physical-host/e/entity/anypath
以下规则集依靠地图文件来完成这个操作(假定,如果一个用户在地图中没有对应的项,则使用server0为默认服务器):
RewriteMap?
user-to-hosttxt:
/path/to/map.user-to-host
group-to-hosttxt:
/path/to/map.group-to-host
entity-to-hosttxt:
/path/to/map.entity-to-host
^/u/([^/]+)/?
(.*)http:
//${user-to-host:
$1|server0}/u/$1/$2
^/g/([^/]+)/?
//${group-to-host:
$1|server0}/g/$1/$2
^/e/([^/]+)/?
//${entity-to-host:
$1|server0}/e/$1/$2
^/([uge])/([^/]+)/?
$/$1/$2/.www/
^/([uge])/([^/]+)/([^.]+.+)/$1/$2/.www/$3\
移动宿主目录到不同的网站服务器说明:
通常,许多网管在建立一个新的网站服务器时,都会有这样的要求:
重定向一个网站服务器上的所有宿主目录到另一个网站服务器。
很简单,用mod_rewrite。
在老的网站服务器上重定向所有的URL/~user/anypath到http:
//newserver/~user/anypath。
^/~(.+)http:
//newserver/~$1[R,L]
结构化的宿主目录说明:
一些拥有几千个用户的网站通常都使用结构化的宿主目录规划,即,每个宿主目录位于一个带有特定前缀比如其用户名的第一个字符的子目录下。
那么,/~foo/anypath代表/home/f/foo/.www/anypath,而/~bar/anypath代表/home/b/bar/.www/anypath。
可以使用下列规则集来扩展~以达到上述目的。
^/~(([a-z])[a-z0-9]+)(.*)/home/$2/$1/.www$3
文件系统的重组说明:
这是一个不加雕琢的例子:
一个大量使用针对目录的规则集以实现平滑观感,而从来不用调整数据结构的杀手级的应用。
背景:
net.sw从1992年开始,存放了我收集的免费的有效的Unix软件包。
它是我的爱好也是我的工作,因为在学习计算机科学的同时,业余时间还做了多年的系统和网络的管理员。
每周我都需要整理软件,因而建立了一个层次很深的目录结构来存放各种软件包:
drwxrwxr-x2netswusers512Aug318:
39Audio/
drwxrwxr-x2netswusers512Jul914:
37Benchmark/
drwxrwxr-x12netswusers512Jul900:
34Crypto/
drwxrwxr-x5netswusers512Jul900:
41Database/
drwxrwxr-x4netswusers512Jul3019:
25Dicts/
drwxrwxr-x10netswusers512Jul901:
54Graphic/
drwxrwxr-x5netswusers512Jul901:
58Hackers/
drwxrwxr-x8netswusers512Jul903:
19InfoSys?
/
drwxrwxr-x3netswusers512Jul903:
21Math/
24Misc/
drwxrwxr-x9netswusers512Aug116:
33Network/
drwxrwxr-x2netswusers512Jul905:
53Office/
drwxrwxr-x7netswusers512Jul909:
24SoftEng?
drwxrwxr-x7netswusers512Jul912:
17System/
drwxrwxr-x12netswusers512Aug320:
15Typesetting/
drwxrwxr-x10netswusers512Jul914:
08X11/
1996年7月,我决定通过一个漂亮的Web接口公开我的收藏。
“漂亮”是指提供一个接口以直接浏览整个目录结构,同时不对这个结构做任何改变-甚至也不在结构顶部放置CGI脚本。
为什么呢?
因为这个结构还要能够被FTP访问,而且我不希望其中有任何Web或者CGI的成分。
这个方案分为两个部分:
第一个部分,是用于在空闲时间建立所有目录页面的CGI脚本集。
我把它们放在/e/netsw/.www/,如下:
-rw-r--r--1netswusers1318Aug118:
10.wwwacl
drwxr-xr-x18netswusers512Aug515:
51DATA/
-rw-rw-rw-1netswusers372982Aug516:
35LOGFILE
-rw-r--r--1netswusers659Aug409:
27TODO
-rw-r--r--1netswusers5697Aug118:
01netsw-about.html
-rwxr-xr-x1netswusers579Aug210:
33netsw-access.pl
-rwxr-xr-x1netswusers1532Aug117:
35netsw-changes.cgi
-rwxr-xr-x1netswusers2866Aug514:
49netsw-home.cgi
drwxr-xr-x2netswusers512Jul823:
47netsw-img/
-rwxr-xr-x1netswusers24050Aug515:
49netsw-lsdir.cgi
-rwxr-xr-x1netswusers1589Aug318:
43netsw-search.cgi
-rwxr-xr-x1netswusers1885Aug117:
41netsw-tree.cgi
-rw-r--r--1netswusers234Jul3016:
35netsw-unlimit.lst
其中的DATA/子目录包含了上述目录结构,即实在的net.sw,由rdist在需要的时候自动更新。
第二个部分的遗留问题是:
如何连接这两个结构为一个平滑观感的URL树?
我希望在运行适当的CGI脚本而使用各种URL的时候,使用户感觉不到DATA/目录的存在。
方案如下:
首先,我把下列配置放在服务器上DocumentRoot中的针对目录的配置文件里,以重写公布的URL/net.sw/为内部路径/e/netsw:
^net.sw$net.sw/[R]
^net.sw/(.*)$e/netsw/$1
第一条规则是针对遗漏后缀斜杠的请求的!
第二条规则才是真正实现功能的。
接着,就是放在针对目录的配置文件/e/netsw/.www/.wwwacl中的杀手级的配置了:
OptionsExecCGI?
FollowSymLinks?
IncludesMultiViews?
#wearereachedvia/net.sw/prefix
/net.sw/
#firstwerewritetherootdirto
#thehandlingcgiscript
^$netsw-home.cgi[L]
^index\.html$netsw-home.cgi[L]
#stripoutthesubdirswhen
#thebrowserrequestsusfromperdirpages
^.+/(netsw-[^/]+/.+)$$1[L]
#andnowbreaktherewritingforlocalfiles
^netsw-home\.cgi.*-[L]
^netsw-changes\.cgi.*-[L]
^netsw-search\.cgi.*-[L]
^netsw-tree\.cgi$-[L]
^netsw-about\.html$-[L]
^netsw-img/.*$-[L]
#anythingelseisasubdirwhichgetshandled
#byanothercgiscript
!
^netsw-lsdir\.cgi.*-[C]
(.*)netsw-lsdir.cgi/$1
阅读提示:
注意前半部分中的标志L(最后),和无对应项('
-'
)
注意后半部分中的符号!
(非),和标志C(链)
注意最后一条规则的全匹配模式
NCSAimagemap和Apachemod_imap
说明:
许多人都希望在从NCSA网站服务器向较现代的Apache网站服务器转移中实现平滑过渡,即希望老的NCSAimagemap程序能在Apache的较现代的mod_imap支持下正常运作。
但问题在于,到处都是通过/cgi-bin/imagemap/path/to/page.map引用imagemap程序的连接,而在Apache下,应该写成/path/to/page.map。
使用全局规则在空闲时间去除所有这些请求的前缀:
^/cgi-bin/imagemap(.*)$1[PT]
在多个目录中搜索页面说明:
有时会有必要使网站服务器在多个目录中搜索页面,对此,MultiViews或者其他技术无能为力。
编制一个明确的规则集以搜索目录中的文件。
#firsttrytofinditincustom/...
#...andiffoundstopandbehappy:
/your/docroot/dir1/%{REQUEST_FILENAME}-f
^(.+)/your/docroot/dir1/$1[L]
#secondtrytofinditinpub/...
/your/docroot/dir2/%{REQUEST_FILENAME}-f
^(.+)/your/docroot/dir2/$1[L]
#elsegoonforotherAliasorScriptAlias?
directives,
#etc.
^(.+)-[PT]
按照URL的片段设置环境变量说明:
如果希望保持请求之间的状态信息,但又不希望使用CGI来包装所有页面,而只通过分离URL中的有用信息来编码。
可以用一个规则集来分离出状态信息,并设置环境变量以备此后用于XSSI或CGI。
如此,一个/foo/S=java/bar/的URL会被解析为/foo/bar/,而环境变量STATUS则被设置为"
java"
^(.*)/S=([^/]+)/(.*)$1/$3[E=STATUS:
$2]
虚拟用户主机说明:
如果需要为用户username支持一个的主页,但不是用在此机器上建虚拟主机的方法,而是用仅在此机器上增加一个DNS记录的方法实现。
对HTTP/1.0的请求,这是无法实现的;
但是对HTTP/1.1的在HTTP头中包含有主机名的请求,可以用以下规则集来内部地重写
%{HTTP_HOST}^www\.[^.]+\.host\.com$
^(.+)%{HTTP_HOST}$1[C]
^www\.([^.]+)\.host\.com(.*)/home/$1$2
为外来访问者重定向宿主目录说明:
对不是来自本地域的外来访问者的请求,重定向其宿主目录URL到另一个网站服务器,有时这种做法也会用在虚拟主机的上下文中。
只须一个重写条件:
%{REMOTE_HOST}!
^.+\.ourdomain\.com$
^(/~.+)[R,L]
重定向失败的URL到其他网站服务器说明:
如何重写URL以重定向对网站服务器A的失败请求到服务器B,是一个常见的问题。
一般,可以用Perl写的CGI脚本通过ErrorDocument来解决,此外,还有mod_rewrite方案。
但是须注意,这种方法的执行效率不如用ErrorDocument的CGI脚本!
第一种方案,有最好的性能而灵活性欠佳,出错概率小所以安全:
/your/docroot/%{REQUEST_FILENAME}!
-f
^(.+)http:
//webserverB.dom/$1
但是其问题在于,它只对位于DocumentRoot中的页面有效。
虽然可以增加更多的条件(比如同时还处理宿主目录,等等),但是还有一个更好的方法:
%{REQUEST_URI}!
-U
这种方法使用了mod_rewrite提供的“向前参照(look-ahead)”的功能,是一种对所有URL类型都有效而且安全的方法。
但是,对网站服务器的性能会有影响,所以如果网站服务器有一个强大的CPU,那就用这个方法。
而在慢速机器上,可以用第一种方法,或者用性能更好的ErrorDocumentCGI脚本。
扩展的重定向说明:
有时候,我们会需要更多的对重定向URL的(有关字符转义机制方面的)控制。
通常,Apache内核中的URL转义函数uri_escape()同时还会对anchor转义,即,类似"
url#anchor"
的URL,因此,你不能用mod_rewrite对此类URL直接重定向。
那么如何实现呢?
必须用NPH-CGI脚本使它自己重定向,因为对NPH(non-parseableheaders[无须解析的HTTP头])不会发生转义操作。
首先,在针对服务器的配置中(应该位于所有重写规则的最后),引入一种新的URL类型xredirect:
:
^xredirect:
(.+)/path/to/nph-xredirect.cgi/$1\
[T=application/x-httpd-cgi,L]
以强制所有带xredirect:
前缀的URL被传送到如下的nph-xredirect.cgi程序:
#!
/path/to/perl
##
##nph-x