溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

nginx 中怎么實(shí)現(xiàn)正則匹配

發(fā)布時(shí)間:2021-06-15 13:46:30 來(lái)源:億速云 閱讀:359 作者:Leah 欄目:大數(shù)據(jù)

這期內(nèi)容當(dāng)中小編將會(huì)給大家?guī)?lái)有關(guān)nginx 中怎么實(shí)現(xiàn)正則匹配,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。

今天遇到網(wǎng)站之前的url被百度搜索引擎抓取,需要在服務(wù)中進(jìn)行301強(qiáng)制跳轉(zhuǎn),(如訪問(wèn):www.baidu.com/kenni-1,www.baidu.com/kenni-1/,兩個(gè)統(tǒng)一跳轉(zhuǎn)到www.baidu.com/kenni-1.html,以及www.baidu.com/kenni-1?page=11,跳轉(zhuǎn)到www.baidu.com/kenni-1.html?page=11,kenni-后面接數(shù)字)

因?yàn)?a title="服務(wù)器" target="_blank" href="http://kemok4.com/">服務(wù)器使用的是nginx,所以在nginx增加如下配置:

    # 訪問(wèn) 域名/kenni-10 跳轉(zhuǎn)到域名 域名/kenni-10.html
    rewrite ^/kenni-([0-9]+)$ /kenni-$1.html permanent;

    # 訪問(wèn) 域名/kenni-10/ 跳轉(zhuǎn)到域名 域名/kenni-10.html
    rewrite ^/kenni-([0-9]+)/$ /kenni-$1.html permanent;

其他學(xué)習(xí)參考資料:

1、^: 匹配字符串的開(kāi)始位置;

2、 $:匹配字符串的結(jié)束位置;

3、.*:   .匹配任意字符,*匹配數(shù)量0到正無(wú)窮;

4、\. 斜杠用來(lái)轉(zhuǎn)義,\.匹配 .    特殊使用方法,記住記性了;

5、(值1|值2|值3|值4):或匹配模式,例:(jpg|gif|png|bmp)匹配jpg或gif或png或bmp

6、i不區(qū)分大小寫(xiě)

一.正則表達(dá)式匹配,其中:
* ~ 為區(qū)分大小寫(xiě)匹配
* ~* 為不區(qū)分大小寫(xiě)匹配
* !~和!~*分別為區(qū)分大小寫(xiě)不匹配及不區(qū)分大小寫(xiě)不匹配
二.文件及目錄匹配,其中:
* -f和!-f用來(lái)判斷是否存在文件
* -d和!-d用來(lái)判斷是否存在目錄
* -e和!-e用來(lái)判斷是否存在文件或目錄
* -x和!-x用來(lái)判斷文件是否可執(zhí)行
三.rewrite指令的最后一項(xiàng)參數(shù)為flag標(biāo)記,flag標(biāo)記有:
1.last    相當(dāng)于apache里面的[L]標(biāo)記,表示rewrite。
2.break本條規(guī)則匹配完成后,終止匹配,不再匹配后面的規(guī)則。
3.redirect  返回302臨時(shí)重定向,瀏覽器地址會(huì)顯示跳轉(zhuǎn)后的URL地址。
4.permanent  返回301永久重定向,瀏覽器地址會(huì)顯示跳轉(zhuǎn)后的URL地址。


使用last和break實(shí)現(xiàn)URI重寫(xiě),瀏覽器地址欄不變。而且兩者有細(xì)微差別,使用alias指令必須用last標(biāo)記;使用proxy_pass指令時(shí),需要使用break標(biāo)記。Last標(biāo)記在本條rewrite規(guī)則執(zhí)行完畢后,會(huì)對(duì)其所在server{......}標(biāo)簽重新發(fā)起請(qǐng)求,而break標(biāo)記則在本條規(guī)則匹配完成后,終止匹配。
例如:如果我們將類似URL/photo/123456 重定向到/path/to/photo/12/1234/123456.png
rewrite "/photo/([0-9]{2})([0-9]{2})([0-9]{2})"/path/to/photo/$1/$1$2/$1$2$3.png ;


四.NginxRewrite 規(guī)則相關(guān)指令


1.break指令
使用環(huán)境:server,location,if;
該指令的作用是完成當(dāng)前的規(guī)則集,不再處理rewrite指令。


2.if指令
使用環(huán)境:server,location
該指令用于檢查一個(gè)條件是否符合,如果條件符合,則執(zhí)行大括號(hào)內(nèi)的語(yǔ)句。If指令不支持嵌套,不支持多個(gè)條件&&和||處理。


3.return指令
語(yǔ)法:returncode ;
使用環(huán)境:server,location,if;
該指令用于結(jié)束規(guī)則的執(zhí)行并返回狀態(tài)碼給客戶端。
示例:如果訪問(wèn)的URL以".sh"或".bash"結(jié)尾,則返回403狀態(tài)碼
location ~ .*\.(sh|bash)?$
{
return 403;
}


4.rewrite 指令
語(yǔ)法:rewriteregex replacement flag
使用環(huán)境:server,location,if
該指令根據(jù)表達(dá)式來(lái)重定向URI,或者修改字符串。指令根據(jù)配置文件中的順序來(lái)執(zhí)行。注意重寫(xiě)表達(dá)式只對(duì)相對(duì)路徑有效。如果你想配對(duì)主機(jī)名,你應(yīng)該使用if語(yǔ)句,示例如下:
if( $host ~* www\.(.*) )
{
set $host_without_www $1;
rewrite ^(.*)$  http://$host_without_www$1permanent;
}


5.Set指令
語(yǔ)法:setvariable value ; 默認(rèn)值:none; 使用環(huán)境:server,location,if;
該指令用于定義一個(gè)變量,并給變量賦值。變量的值可以為文本、變量以及文本變量的聯(lián)合。
示例:set$varname "hello world";


6.Uninitialized_variable_warn指令
語(yǔ)法:uninitialized_variable_warnon|off
使用環(huán)境:http,server,location,if
該指令用于開(kāi)啟和關(guān)閉未初始化變量的警告信息,默認(rèn)值為開(kāi)啟。


五.Nginx的Rewrite規(guī)則編寫(xiě)實(shí)例
1.當(dāng)訪問(wèn)的文件和目錄不存在時(shí),重定向到某個(gè)php文件
if( !-e $request_filename )
{
rewrite ^/(.*)$ index.php last;
}


2.目錄對(duì)換 /123456/xxxx  ====>  /xxxx?id=123456
rewrite ^/(\d+)/(.+)/  /$2?id=$1 last;


3.如果客戶端使用的是IE瀏覽器,則重定向到/ie目錄下
if( $http_user_agent  ~ MSIE)
{
rewrite ^(.*)$ /ie/$1 break;
}


4.禁止訪問(wèn)多個(gè)目錄
location ~ ^/(cron|templates)/
{
deny all;
break;
}


5.禁止訪問(wèn)以/data開(kāi)頭的文件
location ~ ^/data
{
deny all;
}


6.禁止訪問(wèn)以.sh,.flv,.mp3為文件后綴名的文件
location ~ .*\.(sh|flv|mp3)$
{
return 403;
}


7.設(shè)置某些類型文件的瀏覽器緩存時(shí)間
location ~ .*\.(gif|jpg|jpeg|png|bmp|swf)$
{
expires 30d;
}
location ~ .*\.(js|css)$
{
expires 1h;
}


8.給favicon.ico和robots.txt設(shè)置過(guò)期時(shí)間;
這里為favicon.ico為99天,robots.txt為7天并不記錄404錯(cuò)誤日志
location ~(favicon.ico) {
log_not_found off;
expires 99d;
break;
}
location ~(robots.txt) {
log_not_found off;
expires 7d;
break;
}


9.設(shè)定某個(gè)文件的過(guò)期時(shí)間;這里為600秒,并不記錄訪問(wèn)日志
location ^~ /html/scripts/loadhead_1.js {
access_log  off;
root /opt/lampp/htdocs/web;
expires 600;
break;
}


10.文件反盜鏈并設(shè)置過(guò)期時(shí)間
這里的return412 為自定義的http狀態(tài)碼,默認(rèn)為403,方便找出正確的盜鏈的請(qǐng)求
“rewrite ^/ https://cache.yisu.com/upload/information/20210524/347/788800.gif;”顯示一張防盜鏈圖片
“access_log off;”不記錄訪問(wèn)日志,減輕壓力
“expires 3d”所有文件3天的瀏覽器緩存


location ~*^.+\.(jpg|jpeg|gif|png|swf|rar|zip|css|js)$ {
valid_referers none blocked *.linuxidc.com*.linuxidc.net localhost 208.97.167.194;
if ($invalid_referer) {
rewrite ^/ https://cache.yisu.com/upload/information/20210524/347/788800.gif;
return 412;
break;
}
access_log  off;
root /opt/lampp/htdocs/web;
expires 3d;
break;
}


11.只允許固定ip訪問(wèn)網(wǎng)站,并加上密碼


root /opt/htdocs/www;
allow  208.97.167.194; 
allow  222.33.1.2; 
allow  231.152.49.4;
deny  all;
auth_basic “C1G_ADMIN”;
auth_basic_user_file htpasswd;


12將多級(jí)目錄下的文件轉(zhuǎn)成一個(gè)文件,增強(qiáng)seo效果
/job-123-456-789.html 指向/job/123/456/789.html


rewrite^/job-([0-9]+)-([0-9]+)-([0-9]+)\.html$ /job/$1/$2/jobshow_$3.html last;


13.文件和目錄不存在的時(shí)候重定向:


if (!-e $request_filename) {
proxy_pass http://127.0.0.1;
}


14.將根目錄下某個(gè)文件夾指向2級(jí)目錄
如/shanghaijob/ 指向 /area/shanghai/
如果你將last改成permanent,那么瀏覽器地址欄顯是/location/shanghai/
rewrite ^/([0-9a-z]+)job/(.*)$ /area/$1/$2last;
上面例子有個(gè)問(wèn)題是訪問(wèn)/shanghai時(shí)將不會(huì)匹配
rewrite ^/([0-9a-z]+)job$ /area/$1/ last;
rewrite ^/([0-9a-z]+)job/(.*)$ /area/$1/$2last;
這樣/shanghai 也可以訪問(wèn)了,但頁(yè)面中的相對(duì)鏈接無(wú)法使用,
如./list_1.html真實(shí)地址是/area/shanghia/list_1.html會(huì)變成/list_1.html,導(dǎo)至無(wú)法訪問(wèn)。
那我加上自動(dòng)跳轉(zhuǎn)也是不行咯
(-d $request_filename)它有個(gè)條件是必需為真實(shí)目錄,而我的rewrite不是的,所以沒(méi)有效果
if (-d $request_filename){
rewrite ^/(.*)([^/])$ http://$host/$1$2/permanent;
}
知道原因后就好辦了,讓我手動(dòng)跳轉(zhuǎn)吧
rewrite ^/([0-9a-z]+)job$ /$1job/permanent;
rewrite ^/([0-9a-z]+)job/(.*)$ /area/$1/$2last;


15.域名跳轉(zhuǎn)
server
{
listen      80;
server_name  jump.linuxidc.com;
index index.html index.htm index.php;
root  /opt/lampp/htdocs/www;
rewrite ^/ http://www.linuxidc.com/;
access_log  off;
}


16.多域名轉(zhuǎn)向
server_name  www.linuxidc.comwww.linuxidc.net;
index index.html index.htm index.php;
root  /opt/lampp/htdocs;
if ($host ~ "linuxidc\.net") {
rewrite ^(.*) http://www.linuxidc.com$1permanent;
}


六.nginx全局變量
arg_PARAMETER    #這個(gè)變量包含GET請(qǐng)求中,如果有變量PARAMETER時(shí)的值。
args                    #這個(gè)變量等于請(qǐng)求行中(GET請(qǐng)求)的參數(shù),如:foo=123&bar=blahblah;
binary_remote_addr #二進(jìn)制的客戶地址。
body_bytes_sent    #響應(yīng)時(shí)送出的body字節(jié)數(shù)數(shù)量。即使連接中斷,這個(gè)數(shù)據(jù)也是精確的。
content_length    #請(qǐng)求頭中的Content-length字段。
content_type      #請(qǐng)求頭中的Content-Type字段。
cookie_COOKIE    #cookie COOKIE變量的值
document_root    #當(dāng)前請(qǐng)求在root指令中指定的值。
document_uri      #與uri相同。
host                #請(qǐng)求主機(jī)頭字段,否則為服務(wù)器名稱。
hostname          #Set to themachine’s hostname as returned by gethostname
http_HEADER
is_args              #如果有args參數(shù),這個(gè)變量等于”?”,否則等于”",空值。
http_user_agent    #客戶端agent信息
http_cookie          #客戶端cookie信息
limit_rate            #這個(gè)變量可以限制連接速率。
query_string          #與args相同。
request_body_file  #客戶端請(qǐng)求主體信息的臨時(shí)文件名。
request_method    #客戶端請(qǐng)求的動(dòng)作,通常為GET或POST。
remote_addr          #客戶端的IP地址。
remote_port          #客戶端的端口。
remote_user          #已經(jīng)經(jīng)過(guò)Auth Basic Module驗(yàn)證的用戶名。
request_completion #如果請(qǐng)求結(jié)束,設(shè)置為OK. 當(dāng)請(qǐng)求未結(jié)束或如果該請(qǐng)求不是請(qǐng)求鏈串的最后一個(gè)時(shí),為空(Empty)。
request_method    #GET或POST
request_filename  #當(dāng)前請(qǐng)求的文件路徑,由root或alias指令與URI請(qǐng)求生成。
request_uri          #包含請(qǐng)求參數(shù)的原始URI,不包含主機(jī)名,如:”/foo/bar.php?arg=baz”。不能修改。
scheme                #HTTP方法(如http,https)。
server_protocol      #請(qǐng)求使用的協(xié)議,通常是HTTP/1.0或HTTP/1.1。
server_addr          #服務(wù)器地址,在完成一次系統(tǒng)調(diào)用后可以確定這個(gè)值。
server_name        #服務(wù)器名稱。
server_port          #請(qǐng)求到達(dá)服務(wù)器的端口號(hào)。


七.Apache和Nginx規(guī)則的對(duì)應(yīng)關(guān)系
Apache的RewriteCond對(duì)應(yīng)Nginx的if
Apache的RewriteRule對(duì)應(yīng)Nginx的rewrite
Apache的[R]對(duì)應(yīng)Nginx的redirect
Apache的[P]對(duì)應(yīng)Nginx的last
Apache的[R,L]對(duì)應(yīng)Nginx的redirect
Apache的[P,L]對(duì)應(yīng)Nginx的last
Apache的[PT,L]對(duì)應(yīng)Nginx的last


例如:允許指定的域名訪問(wèn)本站,其他的域名一律轉(zhuǎn)向www.linuxidc.net
  Apache:
RewriteCond %{HTTP_HOST} !^(.*?)\.aaa\.com$[NC]
RewriteCond %{HTTP_HOST} !^localhost$ 
RewriteCond %{HTTP_HOST}!^192\.168\.0\.(.*?)$
RewriteRule ^/(.*)$ http://www.linuxidc.net[R,L]


  Nginx:
if( $host ~* ^(.*)\.aaa\.com$ )
{
set $allowHost ‘1’;
}
if( $host ~* ^localhost )
{
set $allowHost ‘1’;
}
if( $host ~* ^192\.168\.1\.(.*?)$ )
{
set $allowHost ‘1’;
}
if( $allowHost !~ ‘1’ )
{
rewrite ^/(.*)$ http://www.linuxidc.netredirect ;
}

上述就是小編為大家分享的nginx 中怎么實(shí)現(xiàn)正則匹配了,如果剛好有類似的疑惑,不妨參照上述分析進(jìn)行理解。如果想知道更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI