溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Nginx如何實(shí)現(xiàn)非套路鏡像站

發(fā)布時(shí)間:2021-08-21 10:57:53 來(lái)源:億速云 閱讀:132 作者:小新 欄目:服務(wù)器

這篇文章主要介紹Nginx如何實(shí)現(xiàn)非套路鏡像站,文中介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們一定要看完!

前幾天發(fā)現(xiàn)一個(gè)電子書非常棒,但是是 github 上的,總是打不開,而正好我的服務(wù)器是在香港的,所以我想做一個(gè)鏡像。

方案一

做了如下配置:

location ^~ /book-c/
{
 proxy_pass http://akaedu.github.io/book/;
 proxy_redirect off;
 proxy_http_version 1.1;
 proxy_set_header Upgrade $http_upgrade;
 proxy_set_header Connection "upgrade";
}

瀏覽了下,都 ok,但是有幾點(diǎn)不太好

  • 如果以后我發(fā)現(xiàn)類似的書很好,都要增加一個(gè) nginx 配置。

  • 如果原始網(wǎng)站完全無(wú)法訪問(wèn)了,我這邊也掛了,不能緩存到我本地服務(wù)器。

  • 我想修改網(wǎng)頁(yè)內(nèi)容也不太好操作,比如我想加上原作者的版權(quán)和原始訪問(wèn)地址說(shuō)明等。

完全采集過(guò)來(lái),我也懶得寫腳本去跑,最終走上了下面這段踩坑路。

嘗試改進(jìn)

所以嘗試了如下做法

rewrite ^/book-(.*?)/  /index.php?m=Book&a=show&book=$1 last;
class BookAction extends Action{
 private $uri;
 public function show(){
 $book = $_GET['book'];
 if (!method_exists($this,$book)){
  $this->error404();
 }
 try{
  $this->$book();
 }catch (Exception $e){
  $this->error404();
 }
 }

 /**
 * http://akaedu.github.io/book/
 */
 private function c(){
 $baseUrl = "http://akaedu.github.io/book/";
 $url = $baseUrl.$this->uri;
 echo file_get_contents($url);
 }
}

又遇到了一個(gè)問(wèn)題,當(dāng)我訪問(wèn) https://mengkang.net/book-c/styles.css 則無(wú)法 rewrite 匹配到了。

原因是 nginx 優(yōu)先匹配了

location ~ .*\.(js|css)?$
{
 expires 12h;
}

正則匹配優(yōu)先級(jí)關(guān)系:https://www.jb51.net/article/134233.htm

方案二

添加一條

location ~ /book-.*?/
{
 rewrite ^/book-(.*?)/ /index.php?m=Book&a=show&book=$1 last;
}

location ^~ 不支持正則的,所以沒(méi)法用

采坑小記

如果是使用的 location ~ /book-.*/ ,根據(jù)正則就是貪婪模式,那么

https://cache.yisu.com/upload/information/20200622/115/67199.png

匹配到的就是 /book-c/images/ ,也就是說(shuō)rewrite里面的 $1 就是 c/images ,這樣和我們的預(yù)期相悖的。

故障:無(wú)法匹配到 css 文件

$ wget -S https://mengkang.net/book-c/styles.css -O /dev/null
--2018-02-01 13:13:36-- https://mengkang.net/book-c/styles.css
Resolving mengkang.net... 203.195.188.207
Connecting to mengkang.net|203.195.188.207|:443... connected.
HTTP request sent, awaiting response...
 HTTP/1.1 200 OK
 Server: nginx
 Date: Thu, 01 Feb 2018 05:13:38 GMT
 Content-Type: text/html; charset=UTF-8

所有內(nèi)容的輸出默認(rèn)都是 text/html ,那么也就是我需要對(duì)文件的后綴判斷咯。 感覺(jué)自己給自己挖坑,不如直接采集得了

<?php
class BookAction extends Action{
 const BOOK_SAVE_DIR = "/data/book/";
 private $uri;
 private $baseUrl;
 private $book;
 private $bookname;
 public function show(){
 $book = $_GET['book'];
 $this->book = $book;
 $this->uri = str_replace("/book-{$book}/","",$_SERVER['REQUEST_URI']);
 if (!method_exists($this,$book)){
  $this->error404();
 }
 try{
  $this->$book();
 }catch (Exception $e){
  $this->error404();
 }
 }
 /**
 * http://akaedu.github.io/book/
 */
 private function c(){
 $this->baseUrl = "http://akaedu.github.io/book/";
 $url = $this->baseUrl.$this->uri;
 $this->output($url);
 }
 private function output($url){
 $ext = pathinfo($url,PATHINFO_EXTENSION);
 if (!$ext) {
  $url = $url."/index.html";
  $ext = "html";
 }
 switch ($ext){
  case "css":
  header("Content-Type: text/css; charset=UTF-8");
  break;
  default:
  header("Content-Type: text/html; charset=UTF-8");
  break;
 }
 // 如果已經(jīng)緩存
 $filename = self::BOOK_SAVE_DIR.$this->book."/".str_replace($this->baseUrl,"",$url);
 if (file_exists($filename)){
  $data = file_get_contents($filename);
 }else{
  $data = file_get_contents($url);
  $dir = dirname($filename);
  if (!file_exists($dir)){
  mkdir($dir,755,true);
  }
  file_put_contents($filename,$data);
 }
 // 增加原始版權(quán)說(shuō)明
 echo $data;
 }
}

以上是“Nginx如何實(shí)現(xiàn)非套路鏡像站”這篇文章的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對(duì)大家有幫助,更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI