溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

分布式系統(tǒng)關(guān)注點(diǎn)——360°全方位解讀「緩存」

發(fā)布時(shí)間:2020-05-26 11:51:23 來源:網(wǎng)絡(luò) 閱讀:201 作者:Zachary_Fan 欄目:軟件技術(shù)

如果這是第二次看到我的文章,歡迎文末掃碼訂閱我個(gè)人的公眾號(hào)(跨界架構(gòu)師)喲~  

本文長(zhǎng)度為3578字,建議閱讀10分鐘。

堅(jiān)持原創(chuàng),每一篇都是用心之作~

 

此前的「伸縮性」章節(jié)結(jié)束了,此文是「高性能」章節(jié)的第一篇。

 

只要是位正兒八經(jīng)的程序員自然知道「緩存」是什么,甚至我司的很多做運(yùn)營(yíng)的×××姐現(xiàn)在和程序員小哥哥的交流中都時(shí)不時(shí)冒出「緩存」字眼,讓人壓力山大分布式系統(tǒng)關(guān)注點(diǎn)——360°全方位解讀「緩存」。(本文討論的「緩存」皆指的是軟件層面運(yùn)用的緩存

 

大家都知道的一點(diǎn)是,緩存可以讓原本打開很慢的頁面,變得能“秒開”。你平時(shí)訪問的APP、網(wǎng)站幾乎都有涉及到緩存的運(yùn)用。

 

那么,緩存除了能加速數(shù)據(jù)的訪問之外,還有什么作用呢?

 

另外,任何事物都有兩面性,我們?nèi)绾尾拍軐⒕彺娴膬?yōu)點(diǎn)發(fā)揮得淋淋盡致,同時(shí)避免掉到它的弊端中呢?

 

Z哥今天想分享給你的就是我對(duì)緩存的理解和運(yùn)用的思路,希望對(duì)你有所啟發(fā)。

 

 

「緩存」能做什么?

正如前面所說,大家最普遍的理解就是當(dāng)我們遇到某個(gè)頁面打開很慢的時(shí)候,會(huì)想到引入緩存,這樣頁面打開就快了。

 

其實(shí)快和慢都是相對(duì)的,從技術(shù)角度來說,緩存之所以快是因?yàn)榫彺媸腔趦?nèi)存去建立的,而內(nèi)存的讀寫速度比硬盤快X倍,所以用內(nèi)存來代替硬盤作為讀寫的介質(zhì)自然能大大提高訪問數(shù)據(jù)的速度。

 

這個(gè)過程大致是這樣的,通過在內(nèi)存中存儲(chǔ)訪被問過的數(shù)據(jù)供后續(xù)訪問時(shí)使用,以此來達(dá)到提速的效果。

 

分布式系統(tǒng)關(guān)注點(diǎn)——360°全方位解讀「緩存」

 

 

其實(shí)除此之外,緩存還有另外2個(gè)重要的運(yùn)用方式,「預(yù)讀取」和「延遲寫」。

 

 

預(yù)讀取

預(yù)讀取就是預(yù)先讀取將要載入的數(shù)據(jù),也可以稱作「緩存預(yù)熱」。就是在系統(tǒng)對(duì)外提供服務(wù)之前,先將硬盤中的一部分?jǐn)?shù)據(jù)加載到內(nèi)存中,然后再對(duì)外提供服務(wù)。

 

分布式系統(tǒng)關(guān)注點(diǎn)——360°全方位解讀「緩存」

 

為什么要這樣做呢?因?yàn)橛行┫到y(tǒng)一旦啟動(dòng)就要面臨上千上萬的請(qǐng)求進(jìn)來(在一些toC的項(xiàng)目尤其如此),如果直接讓這些請(qǐng)求打到數(shù)據(jù)庫(kù)上,非常大的可能是數(shù)據(jù)庫(kù)壓力暴增,直接被干趴,無法正常響應(yīng)。

 

為了緩解這個(gè)問題,需要通過「預(yù)讀取」來解決。

 

可能你會(huì)問,哪怕用了緩存還是扛不住呢?那就是做橫向擴(kuò)展+負(fù)載均衡的時(shí)候到了。(可以點(diǎn)擊文末鏈接閱讀之前的《彈性架構(gòu)》系列分布式系統(tǒng)關(guān)注點(diǎn)——360°全方位解讀「緩存」

 

 

如果說「預(yù)讀取」是在「數(shù)據(jù)出口」加了一道前置的緩沖區(qū)的話,那么顧名思義,下面要說的「延遲寫」就是在「數(shù)據(jù)入口」后面加了一道后置的緩沖區(qū)。

 

 

延遲寫

你可能知道,數(shù)據(jù)庫(kù)的寫入速度是慢于讀取速度的,因?yàn)閷懭氲臅r(shí)候有一系列的保證數(shù)據(jù)準(zhǔn)確性的機(jī)制。

 

所以,如果想提升寫入速度的話,要么做分庫(kù)分表,要么就是通過緩存來進(jìn)行一道緩沖,再一次性批量寫到磁盤,以此來提速。

 

題外話:由于分庫(kù)分表對(duì)跨表操作以及多條件組合查詢的副作用巨大,所以引入它的復(fù)雜度遠(yuǎn)大于引入緩存,我們應(yīng)當(dāng)優(yōu)先考慮引入緩存的方案。

 

 

那么,通過緩存機(jī)制來加速“寫”的過程就可以稱作「延遲寫」。就是預(yù)先將需要寫入到磁盤或者數(shù)據(jù)庫(kù)的數(shù)據(jù),先暫時(shí)寫入到內(nèi)存,然后就返回成功。再定時(shí)將內(nèi)存中的數(shù)據(jù)批量寫入到磁盤。

 

分布式系統(tǒng)關(guān)注點(diǎn)——360°全方位解讀「緩存」

 

可能你會(huì)想,寫到內(nèi)存就認(rèn)為成功,萬一中途出現(xiàn)意外、斷電、停機(jī)等導(dǎo)致程序異常終止的情況,數(shù)據(jù)不就丟了嗎? 

 

是的。所以,「延遲寫」一般僅用于對(duì)數(shù)據(jù)完整性要求不是那么苛刻的場(chǎng)景。比如點(diǎn)贊數(shù)啊、參與用戶數(shù)啊等等,可以大大緩解對(duì)數(shù)據(jù)庫(kù)頻繁修改所帶來的壓力。

 

其實(shí)在我們熟知的分布式緩存Redis中,其默認(rèn)運(yùn)用的持久化機(jī)制——RDB,也是這樣的思路。

 

 

在一個(gè)成熟的系統(tǒng)中,能夠運(yùn)用到緩存的地方其實(shí)并不是一處。下面Z哥就來幫你梳理一下我們?cè)谀男┑胤娇梢浴凹泳彺妗薄?/p>

 

 

哪里可以加「緩存」?

在說哪里可以加緩存之前我們先搞清楚一個(gè)事情,我們要緩存什么?也就是符合什么特點(diǎn)的數(shù)據(jù)才需要加緩存?畢竟加緩存是一個(gè)額外的成本投入,得物有所值。

 

一般來說你可以用這兩個(gè)標(biāo)準(zhǔn)來判斷:熱點(diǎn)被高頻訪問,如幾十次/秒以上)數(shù)據(jù)、靜態(tài)(很少變化,讀遠(yuǎn)大于寫,如幾天變更一次)數(shù)據(jù)

 

接下去就可以替它們找到合適的地方加緩存了。

 

 

緩存的本質(zhì)是一個(gè)“防御性”的機(jī)制,而系統(tǒng)之間的數(shù)據(jù)流轉(zhuǎn)是一個(gè)有序的過程。所以,選擇在哪里加緩存就相當(dāng)于選擇在一條馬路的哪個(gè)位置設(shè)路障。在這個(gè)路障之后的道路都能受到保護(hù),不被車流碾壓。

 

那么在以終端用戶為起點(diǎn),系統(tǒng)所用的數(shù)據(jù)庫(kù)為終點(diǎn)的這條道路上可以作為緩存設(shè)立點(diǎn)的位置大致有以下這些。

 

分布式系統(tǒng)關(guān)注點(diǎn)——360°全方位解讀「緩存」

 

每個(gè)設(shè)立點(diǎn)可以擋掉一些流量,最終形成一個(gè)漏斗狀的攔截效果,以此保護(hù)最后面的系統(tǒng)以及最終的數(shù)據(jù)庫(kù)。

 

分布式系統(tǒng)關(guān)注點(diǎn)——360°全方位解讀「緩存」

 

下面Z哥來簡(jiǎn)要描述下每一個(gè)的運(yùn)用場(chǎng)景以及需要注意的點(diǎn)。

 

 

瀏覽器緩存

這是離用戶最近的可以作為緩存的地方,而且借助的是用戶的“資源”(緩存的數(shù)據(jù)在用戶的終端設(shè)備上),性價(jià)比可謂最好,讓用戶幫你分擔(dān)壓力分布式系統(tǒng)關(guān)注點(diǎn)——360°全方位解讀「緩存」。

 

分布式系統(tǒng)關(guān)注點(diǎn)——360°全方位解讀「緩存」

 

當(dāng)你打開瀏覽器的開發(fā)者工具,看到from cache或者from memory cache、from disk cache的時(shí)候,就意味著這些數(shù)據(jù)已經(jīng)被緩存在了用戶的終端設(shè)備上了(沒網(wǎng)的時(shí)候也能訪問到一部分內(nèi)容就是這個(gè)原因)。

 

這個(gè)過程是瀏覽器替我們完成的,一般用于緩存圖片、js、css這些。我們可以通過Http消息頭中的Cache-Control來控制它,具體細(xì)節(jié)這里就不展開了。

 

js里的全局變量、以及cookie等運(yùn)用也屬于該范疇。

 

瀏覽器緩存是在于用戶側(cè)的緩存點(diǎn),所以我們對(duì)其的掌控力就差很多,在沒有發(fā)起新請(qǐng)求的情況下,你無法主動(dòng)去更新數(shù)據(jù)。

 

 

CDN緩存

提供CDN服務(wù)的服務(wù)商,在全國(guó)甚至是全球部署著大量的服務(wù)器節(jié)點(diǎn)(可以叫做「邊緣服務(wù)器」)。

 

那么將數(shù)據(jù)分發(fā)到這些遍布各地服務(wù)器上作為緩存,讓用戶訪問就近的服務(wù)器上的緩存數(shù)據(jù),就可以起到壓力分?jǐn)偤图铀傩Ч?。這在ToC類型的系統(tǒng)上運(yùn)用,效果格外顯著。

 

但是需要注意的是,由于節(jié)點(diǎn)眾多,更新緩存數(shù)據(jù)比較緩慢,一般至少是分鐘級(jí)別。所以一般僅適用于不經(jīng)常變動(dòng)的靜態(tài)數(shù)據(jù)。

 

題外話:解決方式也是有的,就是在url后面帶個(gè)自增數(shù)或者唯一標(biāo)示,如?v=1001。因?yàn)椴煌膗rl會(huì)被視作“新”的數(shù)據(jù)和文件,被重新create出來。



網(wǎng)關(guān)(代理)緩存

到這里做緩存就是在你自己的地盤了。很多時(shí)候我們會(huì)在源站前面架一層網(wǎng)關(guān)(或者說反向代理、正向代理),為的是做一些安全機(jī)制或者統(tǒng)一分流策略的入口。

 

分布式系統(tǒng)關(guān)注點(diǎn)——360°全方位解讀「緩存」

 

同時(shí)這里也是做緩存的一個(gè)好場(chǎng)所。畢竟網(wǎng)關(guān)是“業(yè)務(wù)無關(guān)性”的,它能夠攔下來的請(qǐng)求,對(duì)背后的源站也是很大的受益,減少了大量的CPU運(yùn)算。

 

常用的網(wǎng)關(guān)(代理)緩存有Varnish,Squid,Ngnix。一般情況下,簡(jiǎn)單的緩存運(yùn)用場(chǎng)景,用nginx即可,因?yàn)榇蟛糠謺r(shí)候我們會(huì)用它來做負(fù)載均衡,能少引入一個(gè)技術(shù)就少一份復(fù)雜度嘛。如果是大量的小文件可以使用Varnish,而Squid則相對(duì)大而全,運(yùn)用成本也更高一些。

 

 

進(jìn)程內(nèi)緩存

一個(gè)請(qǐng)求能走到這里說明他是“業(yè)務(wù)相關(guān)”的,需要經(jīng)過業(yè)務(wù)邏輯的運(yùn)算。

 

也正因?yàn)槿绱耍瑥倪@里開始對(duì)緩存的引入成本比前面3種大大增加,因?yàn)閷?duì)緩存與數(shù)據(jù)庫(kù)之間的「數(shù)據(jù)一致性」要求更高了。

 

 

可能我們大多數(shù)程序員第一次刻意使用緩存的場(chǎng)景就是這個(gè)時(shí)候分布式系統(tǒng)關(guān)注點(diǎn)——360°全方位解讀「緩存」。進(jìn)程內(nèi)和進(jìn)程外的緩存運(yùn)用中有很多的細(xì)節(jié)需要注意,這些也是我們后續(xù)文章的內(nèi)容,所以我們后續(xù)再詳聊。

 

 

進(jìn)程外緩存

這個(gè)大家也熟悉,就是redis、memcached之類,甚至也可以自己?jiǎn)为?dú)寫一個(gè)程序來專門存放緩存數(shù)據(jù),供其他程序遠(yuǎn)程調(diào)用。

 

同樣,這里的細(xì)節(jié)我們后續(xù)再聊,這里先多說幾句關(guān)于redis和memcached該怎么選擇的建議。

 

對(duì)資源(cpu、內(nèi)存等)利用率格外重視的話可以使用Memcached,但程序在使用的時(shí)候需要容忍可能發(fā)生的數(shù)據(jù)丟失,因?yàn)槭羌儍?nèi)存的機(jī)制。如果無法容忍這點(diǎn),并且對(duì)資源利用率也比較豪放的話可以使用redis。而且redis的數(shù)據(jù)庫(kù)結(jié)構(gòu)更多,Memcached只有key value,更像是一個(gè)nosql存儲(chǔ)。

 

 

數(shù)據(jù)庫(kù)緩存

數(shù)據(jù)庫(kù)本身自帶緩存模塊的,否則也不會(huì)叫它內(nèi)存殺手,基本上你給多少內(nèi)存就能吃多少。

 

數(shù)據(jù)庫(kù)緩存是數(shù)據(jù)庫(kù)的內(nèi)部機(jī)制,我們這里就不深入下去了。一般都會(huì)給出設(shè)置緩存空間大小的配置來讓你進(jìn)行干預(yù)。

 

 

最后,其實(shí)磁盤本身也有緩存。所以你會(huì)發(fā)現(xiàn),為了讓數(shù)據(jù)能夠平穩(wěn)的寫到物理磁盤中真的是一波三折,不知道什么時(shí)候可以有“快”到不需要程序來考慮緩存的磁盤出現(xiàn)來拯救我們程序員呢分布式系統(tǒng)關(guān)注點(diǎn)——360°全方位解讀「緩存」

 

 

「緩存」是Silver bullet嗎?

可能你會(huì)想緩存那么好,那么應(yīng)該×××,只要慢就上緩存來解決?

 

一個(gè)事物看上去再好,也有它負(fù)面的一面。緩存也有一系列的副作用需要考慮。除了上面提到的「緩存更新」和「緩存與數(shù)據(jù)的一致性」問題,還有諸如:

  1. 緩存雪崩

  2. 緩存穿透

  3. 緩存并發(fā)

  4. 緩存無底洞

  5. 緩存淘汰

  6. ...

等等問題,這些Z哥會(huì)在接下去的文章中和你一起深入剖析。

 

想第一時(shí)間了解這些的可以「關(guān)注」Z哥一波~

 

 

總結(jié)

好了,我們總結(jié)一下。

 

這次呢,Z哥先向你介紹了運(yùn)用緩存的三種思路。

 

然后梳理了在一個(gè)完整的系統(tǒng)中可以設(shè)立緩存的幾個(gè)位置,并且分享了關(guān)于瀏覽器緩存、CDN緩存、網(wǎng)關(guān)(代理)緩存的一些使用經(jīng)驗(yàn)。

 

希望對(duì)你有所啟發(fā)。

 

 

后續(xù)的文章我將著重深入「進(jìn)程內(nèi)緩存」和「進(jìn)程外緩存」的最佳實(shí)踐,等我再次出現(xiàn)分布式系統(tǒng)關(guān)注點(diǎn)——360°全方位解讀「緩存」

 

 

 


 

相關(guān)文章:

  • 分布式系統(tǒng)關(guān)注點(diǎn)——僅需這一篇,吃透「負(fù)載均衡」妥妥的

  • 分布式系統(tǒng)關(guān)注點(diǎn)——如何去實(shí)施「負(fù)載均衡」?

  • 分布式系統(tǒng)關(guān)注點(diǎn)——做了「負(fù)載均衡」就可以隨便加機(jī)器了嗎?

  • 分布式系統(tǒng)關(guān)注點(diǎn)——「無狀態(tài)」詳解

  • 分布式系統(tǒng)關(guān)注點(diǎn)——「高內(nèi)聚低耦合」詳解

  • 分布式系統(tǒng)關(guān)注點(diǎn)——彈性架構(gòu)

 


 

作者:Zachary

出處:https://www.cnblogs.com/Zachary-Fan/p/cache.html

 

如果你喜歡這篇文章,可以點(diǎn)一下左下角的「大拇指」。

 

這樣可以給我一點(diǎn)反饋。: )

 

謝謝你的舉手之勞。

 

?關(guān)于作者:張帆(Zachary,個(gè)人微信號(hào):Zachary-ZF)。堅(jiān)持用心打磨每一篇高質(zhì)量原創(chuàng)。歡迎掃描下方的二維碼~。

定期發(fā)表原創(chuàng)內(nèi)容:架構(gòu)設(shè)計(jì)丨分布式系統(tǒng)丨產(chǎn)品丨運(yùn)營(yíng)丨一些思考。

 

如果你是初級(jí)程序員,想提升但不知道如何下手。又或者做程序員多年,陷入了一些瓶頸想拓寬一下視野。歡迎關(guān)注我的公眾號(hào)「跨界架構(gòu)師」,回復(fù)「技術(shù)」,送你一份我長(zhǎng)期收集和整理的思維導(dǎo)圖。

如果你是運(yùn)營(yíng),面對(duì)不斷變化的市場(chǎng)束手無策。又或者想了解主流的運(yùn)營(yíng)策略,以豐富自己的“倉(cāng)庫(kù)”。歡迎關(guān)注我的公眾號(hào)「跨界架構(gòu)師」,回復(fù)「運(yùn)營(yíng)」,送你一份我長(zhǎng)期收集和整理的思維導(dǎo)圖。

分布式系統(tǒng)關(guān)注點(diǎn)——360°全方位解讀「緩存」

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI