怎么構(gòu)建OpenStack的高可用性

發(fā)布時間：2021-10-22 09:23:24 來源：億速云閱讀：213 作者：小新欄目：系統(tǒng)運(yùn)維

這篇文章主要介紹怎么構(gòu)建OpenStack的高可用性，文中介紹的非常詳細(xì)，具有一定的參考價值，感興趣的小伙伴們一定要看完！

1、CAP理論

1） CAP 理論給出了3個基本要素：

一致性 ( Consistency) ：任何一個讀操作總是能讀取到之前完成的寫操作結(jié)果；
可用性 ( Availability) ：每一個操作總是能夠在確定的時間內(nèi)返回；
分區(qū)可容忍性 (Tolerance of network Partition) ：在出現(xiàn)網(wǎng)絡(luò)分區(qū)的情況下，仍然能夠滿足一致性和可用性；

CAP 理論指出，三者不能同時滿足。對這個理論有不少異議，但是它的參考價值依然巨大。

這個理論并不能為不滿足這3個基本要求的設(shè)計提供借口，只是說明理論上3者不可絕對的滿足，而且工程上從來不要求絕對的一致性或者可用性，但是必須尋求一種平衡和***。

對于分布式數(shù)據(jù)系統(tǒng)，分區(qū)容忍性是基本要求。因此設(shè)計分布式數(shù)據(jù)系統(tǒng)，很多時候是在一致性和可用性（可靠性）之間尋求一個平衡。更多的系統(tǒng)性能和架構(gòu)的討論也是圍繞一致性和可用性展開。

2） OpenStack、Swift與CAP的工程實(shí)踐

對照CAP理論，OpenStack的分布式對象存儲系統(tǒng)Swift滿足了可用性和分區(qū)容忍性，沒有保證一致性（可選的），只是實(shí)現(xiàn)了最終一致性。Swift如果GET操作沒有在請求頭中包含’X-Newest’頭，那么這次讀取有可能讀到的不是***的object，在一致性窗口時間內(nèi)object沒有被更新，那么后續(xù)GET操作讀取的object將是***的，保證了最終一致性；反之包含了’X-Newest’頭，GET操作始終能讀取到***的obejct，就是一致的。

在OpenStack架構(gòu)中，對于高可用性需要進(jìn)行很多工作來保證。因此，下面將對OpenStack結(jié)構(gòu)中的可用性進(jìn)行討論：

2、OpenStack的高可用性（OpenStack HA）

要弄清楚怎么實(shí)現(xiàn)高可用性，就需要知道哪些服務(wù)容易出現(xiàn)不可靠。首先了解一些OpenStack的大致結(jié)構(gòu)。

OpenStack由5大組件組成（計算nova，身份管理keystone，鏡像管理glance，前端管理dashboard和對象存儲swift）。

nova是計算、控制的核心組件，它又包括nova-compute、nova-scheduler、nova-volume、nova-network和nova-api等服務(wù)。借用http://ken.people.info的以下這幅圖了解OpenStack的5大組件和功能：

怎么構(gòu)建OpenStack的高可用性

下面這幅圖描述了各個組件的功能和服務(wù)結(jié)構(gòu)：怎么構(gòu)建OpenStack的高可用性

同其它大部分分布式系統(tǒng)一樣，OpenStack也分為控制節(jié)點(diǎn)和計算節(jié)點(diǎn)兩種不同功能的節(jié)點(diǎn)?？刂乒?jié)點(diǎn)提供除nova-compute以外的服務(wù)。這些組件和服務(wù)都是可以獨(dú)立安裝的，可以選擇組合。

nova-compute在每個計算節(jié)點(diǎn)運(yùn)行，暫且假設(shè)它是可信任的；或者使用備份機(jī)來實(shí)現(xiàn)故障轉(zhuǎn)移（不過每個計算節(jié)點(diǎn)配置備份的代價相比收益似乎太大）。

控制節(jié)點(diǎn)的高可靠性是主要問題，而且對于不同的組件都有自己的高可靠性需求和方案。

（1）由于CotrolNode只有１個，且負(fù)責(zé)整個系統(tǒng)的管理和控制，因此當(dāng)Cotrol Node不能提供正常服務(wù)時，怎么辦？這就是常見的單節(jié)點(diǎn)故障（SPoF，single point of failure）問題。

高可用性基本上是沒辦法通過一臺來達(dá)到目標(biāo)的，更多的時候是設(shè)計方案確保在出問題的時候盡快接管故障機(jī)器，當(dāng)然這要付出更大的成本。

對于單點(diǎn)問題，解決的方案一般是采用冗余設(shè)備或者熱備，因?yàn)橛布腻e誤或者人為的原因，總是有可能造成單個或多個節(jié)點(diǎn)的失效，有時做節(jié)點(diǎn)的維護(hù)或者升級，也需要暫時停止某些節(jié)點(diǎn)，所以一個可靠的系統(tǒng)必須能承受單個或多個節(jié)點(diǎn)的停止。

常見的部署模式有：Active-passive主備模式，Active-active雙主動模式，集群模式。

（2）那么如何構(gòu)建冗余的控制節(jié)點(diǎn)？或者什么其它方法實(shí)現(xiàn)高可靠的控制？

很多人可能想到實(shí)現(xiàn)active-passive模式，使用心跳機(jī)制或者類似的方法進(jìn)行備份，通過故障轉(zhuǎn)移來實(shí)現(xiàn)高可靠性。Openstack是沒有多個控制節(jié)點(diǎn)的，Pacemaker需要多種服務(wù)各自實(shí)現(xiàn)這種備份、監(jiān)聽和切換。

仔細(xì)分析控制節(jié)點(diǎn)提供的服務(wù)，主要就是nova-api、nova-network、nova-schedule、nova-volume，以及glance、keysonte和數(shù)據(jù)庫mysql等，這些服務(wù)是分開提供的。nova-api、nova-network、glance等可以分別在每個計算節(jié)點(diǎn)上工作，RabbitMQ可以工作在主備模式，mysql可以使用冗余的高可用集群。

下面分別介紹：

1）nova-api和nova-scheduler的高可靠性

每個計算節(jié)點(diǎn)可以運(yùn)行自己的nova-api和nova-scheduler，提供負(fù)載均衡來保證這樣正確工作。

這樣當(dāng)控制節(jié)點(diǎn)出現(xiàn)故障，計算節(jié)點(diǎn)的nova-api等服務(wù)都照常進(jìn)行。

2）nova-volume的高可靠性

對于nova-volume目前沒有完善的HA（high availability）方法，還需要做很多工作。

不過，nova-volume由iSCSI驅(qū)動，這個協(xié)議與DRBD結(jié)合，或者基于iSCSI的高可靠的硬件解決方案，可以實(shí)現(xiàn)高可靠。

3）網(wǎng)絡(luò)服務(wù)nova-network的高可靠性

OpenStack的網(wǎng)絡(luò)已經(jīng)存在多種高可靠的方案，常用的你只需要使用 --multi_host 選項就可以讓網(wǎng)絡(luò)服務(wù)處于高可用模式（high availability mode），具體介紹見Existing High Availability Options for Networking。

方案1: Multi-host

多主機(jī)。每個計算節(jié)點(diǎn)上配置nova-network。這樣，每個計算節(jié)點(diǎn)都會實(shí)現(xiàn)NAT, DHCP和網(wǎng)關(guān)的功能，必然需要一定的開銷，可以與hardware gateway方式結(jié)合，避免每個計算節(jié)點(diǎn)的網(wǎng)關(guān)功能。這樣，每個計算節(jié)點(diǎn)都需要安裝nova-compute外還要nova-network和nova-api，并且需要能連接外網(wǎng)。具體介紹見Nova Multi-host Mode against SPoF。

方案2: Failover

故障轉(zhuǎn)移。能夠4秒轉(zhuǎn)移到熱備份上，詳細(xì)介紹見https://lists.launchpad.net/openstack/msg02099.html。不足之處是，需要備份機(jī)，而且有4秒延遲。

方案3: Multi-nic

多網(wǎng)卡技術(shù)。把VM橋接到多個網(wǎng)絡(luò)，VM就擁有2種傳出路由，實(shí)現(xiàn)故障時切換。但是這需要監(jiān)聽多個網(wǎng)絡(luò)，也需要設(shè)計切換策略。

方案4: Hardware gateway

硬件網(wǎng)關(guān)。需要配置外部網(wǎng)關(guān)。由于VLAN模式需要對每個網(wǎng)絡(luò)有一個網(wǎng)關(guān)，而hardware gateway方式只能對所有實(shí)例使用一個網(wǎng)關(guān)，因此不能在VLAN模式下使用。

方案5： Quantum（OpenStack下一個版本Folsom中）

Quantum的目標(biāo)是逐步實(shí)現(xiàn)功能完備的虛擬網(wǎng)絡(luò)服務(wù)。它暫時會繼續(xù)兼容舊的nova-network的功能如Flat、Flatdhcp等。但是實(shí)現(xiàn)了類似multi_host的功能，支持OpenStack工作在主備模式（active-backup這種高可用性模式）。

Quantum只需要一個nova-network的實(shí)例運(yùn)行，因此不能與multi_host模式共同工作。

Quantum允許單個租戶擁有多個私人專用L2網(wǎng)絡(luò)，通過加強(qiáng)QoS，以后應(yīng)該能使hadoop集群很好的在nova節(jié)點(diǎn)上工作。

對于Quantum的安裝使用，這篇文章Quantum Setup 有介紹。

4） glance、keystone的高可靠性

OpenStack的鏡像可以使用swift存儲，glance可以運(yùn)行在多個主機(jī)。Integrating OpenStack ImageService (Glance) with Swift 介紹了glance使用swift存儲。

集群管理工具 Pacemaker 是強(qiáng)大的高可用性解決方案，能夠管理多節(jié)點(diǎn)集群，實(shí)現(xiàn)服務(wù)切換和轉(zhuǎn)移，可與Corosync 和 Heartbeat等配套使用。Pacemaker 能夠較為靈活的實(shí)現(xiàn)主備、N+1 、N-N 等多種模式。

bringing-high-availability-openstack-keystone-and-glance介紹了如何通過Pacemaker實(shí)現(xiàn)keystone和glance的高可靠。在每個節(jié)點(diǎn)安裝OCF代理后，它能夠告訴一個節(jié)點(diǎn)另一個節(jié)點(diǎn)是否正常運(yùn)行g(shù)lance和keysone服務(wù)，從而幫助Pacemaker開啟、停止和監(jiān)測這些服務(wù)。

5） Swift對象存儲的高可靠性

一般情況下，OpenStack的分布式對象存儲系統(tǒng)Swift的HA是不需要自己添加的。因?yàn)?，Swift設(shè)計時就是分布式（沒有主控節(jié)點(diǎn)）、容錯、冗余機(jī)制、數(shù)據(jù)恢復(fù)機(jī)制、可擴(kuò)展和高可靠的。以下是Swift的部分優(yōu)點(diǎn)，這也說明了這點(diǎn)。

Built-in Replication(N copies of accounts, container, objects)

3x+ data redundancy compared to 2x on RAID

內(nèi)建冗余機(jī)制

RAID技術(shù)只做兩個備份，而Swift最少有3個備份

High Availability

高可靠性

Easily add capacity unlike RAID resize

可以方便地進(jìn)行存儲擴(kuò)容

Elastic data scaling with ease

方便的擴(kuò)容能力

No central database

沒有中心節(jié)點(diǎn)

Higher performance, No bottlenecks

高性能，無瓶頸限制

6）消息隊列服務(wù)RabbitMQ的高可靠性

RabbitMQ失效就會導(dǎo)致丟失消息，可以有多種HA機(jī)制：

publisher confirms 方法可以在故障時通知什么寫入了磁盤。
多機(jī)集群機(jī)制，但是節(jié)點(diǎn)失效容易導(dǎo)致隊列失效。
主備模式（active-passive），能夠?qū)崿F(xiàn)故障時轉(zhuǎn)移，但是啟動備份機(jī)可能需要延遲甚至失效。

在容災(zāi)與可用性方面，RabbitMQ提供了可持久化的隊列。能夠在隊列服務(wù)崩潰的時候，將未處理的消息持久化到磁盤上。為了避免因?yàn)榘l(fā)送消息到寫入消息之間的延遲導(dǎo)致信息丟失，RabbitMQ引入了Publisher Confirm機(jī)制以確保消息被真正地寫入到磁盤中。它對Cluster的支持提供了Active/Passive與Active/Active兩種模式。例如，在Active/Passive模式下，一旦一個節(jié)點(diǎn)失敗，Passive節(jié)點(diǎn)就會馬上被激活，并迅速替代失敗的Active節(jié)點(diǎn)，承擔(dān)起消息傳遞的職責(zé)。如圖所示：

怎么構(gòu)建OpenStack的高可用性

圖 Active/Passive Cluster（圖片來自RabbitMQ官方網(wǎng)站）

active-passive模式存在所說的問題，因此，基于RabbitMQ集群引入了一種雙主動集群機(jī)制（active-active）解決了這些問題。http://www.rabbitmq.com/ha.html這篇文章詳細(xì)介紹了RabbitMQ的高可靠部署和原理。

7）數(shù)據(jù)庫mysql的高可靠性

集群并不就是高可靠，常用的構(gòu)建高可靠的mysql的方法有Active-passive主備模式：使用DRBD實(shí)現(xiàn)主備機(jī)的災(zāi)容，Heartbeat或者Corosync做心跳監(jiān)測、服務(wù)切換甚至failover，Pacemaker實(shí)現(xiàn)服務(wù)（資源）的切換及控制等；或者類似的機(jī)制。其中主要使用Pacemaker實(shí)現(xiàn)了mysql的active-passive高可用集群。

一個重要的技術(shù)是DRBD：(distributed replication block device)即分布式復(fù)制塊設(shè)備，經(jīng)常被用來代替共享磁盤。

它的工作原理是：在A主機(jī)上有對指定磁盤設(shè)備寫請求時，數(shù)據(jù)發(fā)送給A主機(jī)的kernel，然后通過kernel中的一個模塊，把相同的數(shù)據(jù)傳送給B主機(jī)的kernel中一份，然后B主機(jī)再寫入自己指定的磁盤設(shè)備，從而實(shí)現(xiàn)兩主機(jī)數(shù)據(jù)的同步,也就實(shí)現(xiàn)了寫操作高可用。DRBD一般是一主一從，并且所有的讀寫操作，掛載只能在主節(jié)點(diǎn)服務(wù)器上進(jìn)行，，但是主從DRBD服務(wù)器之間是可以進(jìn)行調(diào)換的。這里有對 DRBD 的介紹。

HAforNovaDB - OpenStack介紹了只使用共享磁盤而沒有使用DRBD，通過Pacemaker實(shí)現(xiàn)OpenStack的高可靠。

NovaZooKeeperHeartbeat介紹了使用ZooKeeper作心跳檢測。

MySQL HA with Pacemaker 介紹了使用Pacemaker提供高可靠服務(wù)，這也是很常見的解決方案。

Galera 是針對Mysql/InnoDB的同步的多master集群的開源項目，提供了很多的優(yōu)點(diǎn)（如同步復(fù)制、讀寫到任意節(jié)點(diǎn)、自動成員控制、自動節(jié)點(diǎn)加入、較小延遲等），可以參考。

Pacemaker與DRBD、Mysql的工作模式可以參考下圖：

怎么構(gòu)建OpenStack的高可用性

其它的方案，根據(jù) MySQLPerformance Blog 的說法，MySQL幾種高可用解決方案能達(dá)到的可用性如下：

怎么構(gòu)建OpenStack的高可用性

3、構(gòu)建高可用性的OpenStack（High-availability OpenStack）

一般來說，高可用性也就是建立冗余備份，常用策略有：

集群工作模式。多機(jī)互備，這樣模式是把每個實(shí)例備份多份，沒有中心節(jié)點(diǎn)，比如分布式對象存儲系統(tǒng)Swift、nova-network多主機(jī)模式。

自主模式。有時候，解決單點(diǎn)故障（SPoF）可以簡單的使用每個節(jié)點(diǎn)自主工作，通過去主從關(guān)系來減少主控節(jié)點(diǎn)失效帶來的問題，比如nova-api只負(fù)責(zé)自己所在節(jié)點(diǎn)。

主備模式。常見的模式active-passive，被動節(jié)點(diǎn)處于監(jiān)聽和備份模式，故障時及時切換，比如mysql高可用集群、glance、keystone使用Pacemaker和Heartbeat等來實(shí)現(xiàn)。

雙主模式。這種模式互備互援，RabbitMQ就是active-active集群高可用性，集群中的節(jié)點(diǎn)可進(jìn)行隊列的復(fù)制。從架構(gòu)上來說，這樣就不用擔(dān)心passive節(jié)點(diǎn)不能啟動或者延遲太大了？

以上是“怎么構(gòu)建OpenStack的高可用性”這篇文章的所有內(nèi)容，感謝各位的閱讀！希望分享的內(nèi)容對大家有幫助，更多相關(guān)知識，歡迎關(guān)注億速云行業(yè)資訊頻道！

向AI問一下細(xì)節(jié)

怎么構(gòu)建OpenStack的高可用性

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽