溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

計(jì)算節(jié)點(diǎn)宕機(jī)了如何解決

發(fā)布時(shí)間:2021-07-14 11:46:29 來源:億速云 閱讀:176 作者:Leah 欄目:云計(jì)算

今天就跟大家聊聊有關(guān)計(jì)算節(jié)點(diǎn)宕機(jī)了如何解決,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結(jié)了以下內(nèi)容,希望大家根據(jù)這篇文章可以有所收獲。

Rebuild 可以恢復(fù)損壞的 instance。

那如果是宿主機(jī)壞了怎么辦呢? 比如硬件故障或者斷電造成整臺(tái)計(jì)算節(jié)點(diǎn)無法工作,該節(jié)點(diǎn)上運(yùn)行的 instance 如何恢復(fù)呢?

用 Shelve 或者 Migrate 可不可以? 很不幸,這兩個(gè)操作都要求 instance 所在計(jì)算節(jié)點(diǎn)的 nova-compute 服務(wù)正常運(yùn)行。 幸運(yùn)的是,還有 Evacuate 操作。

Evacuate 可在 nova-compute 無法工作的情況下將節(jié)點(diǎn)上的 instance 遷移到其他計(jì)算節(jié)點(diǎn)上。但有個(gè)前提: Instance 的鏡像文件必須放在共享存儲(chǔ)上。

下面是 Evacuate instance 的流程圖

  1. 向 nova-api 發(fā)送請(qǐng)求

  2. nova-api 發(fā)送消息

  3. nova-scheduler 執(zhí)行調(diào)度

  4. nova-scheduler 發(fā)送消息

  5. nova-compute 執(zhí)行操作

下面我們?cè)敿?xì)討論每一個(gè)步驟。

向 nova-api 發(fā)送請(qǐng)求

我們的實(shí)驗(yàn)場景如下: Instance c2 運(yùn)行在 devstack-compute1 上。

通過斷電模擬計(jì)算節(jié)點(diǎn)故障,然后執(zhí)行 Evacuate 操作恢復(fù) instance c2。 目前 Evacuate 只能通過 CLI 執(zhí)行。

這里需要指定 --on-shared-storage 這個(gè)參數(shù)

查看日志 /opt/stack/logs/n-api.log

nova-api 發(fā)送消息

nova-api 向 Messaging(RabbitMQ)發(fā)送了一條消息:“Evacuate 這個(gè) Instance” 查看源代碼 /opt/stack/nova/nova/compute/api.py,方法是 evacuate。

大家注意到?jīng)]有,evacuate 實(shí)際上是通過 rebuild 操作實(shí)現(xiàn)的。 這是可以理解的,因?yàn)?evacuate 是用共享存儲(chǔ)上 instance 的鏡像文件重新創(chuàng)建虛機(jī)

nova-scheduler 執(zhí)行調(diào)度

nova-scheduler 收到消息后,會(huì)為 instance 選擇合適的計(jì)算節(jié)點(diǎn)。 查看日志 /opt/stack/logs/n-sch.log。

nova-scheduler 最后選擇在 devstack-controller 計(jì)算節(jié)點(diǎn)上重建 instance。

nova-scheduler 發(fā)送消息

nova-scheduler 發(fā)送消息,通知計(jì)算節(jié)點(diǎn)可以創(chuàng)建 instance 了。 源代碼在 /opt/stack/nova/nova/scheduler/filter_scheduler.py 第 95 行,方法為 select_destinations。

nova-compute 執(zhí)行操作

計(jì)算節(jié)點(diǎn)上的工作是用共享存儲(chǔ)上的鏡像文件重建 instance。 日志在 devstack-controller:/opt/stack/logs/n-cpu.log。

為instance分配資源

使用共享存儲(chǔ)上的鏡像文件

啟動(dòng) instance

Evacuate 操作完成后,instance 在 devstack-controller 上運(yùn)行。

看完上述內(nèi)容,你們對(duì)計(jì)算節(jié)點(diǎn)宕機(jī)了如何解決有進(jìn)一步的了解嗎?如果還想了解更多知識(shí)或者相關(guān)內(nèi)容,請(qǐng)關(guān)注億速云行業(yè)資訊頻道,感謝大家的支持。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI