溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

GaussDB T分布式集群數(shù)據(jù)庫的維護工作有哪些

發(fā)布時間：2021-11-30 10:58:13 來源：億速云閱讀：201 作者：柒染欄目：數(shù)據(jù)庫

這期內(nèi)容當(dāng)中小編將會給大家?guī)碛嘘P(guān)GaussDB T分布式集群數(shù)據(jù)庫的維護工作有哪些，文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述，閱讀完這篇文章希望大家可以有所收獲。

我們開始GaussDB T每日維護必做的事情。新的一天從開啟主機開始，把虛擬機打開后發(fā)現(xiàn)上次安裝的數(shù)據(jù)庫沒有自啟動，所有節(jié)點啟動的相關(guān)進程僅cm_agent進程：

GaussDB T分布式集群數(shù)據(jù)庫的維護工作有哪些

這個時候我們先要拉起ETCD：

GaussDB T分布式集群數(shù)據(jù)庫的維護工作有哪些

OK，ETCD成功拉起，接下來我們拉起整個集群：

GaussDB T分布式集群數(shù)據(jù)庫的維護工作有哪些

集群拉起成功。

后面我們會將ETCD及集群自動拉起加入自啟動，下面開始回到開篇的主題，每日維護開始。

一、集群狀態(tài)檢查

第一件事當(dāng)然是檢查集群各節(jié)點資源狀態(tài)情況啦，至于看啥，我們用一張圖來了解要點：

GaussDB T分布式集群數(shù)據(jù)庫的維護工作有哪些

GaussDB T分布式集群數(shù)據(jù)庫的維護工作有哪些

1、查看各節(jié)點資源是否是ON LINE，其中包括CM,CN,DN,ETCD等，如果不是，需進一步核查原因了。

2、查看各節(jié)點對比昨日是否涉及節(jié)點切換情況，查看節(jié)點對應(yīng)的HOST即可。如有則異常，需進一步核查原因了。

二、檢查主機資源使用情況(所有主機)

1、主機目錄使用率

df -h

GaussDB T分布式集群數(shù)據(jù)庫的維護工作有哪些

2、CPU、內(nèi)存及IO使用情況

這個檢查的方法很多，這里使用了vmstat,iostat,free，請重點關(guān)注以下紅框標(biāo)示的位置。

GaussDB T分布式集群數(shù)據(jù)庫的維護工作有哪些

釋：id列代表的是CPU空閑率，free列代表的是空閑內(nèi)存，單位為頁。

GaussDB T分布式集群數(shù)據(jù)庫的維護工作有哪些

釋：rMB/s及wMB/s的是每秒讀寫情況，%util在統(tǒng)計時間內(nèi)所有處理IO時間，除以總共統(tǒng)計時間。例如，如果統(tǒng)計間隔1秒，該設(shè)備有0.8秒在處理IO，而0.2秒閑置，那么該設(shè)備的%util = 0.8/1 = 80%，所以該參數(shù)暗示了設(shè)備的繁忙程度。如果該參數(shù)是100%表示設(shè)備已經(jīng)接近滿負荷運行了(當(dāng)然如果是多磁盤，即使%util是100%，因為磁盤的并發(fā)能力，所以磁盤使用未必就到了瓶頸)。

GaussDB T分布式集群數(shù)據(jù)庫的維護工作有哪些

釋：重點關(guān)注free及available。

注：本節(jié)資源檢查需與基線進行比對，如出入過大需進一步核查原因。

三、核查各節(jié)點數(shù)據(jù)庫狀態(tài)

GaussDB T分布式集群數(shù)據(jù)庫的維護工作有哪些

GaussDB T分布式集群數(shù)據(jù)庫的維護工作有哪些

確認CN及DN都處于open狀態(tài)，注意備DN是mount狀態(tài)。

四、表空間使用率檢查

當(dāng)在進行使用率檢查之前，先說下表空間如何創(chuàng)建。

1、連接到cn

zsql omm/gaussdb_123@127.0.0.1:8000 –q

GaussDB T分布式集群數(shù)據(jù)庫的維護工作有哪些

2、創(chuàng)建表空間

CREATE TABLESPACE tbs_test1 DATAFILE 'tbs_test1' size 100m SHARD;

GaussDB T分布式集群數(shù)據(jù)庫的維護工作有哪些

注：創(chuàng)建表空間時，使用SHARD關(guān)鍵字則支持將創(chuàng)建表空間語句自動下發(fā)至CN和DN節(jié)點且僅支持使用相對路徑;若不使用SHARD關(guān)鍵字，則可使用絕對路徑，同時需要在所有CN和主DN節(jié)點上都創(chuàng)建這個表空間后，才能正常在這個表空間下創(chuàng)建表。

3、檢查數(shù)據(jù)文件，我們會發(fā)現(xiàn)在CN及DN都創(chuàng)建了對應(yīng)的表空間及數(shù)據(jù)文件

GaussDB T分布式集群數(shù)據(jù)庫的維護工作有哪些

GaussDB T分布式集群數(shù)據(jù)庫的維護工作有哪些

GaussDB T分布式集群數(shù)據(jù)庫的維護工作有哪些

注：連接主DN使用如下命令連接。

zsql / as sysdba -D /gaussdb/data/data_dn1 -q

4、檢查表空間的使用率

set line 300 set pages 2000 set timing off col tablespace_name for a25 col sum_GB for a15 col free_GB for a15 col use_precent for a15 select b.tablespace_name,        round(sum(b.bytes) / 1024 / 1024 / 1024, 0) sum_GB,        round(sum(nvl(a.bytes, 0)) / 1024 / 1024 / 1024, 0) free_GB,        round((sum(b.bytes) - sum(nvl(a.bytes, 0))) / sum(b.bytes), 4) * 100 use_precent,        count(*)   from (select tablespace_name, file_id, sum(bytes) bytes           from adm_free_space          group by tablespace_name, file_id) a,        adm_data_files b  where a.file_id(+) = b.file_id    and a.tablespace_name(+) = b.tablespace_name  group by b.tablespace_name having round((sum(b.bytes) - sum(nvl(a.bytes, 0))) / sum(b.bytes), 4) * 100 >= 0  order by 4 desc;

GaussDB T分布式集群數(shù)據(jù)庫的維護工作有哪些

注：表空間使用率檢查需在所有的主CN及主DN運行。

五、異常等待事件檢查

col event form a38

select event,count(*) from DV_SESSIONS where LOCK_WAIT = 'Y' group by event order by 2 desc;

GaussDB T分布式集群數(shù)據(jù)庫的維護工作有哪些

注：在所有主DN核查是否存在異常等待事件。

如圖所示存在TX等待，我們可以通過以下SQL查看下鎖源在干啥：

select SID,SERIAL#,USERNAME,CURR_SCHEMA,CLIENT_IP,CLIENT_PORT,OSUSER,MACHINE,PROGRAM, STATUS,LOCK_WAIT,EVENT,MODULE,CURRENT_SQL from dv_sessions where sid in (select WAIT_SID from v$session where event like '%TX%');

如發(fā)現(xiàn)會話狀態(tài)是非活動且是應(yīng)用程序連上來的，可以聯(lián)系應(yīng)用核查是否正常，如可以kill我們可以運行ALTER SYSTEM KILL SESSION 'SID,SERIAL#'; 殺會話。

GaussDB T分布式集群數(shù)據(jù)庫的維護工作有哪些

六、日志檢查

在數(shù)據(jù)庫運行過程中，會產(chǎn)生大量用于數(shù)據(jù)庫日常維護的運行、審計、 DEBUG、告警等日志。在數(shù)據(jù)庫發(fā)生故障時，可以使用這些日志進行問題定位和數(shù)據(jù)庫恢復(fù)的操作。

下面就常用的日志類型做下簡介：

1、運行日志

打印GaussDB T數(shù)據(jù)庫運行信息，如果數(shù)據(jù)庫出現(xiàn)故障，請查看zengine.rlog。

日志目錄：默認為“ $GSDB_DATA/log/run/zengine.rlog”或參數(shù)log_home對應(yīng)的路徑run子目錄下，如果想修改其路徑重啟生效。

CN節(jié)點：

GaussDB T分布式集群數(shù)據(jù)庫的維護工作有哪些

DN節(jié)點：

GaussDB T分布式集群數(shù)據(jù)庫的維護工作有哪些

查看運行日志如下：

GaussDB T分布式集群數(shù)據(jù)庫的維護工作有哪些

2、慢查詢?nèi)罩?/p>

打印GaussDB 100數(shù)據(jù)庫執(zhí)行時間超過閾值(由LONGSQL_TIMEOUT參數(shù)控制)的SQL信息到zengine.lsql日志文件中。

日志目錄：默認為“ $GSDB_DATA/log/longsql/zengine.lsql”。

3、告警日志

打印GaussDB 100數(shù)據(jù)庫運行告警信息。如需了解告警信息，請查看zenith_alarm.log。

日志目錄：“ $GSDB_DATA/log/zenith_alarm.log”。

4、操作日志

記錄用戶通過ZSQL工具對GaussDB 100數(shù)據(jù)庫的操作信息。如果需要了解操作記錄，請查看zsql.olog。

日志目錄：“ $GSDB_DATA/log/oper/zsql.olog”。

5、TRACE日志

記錄數(shù)據(jù)庫會話死鎖的信息。如需查看會話死鎖信息，請查看zengine_00003_xxxxxx.trc。

日志目錄：“ $GSDB_DATA/trc/zengine_00003_xxxxxx.trc”。

常見錯誤碼：

GS-00716：Found %s deadlock in session (%u)

錯誤原因：不同會話中并發(fā)交叉操作了同一批數(shù)據(jù)，造成死鎖。

解決辦法：

查看trace log 或者 run log (根據(jù)數(shù)據(jù)庫版本不同，死鎖日志位置不同);
根據(jù)日志里記錄的具體信息，包括死鎖類型，SQL語句等，排查業(yè)務(wù)語句。

GS-00715：The snapshot was outdated.

錯誤原因：快照過舊。

解決辦法：

重新運行SQL;
將長時間運行的高耗SQL優(yōu)化或拆分。

GS-00713：No free undo page

錯誤原因：UNDO表空間不足。

解決辦法：

增大UNDO表空間大小;
將大事務(wù)kill釋放UNDO。

GS-00305：%s timeout

錯誤原因：網(wǎng)絡(luò)api超時。

解決辦法：

請確保主機網(wǎng)絡(luò)正常。

GS-00774：Failover in progress, can not be connected

錯誤原因：備機正在做failover時，主機的日志發(fā)送線程來連接備機。

解決辦法：

將主機停止掉，待備機升主后，將原主降備。

GS-00839：Flush redo file:%s, offset:%u, size:%lu failed

錯誤原因：寫redo日志文件的時候失敗了，一般是文件系統(tǒng)或者磁盤有問題。

解決辦法：

檢查操作系統(tǒng)或磁盤。

GaussDB T數(shù)據(jù)庫維護的工作很多，除了以上每日必做的事情之外，還有會話連接失敗、緩沖區(qū)刷盤失敗、CN/DN節(jié)點狀態(tài)異常、CM Server節(jié)點狀態(tài)異常、主備DN節(jié)點日志同步延遲過大等等問題核查。其中很多我們可以通過使用Database Manager分析處理告警或者使用自己開發(fā)腳本實現(xiàn)告警。

維護的目的是讓系統(tǒng)更穩(wěn)定，維護工作越簡單，維護人員就越不容易出錯。

上述就是小編為大家分享的GaussDB T分布式集群數(shù)據(jù)庫的維護工作有哪些了，如果剛好有類似的疑惑，不妨參照上述分析進行理解。如果想知道更多相關(guān)知識，歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點不代表本網(wǎng)站立場，如果涉及侵權(quán)請聯(lián)系站長郵箱：is@yisu.com進行舉報，并提供相關(guān)證據(jù)，一經(jīng)查實，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
Java中final怎么使用
下一篇新聞：
C/C++?Qt?TreeWidget單層樹形組件怎么應(yīng)用

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動

幫助支持

關(guān)于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關(guān)注億速云

億速云公眾號

手機網(wǎng)站二維碼

<strong id="abvqi"><sup id="abvqi"></sup></strong>