PostgreSQL數(shù)據(jù)庫性能調(diào)優(yōu)的注意點及pg數(shù)據(jù)庫性能優(yōu)化方法是什么

發(fā)布時間：2023-03-15 11:14:51 來源：億速云閱讀：159 作者：iii 欄目：數(shù)據(jù)庫

本篇內(nèi)容主要講解“PostgreSQL數(shù)據(jù)庫性能調(diào)優(yōu)的注意點及pg數(shù)據(jù)庫性能優(yōu)化方法是什么”，感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷，實用性強。下面就讓小編來帶大家學(xué)習(xí)“PostgreSQL數(shù)據(jù)庫性能調(diào)優(yōu)的注意點及pg數(shù)據(jù)庫性能優(yōu)化方法是什么”吧!

PostgreSQL 優(yōu)化思路

優(yōu)化思路：

0、為每個表執(zhí)行 ANALYZE

然后分析 EXPLAIN (ANALYZE，BUFFERS) sql。

1、對于多表查詢，查看每張表數(shù)據(jù)，然后改進連接順序。

2、先查找那部分是重點語句，比如上面SQL，外面的嵌套層對于優(yōu)化來說沒有意義，可以去掉。

3、查看語句中，where等條件子句，每個字段能過濾的效率。找出可優(yōu)化處。

比如oc.order_id = oo.order_id是關(guān)聯(lián)條件，需要加索引

oc.op_type = 3 能過濾出1/20的數(shù)據(jù)，
oo.event_type IN (…) 能過濾出1/10的數(shù)據(jù)，

這兩個是優(yōu)化的重點，也就是實現(xiàn)確保op_type與event_type已經(jīng)加了索引，其次確保索引用到了。

一、排序

盡量避免
排序的數(shù)據(jù)量盡量少，并保證在內(nèi)存里完成排序。

（至于具體什么數(shù)據(jù)量能在內(nèi)存中完成排序，不同數(shù)據(jù)庫有不同的配置：oracle是sort_area_size；postgresql是work_mem (integer)，單位是KB，默認值是4MB。mysql是sort_buffer_size 注意：該參數(shù)對應(yīng)的分配內(nèi)存是每連接獨占?。?/p>

二、索引

過濾的數(shù)據(jù)量比較少，一般來說<20%,應(yīng)該走索引。20%-40% 可能走索引也可能不走索引。> 40% ，基本不走索引(會全表掃描)
保證值的數(shù)據(jù)類型和字段數(shù)據(jù)類型要一直。
對索引的字段進行計算時，必須在運算符右側(cè)進行計算。也就是 to_char(oc.create_date, ‘yyyyMMdd’)是沒用的
表字段之間關(guān)聯(lián)，盡量給相關(guān)字段上添加索引。
復(fù)合索引，遵從最左前綴的原則,即最左優(yōu)先。（單獨右側(cè)字段查詢沒有索引的）

三、連接查詢方式

1、hash join

放內(nèi)存里進行關(guān)聯(lián)。
適用于結(jié)果集比較大的情況。
比如都是200000數(shù)據(jù)

2、nest loop

從結(jié)果1 逐行取出，然后與結(jié)果集2進行匹配。
適用于兩個結(jié)果集，其中一個數(shù)據(jù)量遠大于另外一個時。
結(jié)果集一：1000
結(jié)果集二：1000000

四、多表聯(lián)查時

在多表聯(lián)查時，需要考慮連接順序問題。

1、當(dāng)postgresql中進行查詢時，如果多表是通過逗號，而不是join連接，那么連接順序是多表的笛卡爾積中取最優(yōu)的。如果有太多輸入的表， PostgreSQL規(guī)劃器將從窮舉搜索切換為基因概率搜索，以減少可能性數(shù)目(樣本空間)?；蛩阉骰ǖ臅r間少，但是并不一定能找到最好的規(guī)劃。

2、對于JOIN

LEFT JOIN / RIGHT JOIN 會一定程度上指定連接順序，但是還是會在某種程度上重新排列：
FULL JOIN 完全強制連接順序。

如果要強制規(guī)劃器遵循準確的JOIN連接順序，我們可以把運行時參數(shù)join_collapse_limit設(shè)置為 1

PostgreSQL提供了一些性能調(diào)優(yōu)的功能

主要有如下幾個方面。

1.使用EXPLAIN

EXPLAIN命令可以查看執(zhí)行計劃，這個方法是我們最主要的調(diào)試工具。

2.及時更新執(zhí)行計劃中使用的統(tǒng)計信息

由于統(tǒng)計信息不是每次操作數(shù)據(jù)庫都進行更新的，一般是在 VACUUM 、 ANALYZE 、 CREATE INDEX等DDL執(zhí)行的時候會更新統(tǒng)計信息，

因此執(zhí)行計劃所用的統(tǒng)計信息很有可能比較舊。這樣執(zhí)行計劃的分析結(jié)果可能誤差會變大。

以下是表tenk1的相關(guān)的一部分統(tǒng)計信息。

SELECT relname, relkind, reltuples, relpages FROM pg_class WHERE relname LIKE 'tenk1%';

relname	relkind	reltuples	relpages
tenk1	r	10000	358
tenk1_hundred	i	10000	30
tenk1_thous_tenthous	i	10000	30
tenk1_unique1	i	10000	30
tenk1_unique2	i	10000	30

(5 rows)

其中 relkind是類型，r是自身表，i是索引index；reltuples是項目數(shù)；relpages是所占硬盤的塊數(shù)。

3.明確用join來關(guān)聯(lián)表

一般寫法：

SELECT * FROM a, b, c WHERE a.id = b.id AND b.ref = c.id;

如果明確用join的話，執(zhí)行時候執(zhí)行計劃相對容易控制一些。

例子：

SELECT * FROM a CROSS JOIN b CROSS JOIN c WHERE a.id = b.id AND b.ref = c.id;
SELECT * FROM a JOIN (b JOIN c ON (b.ref = c.id)) ON (a.id = b.id);

4.關(guān)閉自動提交

（autocommit=false）

5.多次插入數(shù)據(jù)用copy命令更高效

我們有的處理中要對同一張表執(zhí)行很多次insert操作。這個時候我們用copy命令更有效率。因為insert一次，其相關(guān)的index都要做一次，比較花費時間。

6.臨時刪除index

有時候我們在備份和重新導(dǎo)入數(shù)據(jù)的時候，如果數(shù)據(jù)量很大的話，要很幾個小時才能完成。這個時候可以先把index刪除掉。導(dǎo)入在建index。

7.外鍵關(guān)聯(lián)的刪除

如果表的有外鍵的話，每次操作都沒去check外鍵整合性。因此比較慢。數(shù)據(jù)導(dǎo)入后在建立外鍵也是一種選擇。

8.增加maintenance_work_mem參數(shù)大小

增加這個參數(shù)可以提升CREATE INDEX和ALTER TABLE ADD FOREIGN KEY的執(zhí)行效率。

9.增加checkpoint_segments參數(shù)的大小

增加這個參數(shù)可以提升大量數(shù)據(jù)導(dǎo)入時候的速度。

10.設(shè)置archive_mode無效

這個參數(shù)設(shè)置為無效的時候，能夠提升以下的操作的速度

CREATE TABLE AS SELECT
CREATE INDEX
ALTER TABLE SET TABLESPACE
CLUSTER等。

11.最后執(zhí)行VACUUM ANALYZE

表中數(shù)據(jù)大量變化的時候建議執(zhí)行VACUUM ANALYZE。

對生產(chǎn)運行的數(shù)據(jù)庫要用定時任務(wù)crontb執(zhí)行如下操作：

psql -U username -d databasename -c "vacuum verbose analyze tablename;"

PostgreSQL 參數(shù)設(shè)置

autovacuum 相關(guān)參數(shù)

autovacuum：
默認為on，表示是否開起autovacuum。默認開起。特別的，當(dāng)需要凍結(jié)xid時，盡管此值為off，PG也會進行vacuum。 

autovacuum_naptime：
下一次vacuum的時間，默認1min。 這個naptime會被vacuum launcher分配到每個DB上。autovacuum_naptime/num of db。 

log_autovacuum_min_duration：
記錄autovacuum動作到日志文件，當(dāng)vacuum動作超過此值時。 “-1”表示不記錄?！?”表示每次都記錄。 

autovacuum_max_workers：
最大同時運行的worker數(shù)量，不包含launcher本身。 

autovacuum_work_mem：
每個worker可使用的最大內(nèi)存數(shù)。

autovacuum_vacuum_threshold：
默認50。與autovacuum_vacuum_scale_factor配合使用，autovacuum_vacuum_scale_factor默認值為20%。當(dāng)update,delete的tuples數(shù)量超過autovacuum_vacuum_scale_factor*table_size+autovacuum_vacuum_threshold時，進行vacuum。如果要使vacuum工作勤奮點，則將此值改小。 

autovacuum_analyze_threshold：
默認50。與autovacuum_analyze_scale_factor配合使用。

autovacuum_analyze_scale_factor：
默認10%。當(dāng)update,insert,delete的tuples數(shù)量超過autovacuum_analyze_scale_factor*table_size+autovacuum_analyze_threshold時，進行analyze。 

autovacuum_freeze_max_age：200 million。離下一次進行xid凍結(jié)的最大事務(wù)數(shù)。 

autovacuum_multixact_freeze_max_age：
400 million。離下一次進行xid凍結(jié)的最大事務(wù)數(shù)。 

autovacuum_vacuum_cost_delay：
如果為-1，取vacuum_cost_delay值。 

autovacuum_vacuum_cost_limit：
如果為-1，到vacuum_cost_limit的值，這個值是所有worker的累加值。

選項	默認值	說明	是否優(yōu)化	原因
max_connections	100	允許客戶端連接的最大數(shù)目	否	因為在測試的過程中，100個連接已經(jīng)足夠
fsync	on	強制把數(shù)據(jù)同步更新到磁盤	是	因為系統(tǒng)的IO壓力很大，為了更好的測試其他配置的影響，把改參數(shù)改為off
shared_buffers	24MB	決定有多少內(nèi)存可以被PostgreSQL用于緩存數(shù)據(jù)（推薦內(nèi)存的1/4)	是	在IO壓力很大的情況下，提高該值可以減少IO
work_mem	1MB	使內(nèi)部排序和一些復(fù)雜的查詢都在這個buffer中完成	是	有助提高排序等操作的速度，并且減低IO
effective_cache_size	128MB	優(yōu)化器假設(shè)一個查詢可以用的最大內(nèi)存，和shared_buffers無關(guān)（推薦內(nèi)存的1/2)	是	設(shè)置稍大，優(yōu)化器更傾向使用索引掃描而不是順序掃描
maintenance_work_mem	16MB	這里定義的內(nèi)存只是被VACUUM等耗費資源較多的命令調(diào)用時使用	是	把該值調(diào)大，能加快命令的執(zhí)行
wal_buffer	768kB	日志緩存區(qū)的大小	是	可以降低IO，如果遇上比較多的并發(fā)短事務(wù)，應(yīng)該和commit_delay一起用
checkpoint_segments	3	設(shè)置wal log的最大數(shù)量數(shù)（一個log的大小為16M）	是	默認的48M的緩存是一個嚴重的瓶頸，基本上都要設(shè)置為10以上
checkpoint_completion_target	0.5	表示checkpoint的完成時間要在兩個checkpoint間隔時間的N%內(nèi)完成	是	能降低平均寫入的開銷
commit_delay	0	事務(wù)提交后，日志寫到wal log上到wal_buffer寫入到磁盤的時間間隔。需要配合commit_sibling	是	能夠一次寫入多個事務(wù)，減少IO，提高性能
commit_siblings	5	設(shè)置觸發(fā)commit_delay的并發(fā)事務(wù)數(shù)，根據(jù)并發(fā)事務(wù)多少來配置	是	減少IO，提高性能
autovacuum_naptime	1min	下一次vacuum任務(wù)的時間	是	提高這個間隔時間，使他不是太頻繁
autovacuum_analyze_threshold	50	與autovacuum_analyze_scale_factor配合使用，來決定是否analyze	是	使analyze的頻率符合實際
autovacuum_analyze_scale_factor	0.1	當(dāng)update,insert,delete的tuples數(shù)量超過autovacuum_analyze_scale_factor*table_size+autovacuum_analyze_threshold時，進行analyze。	是	使analyze的頻率符合實際

PostgreSQL數(shù)據(jù)庫性能調(diào)優(yōu)的注意點及pg數(shù)據(jù)庫性能優(yōu)化方法是什么

pg中性能相關(guān)常調(diào)參數(shù)

參數(shù)名稱	參數(shù)意義	優(yōu)化思路
shared_buffers	數(shù)據(jù)庫服務(wù)器將使用的共享內(nèi)存緩沖區(qū)大小，該緩沖區(qū)為所有連接共用。從磁盤讀入的數(shù)據(jù)（主要包括表和索引）都緩存在這里。	提高該值可以減少數(shù)據(jù)庫的磁盤IO。
work_mem	聲明內(nèi)部排序和哈希操作可使用的工作內(nèi)存大小。該內(nèi)存是在開始使用臨時磁盤文件之前使用的內(nèi)存數(shù)目。數(shù)值以kB為單位的，缺省是 1024 (1MB)。請注意對于復(fù)雜的查詢，可能會同時并發(fā)運行好幾個排序或者哈希操作，每個都會使用這個參數(shù)聲明的這么多內(nèi)存，然后才會開始求助于臨時文件。同樣，好幾個正在運行的會話可能會同時進行排序操作。因此使用的總內(nèi)存可能是 work_mem 的好幾倍。ORDER BY, DISTINCT 和mergejoin都要用到排序操作，而哈希操作在哈希連接、哈希聚集和以哈希為基礎(chǔ)的 IN 子查詢處理中都會用到。該參數(shù)是會話級參數(shù)。	執(zhí)行排序操作時，會根據(jù)work_mem的大小決定是否將一個大的結(jié)果集拆分為幾個小的和 work_mem差不多大小的臨時文件寫入外存。顯然拆分的結(jié)果是導(dǎo)致了IO，降低了排序的速度。因此增加work_mem有助于提高排序的速度。通常設(shè)置時可以逐漸調(diào)大，知道數(shù)據(jù)庫在排序的操作時不會有大量的寫文件操作即可。該內(nèi)存每個連接一份，當(dāng)并發(fā)連接較多時候，該值不宜過大。
effective_cache_size	優(yōu)化器假設(shè)一個查詢可以使用的最大內(nèi)存（包括pg使用的和操作系統(tǒng)緩存），和shared_buffer等內(nèi)存無關(guān)，只是給優(yōu)化器生成計劃使用的一個假設(shè)值。	設(shè)置稍大，優(yōu)化器更傾向使用索引掃描而不是順序掃描，建議的設(shè)置為可用空閑內(nèi)存的25%，這里的可用空閑內(nèi)存指的是主機物理內(nèi)存在運行pg時得空閑值。
maintenance_work_mem	這里定義的內(nèi)存只是在CREATE INDEX, VACUUM等時用到，因此用到的頻率不高，但是往往這些指令消耗比較多的資源，因此應(yīng)該盡快讓這些指令快速執(zhí)行完畢。	在數(shù)據(jù)庫導(dǎo)入數(shù)據(jù)后，執(zhí)行建索引等操作時，可以調(diào)大，比如512M。
wal_buffers	日志緩沖區(qū)，日志緩沖區(qū)的大小。	兩種情況下要酌情調(diào)大：1.單事務(wù)的數(shù)據(jù)修改量很大，產(chǎn)生的日志大于wal_buffers，為了避免多次IO，調(diào)大該值。
	2.系統(tǒng)中并發(fā)小數(shù)據(jù)量修改的短事務(wù)較多，并且設(shè)置了commit_delay，此時wal_buffers需要容納多個事務(wù)（commit_siblings個）的日志，調(diào)大該值避免多次IO。
commit_delay	事務(wù)提交后，日志寫到wal_buffer上到wal_buffer寫到磁盤的時間間隔。	如果并發(fā)的非只讀事務(wù)數(shù)目較多，可以適當(dāng)增加該值，使日志緩沖區(qū)一次刷盤可以刷出較多的事務(wù)，減少IO次數(shù)，提高性能。需要和commit_sibling配合使用。
commit_siblings	觸發(fā)commit_delay等待的并發(fā)事務(wù)數(shù)，也就是系統(tǒng)的并發(fā)活躍事務(wù)數(shù)達到了該值事務(wù)才會等待commit_delay的時間才將日志刷盤，如果系統(tǒng)中并發(fā)活躍事務(wù)達不到該值，commit_delay將不起作用，防止在系統(tǒng)并發(fā)壓力較小的情況下事務(wù)提交后空等其他事務(wù)。	應(yīng)根據(jù)系統(tǒng)并發(fā)寫的負載配置。例如統(tǒng)計出系統(tǒng)并發(fā)執(zhí)行增刪改操作的平均連接數(shù)，設(shè)置該值為該平均連接數(shù)。
fsync	設(shè)置為on時，日志緩沖區(qū)刷盤時，需要確認已經(jīng)將其寫入了磁盤，設(shè)置為off時，由操作系統(tǒng)調(diào)度磁盤寫的操作，能更好利用緩存機制，提高IO性能。	該性能的提高是伴隨了數(shù)據(jù)丟失的風(fēng)險，當(dāng)操作系統(tǒng)或主機崩潰時，不保證刷出的日志是否真正寫入了磁盤。應(yīng)依據(jù)操作系統(tǒng)和主機的穩(wěn)定性來配置。
autovacuum	是否開啟自動清理進程（如開啟需要同時設(shè)置參數(shù)stats_start_collector = on，stats_row_level = on，），整理數(shù)據(jù)文件碎片，更新統(tǒng)計信息。	如果系統(tǒng)中有大量的增刪改操作，建議打開自動清理進程，這樣一方面可以增加數(shù)據(jù)文件的物理連續(xù)性，減少磁盤的隨機IO，一方面可以隨時更新數(shù)據(jù)庫的統(tǒng)計信息，使優(yōu)化器可以選擇最優(yōu)的查詢計劃得到最好的查詢性能。如果系統(tǒng)中只有只讀的事務(wù)，那么關(guān)閉自動清理進程。
autovacuum_naptime	自動清理進程執(zhí)行清理分析的時間間隔	應(yīng)該根據(jù)數(shù)據(jù)庫的單位時間更新量來決定該值，一般來說單位時間的更新量越大該時間間隔應(yīng)該設(shè)置越短。由于自動清理對系統(tǒng)的開銷較大，該值應(yīng)該謹慎配置（不要過?。?/td>
bgwriter_delay	后臺寫進程的自動執(zhí)行時間	后臺寫進程的作用是將shared_buffer里的臟頁面寫回到磁盤，減少checkpoint的壓力，如果系統(tǒng)數(shù)據(jù)修改的壓力一直很大，建議將該時間間隔設(shè)置小一些，以免積累的大量的臟頁面到checkpoint，使checkpoint時間過長（checkpoint期間系統(tǒng)響應(yīng)速度較慢）。
bgwriter_lru_maxpages	后臺寫進程一次寫出的臟頁面數(shù)	依據(jù)系統(tǒng)單位時間數(shù)據(jù)的增刪改量來修改
bgwriter_lru_multiplier	后臺寫進程根據(jù)最近服務(wù)進程需要的buffer數(shù)量乘上這個比率估算出下次服務(wù)進程需要的buffer數(shù)量，在使用后臺寫進程寫回臟頁面，使緩沖區(qū)能使用的干凈頁面達到這個估計值。	依據(jù)系統(tǒng)單位時間數(shù)據(jù)的增刪改量來修改。

PostgreSQL數(shù)據(jù)庫性能調(diào)優(yōu)的注意點及pg數(shù)據(jù)庫性能優(yōu)化方法是什么

到此，相信大家對“PostgreSQL數(shù)據(jù)庫性能調(diào)優(yōu)的注意點及pg數(shù)據(jù)庫性能優(yōu)化方法是什么”有了更深的了解，不妨來實際操作一番吧！這里是億速云網(wǎng)站，更多相關(guān)內(nèi)容可以進入相關(guān)頻道進行查詢，關(guān)注我們，繼續(xù)學(xué)習(xí)！

向AI問一下細節(jié)

PostgreSQL數(shù)據(jù)庫性能調(diào)優(yōu)的注意點及pg數(shù)據(jù)庫性能優(yōu)化方法是什么

PostgreSQL 優(yōu)化思路

一、排序

二、索引

三、連接查詢方式

四、多表聯(lián)查時

PostgreSQL提供了一些性能調(diào)優(yōu)的功能

1.使用EXPLAIN

2.及時更新執(zhí)行計劃中使用的統(tǒng)計信息

3.明確用join來關(guān)聯(lián)表

4.關(guān)閉自動提交

5.多次插入數(shù)據(jù)用copy命令更高效

6.臨時刪除index

7.外鍵關(guān)聯(lián)的刪除

8.增加maintenance_work_mem參數(shù)大小

9.增加checkpoint_segments參數(shù)的大小

10.設(shè)置archive_mode無效

11.最后執(zhí)行VACUUM ANALYZE

PostgreSQL 參數(shù)設(shè)置

autovacuum 相關(guān)參數(shù)

pg中性能相關(guān)常調(diào)參數(shù)

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標簽

一、排序

二、索引

三、連接查詢方式

四、多表聯(lián)查時