溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

怎么理解PostgreSQL12 COPY和bulkloading有什么特性

發(fā)布時間:2021-11-09 11:21:38 來源:億速云 閱讀:115 作者:iii 欄目:關(guān)系型數(shù)據(jù)庫

本篇內(nèi)容主要講解“怎么理解PostgreSQL12 COPY和bulkloading有什么特性”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實(shí)用性強(qiáng)。下面就讓小編來帶大家學(xué)習(xí)“怎么理解PostgreSQL12 COPY和bulkloading有什么特性”吧!

業(yè)務(wù)是否依賴COPY命令加載數(shù)據(jù)?PostgreSQL12提供了一個新特性,大大加快了加載速度。

COPY:Loading and unloading data as fast as possible

細(xì)看PostgreSQL12的COPY語法,發(fā)現(xiàn)有兩處變動:

1)\h 會有手冊文檔鏈接

2)COPY支持WHERE條件

下面是完整語法:

db12=# \h COPY
Command:     COPY
Description: copy data between a file and a table
Syntax:
COPY table_name [ ( column_name [, ...] ) ]
    FROM { 'filename' | PROGRAM 'command' | STDIN }
    [ [ WITH ] ( option [, ...] ) ]
    [ WHERE condition ]
COPY { table_name [ ( column_name [, ...] ) ] | ( query ) }
    TO { 'filename' | PROGRAM 'command' | STDOUT }
    [ [ WITH ] ( option [, ...] ) ]
where option can be one of:
    FORMAT format_name
    FREEZE [ boolean ]
    DELIMITER 'delimiter_character'
    NULL 'null_string'
    HEADER [ boolean ]
    QUOTE 'quote_character'
    ESCAPE 'escape_character'
    FORCE_QUOTE { ( column_name [, ...] ) | * }
    FORCE_NOT_NULL ( column_name [, ...] )
    FORCE_NULL ( column_name [, ...] )
    ENCODING 'encoding_name'
URL: https://www.postgresql.org/docs/12/sql-copy.html

雖然添加文檔鏈接功能帶來便利,但是WHERE過濾功能更加有用。這個功能的目的是什么?當(dāng)前,COPY只能導(dǎo)入整個文件。但是某些場景下會有問題:很多場景下,人們只想加載數(shù)據(jù)的一個子集,并且在導(dǎo)出前必須編寫大量代碼進(jìn)行過濾。

COPY...WHERE: 導(dǎo)入時過濾

PostgreSQL通過該條件可以輕松地進(jìn)行過濾。下面講述一個簡單的例子:

db12=# CREATE TABLE t_demo AS
        SELECT * FROM generate_series(1, 1000) AS id;
SELECT 1000

首先先插入1000行數(shù)據(jù),然后導(dǎo)出到一個文件:

db12=# COPY t_demo TO '/tmp/file.txt';
COPY 1000

最后,再重新導(dǎo)入數(shù)據(jù):

db12=# CREATE TABLE t_import (x int);
CREATE TABLE
db12=# COPY t_import FROM '/tmp/file.txt' WHERE x < 5;
COPY 4
db12=# SELECT * FROM t_import;
 x
---
 1
 2
 3
 4
(4 rows)

如上說是,過濾數(shù)據(jù)非常簡單直接。需要注意,導(dǎo)出列是“id”,導(dǎo)入列是“x”。文件文件不知道導(dǎo)入表的表結(jié)構(gòu)---需要確保過濾導(dǎo)入表的列名。

其他特性

COPY可以將數(shù)據(jù)發(fā)送到UNIX pipe,還可以從pipe中讀取數(shù)據(jù)。如下所示:

db12=# COPY t_demo TO PROGRAM 'gzip -c > /tmp/file.txt.gz';
COPY 1000
db12=# COPY t_import FROM PROGRAM 'gunzip -c /tmp/file.txt.gz'
    WHERE x BETWEEN 100 AND 103;
COPY 4
db12=# SELECT * FROM t_import WHERE x >= 100;
  x  
-----
 100
 101
 102
 103
(4 rows)

某些場景下,不止想將數(shù)據(jù)導(dǎo)出。上面場景,我們想導(dǎo)出數(shù)據(jù)時將數(shù)據(jù)壓縮;導(dǎo)入時將數(shù)據(jù)解壓并過濾。如上所示,這種方法非常簡單。

到此,相信大家對“怎么理解PostgreSQL12 COPY和bulkloading有什么特性”有了更深的了解,不妨來實(shí)際操作一番吧!這里是億速云網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI