溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

生產(chǎn)中Hive靜態(tài)和動態(tài)分區(qū)表,該怎樣抉擇呢?

發(fā)布時間:2020-06-30 21:51:29 來源:網(wǎng)絡(luò) 閱讀:458 作者:Stitch_x 欄目:大數(shù)據(jù)

一.需求

按照不同部門作為分區(qū),導(dǎo)數(shù)據(jù)到目標(biāo)表

二.使用靜態(tài)分區(qū)表來完成

1.創(chuàng)建靜態(tài)分區(qū)表:

create table emp_static_partition(
empno int, 
ename string, 
job string, 
mgr int, 
hiredate string, 
sal double, 
comm double)
PARTITIONED BY(deptno int)
row format delimited fields terminated by '\t';

2.插入數(shù)據(jù):

hive>insert into table emp_static_partition partition(deptno=10)
     select empno , ename , job , mgr , hiredate , sal , comm from emp where deptno=10;

3.查詢數(shù)據(jù):

hive>select * from emp_static_partition;

生產(chǎn)中Hive靜態(tài)和動態(tài)分區(qū)表,該怎樣抉擇呢?

三.使用動態(tài)分區(qū)表來完成

1.創(chuàng)建動態(tài)分區(qū)表:

create table emp_dynamic_partition(
empno int, 
ename string, 
job string, 
mgr int, 
hiredate string, 
sal double, 
comm double)
PARTITIONED BY(deptno int)row format delimited fields terminated by '\t';

【注意】動態(tài)分區(qū)表與靜態(tài)分區(qū)表的創(chuàng)建,在語法上是沒有任何區(qū)別的

2.插入數(shù)據(jù):

hive>insert into table emp_dynamic_partition partition(deptno)     
select empno , ename , job , mgr , hiredate , sal , comm, deptno from emp;

【注意】分區(qū)的字段名稱,寫在最后,有幾個就寫幾個 與靜態(tài)分區(qū)相比,不需要where

需要設(shè)置屬性的值:

hive>set hive.exec.dynamic.partition.mode=nonstrict;

假如不設(shè)置,報錯如下:
生產(chǎn)中Hive靜態(tài)和動態(tài)分區(qū)表,該怎樣抉擇呢?
3.查詢數(shù)據(jù):

hive>select * from emp_dynamic_partition;
生產(chǎn)中Hive靜態(tài)和動態(tài)分區(qū)表,該怎樣抉擇呢?
分區(qū)列為deptno,實現(xiàn)了動態(tài)分區(qū)

四.總結(jié)

在生產(chǎn)上我們更傾向是選擇動態(tài)分區(qū),
無需手工指定數(shù)據(jù)導(dǎo)入的具體分區(qū),
而是由select的字段(字段寫在最后,有幾個寫幾個)自行決定導(dǎo)出到哪一個分區(qū)中, 并自動創(chuàng)建相應(yīng)的分區(qū),使用上更加方便快捷 ,在生產(chǎn)工作中用的非常多多。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI