??create table dpartition(id int ,name string )???partitioned by(ct string??);? ?2.往表里裝載數(shù)據,并且動態(tài)建立分區(qū),以c..."/>
您好,登錄后才能下訂單哦!
?1.創(chuàng)建一個單一字段分區(qū)表
hive>??create table dpartition(id int ,name string )
???partitioned by(ct string??);
? ?2.往表里裝載數(shù)據,并且動態(tài)建立分區(qū),以city建立動態(tài)分區(qū)
hive> set hive.exec.dynamic.partition=true;??#開啟動態(tài)分區(qū),默認是false
set hive.exec.dynamic.partition.mode=nonstrict; #開啟允許所有分區(qū)都是動態(tài)的,否則必須要有靜態(tài)分區(qū)才能使用。
insert overwrite table dpartition
partition(ct)
select id ,name,city from??mytest_tmp2_p;
要點:因為dpartition表中只有兩個字段,所以當我們查詢了三個字段時(多了city字段),所以系統(tǒng)默認以最后一個字段city為分區(qū)名,因為分區(qū)表的分區(qū)字段默認也是該表中的字段,且依次排在表中字段的最后面。所以分區(qū)需要分區(qū)的字段只能放在后面,不能把順序弄錯。如果我們查詢了四個字段的話,則會報錯,因為該表加上分區(qū)字段也才三個。要注意系統(tǒng)是根據查詢字段的位置推斷分區(qū)名的,而不是字段名稱。
--查看可知,hive已經完成了以city字段為分區(qū)字段,實現(xiàn)了動態(tài)分區(qū)。
hive > show partitions dpartition;
partition
ct=beijing
ct=beijing1
注意:使用,insert...select 往表中導入數(shù)據時,查詢的字段個數(shù)必須和目標的字段個數(shù)相同,不能多,也不能少,否則會報錯。但是如果字段的類型不一致的話,則會使用null值填充,不會報錯。而使用load data形式往hive表中裝載數(shù)據時,則不會檢查。如果字段多了則會丟棄,少了則會null值填充。同樣如果字段類型不一致,也是使用null值填充。
3.多個分區(qū)字段時,實現(xiàn)半自動分區(qū)(部分字段靜態(tài)分區(qū),注意靜態(tài)分區(qū)字段要在動態(tài)前面)
1.創(chuàng)建一個只有一個字段,兩個分區(qū)字段的分區(qū)表
hive (fdm_sor)> create table ds_parttion(id int )
??????????????> partitioned by (state string ,ct string );
2.往該分區(qū)表半動態(tài)分區(qū)插入數(shù)據
hive>
set hive.exec.dynamici.partition=true;
set hive.exec.dynamic.partition.mode=nonstrict;
insert overwrite table ds_parttion
partition(state='china',ct)??#state分區(qū)為靜態(tài),ct為動態(tài)分區(qū),以查詢的city字段為分區(qū)名
select id ,city from??mytest_tmp2_p;
3.查詢結果顯示:
hive (fdm_sor)> select *??from ds_parttion where state='china'
??????????????> ;
ds_parttion.id??ds_parttion.state???????ds_parttion.ct
4???????china???beijing
3???????china???beijing
2???????china???beijing
1???????china???beijing
4???????china???beijing1
3???????china???beijing1
2???????china???beijing1
1???????china???beijing1
hive (fdm_sor)> select *??from ds_parttion where state='china' and ct='beijing';
ds_parttion.id??ds_parttion.state???????ds_parttion.ct
4???????china???beijing
3???????china???beijing
2???????china???beijing
1???????china???beijing
hive (fdm_sor)> select *??from ds_parttion where state='china' and ct='beijing1';
ds_parttion.id??ds_parttion.state???????ds_parttion.ct
4???????china???beijing1
3???????china???beijing1
2???????china???beijing1
1???????china???beijing1
Time taken: 0.072 seconds, Fetched: 4 row(s)
4.多個分區(qū)字段時,全部實現(xiàn)動態(tài)分區(qū)插入數(shù)據
set hive.exec.dynamici.partition=true;
set hive.exec.dynamic.partition.mode=nonstrict;
insert overwrite table ds_parttion
partition(state,ct)
select id ,country,city from??mytest_tmp2_p;
注意:字段的個數(shù)和順序不能弄錯。
5.動態(tài)分區(qū)表的屬性
??使用動態(tài)分區(qū)表必須配置的參數(shù) :
????set hive.exec.dynamic.partition =true(默認false),表示開啟動態(tài)分區(qū)功能
????set hive.exec.dynamic.partition.mode = nonstrict(默認strict),表示允許所有分區(qū)都是動態(tài)的,否則必須有靜態(tài)分區(qū)字段
動態(tài)分區(qū)相關的調優(yōu)參數(shù):
????set??hive.exec.max.dynamic.partitions.pernode=100 (默認100,一般可以設置大一點,比如1000)
???????表示每個maper或reducer可以允許創(chuàng)建的最大動態(tài)分區(qū)個數(shù),默認是100,超出則會報錯。
???set hive.exec.max.dynamic.partitions =1000(默認值)
???????表示一個動態(tài)分區(qū)語句可以創(chuàng)建的最大動態(tài)分區(qū)個數(shù),超出報錯
???set hive.exec.max.created.files =10000(默認) 全局可以創(chuàng)建的最大文件個數(shù),超出報錯。
免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。