溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

sqoop clob從Oracle導入到hive   回車換行導致記錄增多

發(fā)布時間:2020-06-27 02:45:01 來源:網(wǎng)絡(luò) 閱讀:3380 作者:jackwxh 欄目:關(guān)系型數(shù)據(jù)庫

sqoop import --hive-import --hive-overwrite  --connect jdbc:oracle:thin:@192.168.92.136:1521:cyporcl --username ODS --password 'od154DS$!('  -m 1  --hive-database ODS --table Q_TRA_DISPUTESTATUS --fields-terminated-by '\001' --hive-drop-import-delims  --null-string '\\N' --null-non-string '\\N'  --map-column-java DISPUTERESULT=String

DISPUTERESULT 這個字段是Oracleclob 類型的,里面有回車, 加載到hive 里面導致 記錄增多。


--map-column-java和--map-column-hive兩個參數(shù)都要顯示給出;還需要設(shè)置--hive-drop-import-delims這樣才能順利導出數(shù)據(jù)。

.導入的列有換行符如何解決
本以為萬事大吉,萬萬沒想到導入的列有nclob類型,里面存儲了一篇篇文章,勢必有著換行符。果不其然,hive查詢數(shù)據(jù)全部錯亂, 查詢資料發(fā)現(xiàn)--hive-delims-replacement(替換/n,/r等符號用你指定的字符)和--hive-drop-import-delims參數(shù)。可添加上去發(fā)現(xiàn)并沒有什么卵用,沒有起作用。百度goole很久,終于發(fā)現(xiàn)一篇帖子,http://stackoverflow.com/questions/28076200/hive-drop-import-delims-not-removing-newline-while-using-hcatalog-in-sqoop
意思是要用--map-column-java參數(shù)來顯示指定列為String類型。我的解決方案為 --map-column-java 我的CLOB列=String 果然,問題解決,換行符全部被去掉。不過聽說改變存儲格式 或許也可以避免這個問題,希望有著經(jīng)驗的大神來回答一下??偨Y(jié)下來就這么多,希望能幫助大家




向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI