您好,登錄后才能下訂單哦!
這篇文章將為大家詳細(xì)講解有關(guān)hive函數(shù)regexp_extract怎么樣,小編覺得挺實(shí)用的,因此分享給大家做個(gè)參考,希望大家閱讀完這篇文章后可以有所收獲。
函數(shù)描述:
regexp_extract(str, regexp[, idx]) - extracts a group that matches regexp
字符串正則表達(dá)式解析函數(shù)。
-- 這個(gè)函數(shù)有點(diǎn)類似于 substring(str from 'regexp') ..
參數(shù)解釋:
其中:
str是被解析的字符串
regexp 是正則表達(dá)式
idx是返回結(jié)果 取表達(dá)式的哪一部分 默認(rèn)值為1。
0表示把整個(gè)正則表達(dá)式對(duì)應(yīng)的結(jié)果全部返回
1表示返回正則表達(dá)式中第一個(gè)() 對(duì)應(yīng)的結(jié)果 以此類推
注意點(diǎn):
要注意的是idx的數(shù)字不能大于表達(dá)式中()的個(gè)數(shù)。
否則報(bào)錯(cuò):
實(shí)例:
如:
select regexp_extract('x=a3&x=18abc&x=2&y=3&x=4','x=([0-9]+)([a-z]+)',0) from default.dual;
得到的結(jié)果為:
x=18abc
select regexp_extract('x=a3&x=18abc&x=2&y=3&x=4','x=([0-9]+)([a-z]+)',1) from default.dual;
得到的結(jié)果為:
18
select regexp_extract('x=a3&x=18abc&x=2&y=3&x=4','x=([0-9]+)([a-z]+)',2) from default.dual;
得到的結(jié)果為:
abc
我們當(dāng)前的語句只有2個(gè)()表達(dá)式 所以當(dāng)idx>=3的時(shí)候 就會(huì)報(bào)錯(cuò)
FAILED: SemanticException [Error 10014]: Line 1:7 Wrong arguments '2': org.apache.hadoop.hive.ql.metadata.HiveException: Unable to execute method public java.lang.String org.apache.hadoop.hive.ql.udf.UDFRegExpExtract.evaluate(java.lang.String,java.lang.String,java.lang.Integer) on object org.apache.hadoop.hive.ql.udf.UDFRegExpExtract@2cf5e0f0 of class org.apache.hadoop.hive.ql.udf.UDFRegExpExtract with arguments {x=a3&x=18abc&x=2&y=3&x=4:java.lang.String, x=([0-9]+)[a-z]:java.lang.String, 2:java.lang.Integer} of size 3
關(guān)于“hive函數(shù)regexp_extract怎么樣”這篇文章就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,使各位可以學(xué)到更多知識(shí),如果覺得文章不錯(cuò),請把它分享出去讓更多的人看到。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。