您好,登錄后才能下訂單哦!
這篇文章主要介紹hive udf如何自定義,文中介紹的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴們一定要看完!
用hive也有一段時間里,不過一直沒寫過相關(guān)到日志,因為主要用hive也無非是create table,upload data,CRUD 這幾個過程。后來工作中需要用到一些常用到方法,了解到hive中支持UDF(User Define Function),看里一些文章發(fā)現(xiàn)UDF到編寫也很簡單,繼承UDF然后重寫evaluate方法即可,下面以一個ip2long到方法作為參考。
1.編寫UDF類
import org.apache.hadoop.hive.ql.exec.UDF;
public class NewIP2Long extends UDF {
public static long ip2long(String ip) {
String[] ips = ip.split("[.]");
long ipNum = 0;
if (ips == null) {
return 0;
}
for (int i = 0; i < ips.length; i++) {
ipNum = ipNum << Byte.SIZE | Long.parseLong(ips[i]);
}
return ipNum;
}
public long evaluate(String ip) {
if (ip.matches("\\d{1,3}\\.\\d{1,3}\\.\\d{1,3}\\.\\d{1,3}")) {
try {
long ipNum = ip2long(ip);
return ipNum;
} catch (Exception e) {
return 0;
}
} else {
return 0;
}
}
public static void main(String[] argvs) {
NewIP2Long ipl = new NewIP2Long();
System.out.println(ip2long("112.64.106.238"));
System.out.println(ipl.evaluate("58.35.186.62"));
}
}
2.編譯,然后打包成ip2long.jar。
3.在需要使用ip2long這個方法到時候:
add jar /tmp/NEWIP2Long.jar;
drop temporary function ip2long;
create temporary function ip2long as 'NewIP2Long';//如果類有包名,要加上包名
select ip2long(ip) from XXX ;
這種方法每次使用都要add,create一下,還是很麻煩,如果能把UDF編譯到hive源碼中那一定是件很high的事。
進(jìn)階:將自定義UDF編譯到hive中
重編譯hive:
1)將寫好的Jave文件拷貝到~/install/hive-0.8.1/src/ql/src/java/org/apache/hadoop/hive/ql/udf/
cd ~/install/hive-0.8.1/src/ql/src/java/org/apache/hadoop/hive/ql/udf/
ls -lhgt |head
2)修改~/install/hive-0.8.1/src/ql/src/java/org/apache/hadoop/hive/ql/exec/FunctionRegistry.java,增加import和RegisterUDF
import com.meilishuo.hive.udf.UDFIp2Long; //添加import
registerUDF("ip2long", UDFIp2Long.class, false); //添加register
3)在~/install/hive-0.8.1/src下運(yùn)行ant -Dhadoop.version=1.0.1 package
?
1
2
cd ~/install/hive-0.8.1/src
ant -Dhadoop.version=1.0.1 package
4)替換exec的jar包,新生成的包在/hive-0.8.1/src/build/ql目錄下,替換鏈接
cp hive-exec-0.8.1.jar /hadoop/hive/lib/hive-exec-0.8.1.jar.0628
rm hive-exec-0.8.1.jar
ln -s hive-exec-0.8.1.jar.0628 hive-exec-0.8.1.jar
5)重啟hive服務(wù)
6)測試
以上是“hive udf如何自定義”這篇文章的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對大家有幫助,更多相關(guān)知識,歡迎關(guān)注億速云行業(yè)資訊頻道!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。