溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Spark 整合hive 實(shí)現(xiàn)數(shù)據(jù)的讀取輸出

發(fā)布時(shí)間:2020-08-06 15:32:27 來(lái)源:網(wǎng)絡(luò) 閱讀:14425 作者:ChinaUnicom110 欄目:大數(shù)據(jù)

實(shí)驗(yàn)環(huán)境: linux centOS 6.7 vmware虛擬機(jī)

spark-1.5.1-bin-hadoop-2.1.0

apache-hive-1.2.1

eclipse 或IntelJIDea 本次使用eclipse.

代碼:

import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.sql.DataFrame;
import org.apache.spark.sql.hive.HiveContext;
public class SparkOnHiveDemo {
public static void main(String[] args) {
		
		// 首先還是創(chuàng)建SparkConf
		SparkConf conf = new SparkConf().setAppName("HiveDataSource");
		// 創(chuàng)建JavaSparkContext
		JavaSparkContext sc = new JavaSparkContext(conf);
		// 創(chuàng)建HiveContext,注意,這里,它接收的是SparkContext作為參數(shù),不是JavaSparkContext
		HiveContext hiveContext = new HiveContext(sc.sc());
		
		//1.可以使用HiveContext 下面的sql(xxx語(yǔ)句)執(zhí)行HiveSQL語(yǔ)句
		//1 .刪除表,創(chuàng)建表
		// stars_infos ,stars_scores
		hiveContext.sql("DROP TABLE IF EXISTS stars_infos");
		hiveContext.sql("CREATE TABLE IF NOT EXISTS stars_infos(name STRING,age INT) "
				+ "row format delimited fields terminated by ','");
		
		//2.向表里面導(dǎo)入數(shù)據(jù)
		hiveContext.sql("LOAD DATA "
				+ "LOCAL INPATH "
				+ "'/root/book/stars_infos.txt' "
				+ "INTO TABLE stars_infos");
		
		hiveContext.sql("DROP TABLE IF EXISTS stars_scores");
		hiveContext.sql("CREATE TABLE IF NOT EXISTS stars_scores(name STRING,score INT) "
				+ "row format delimited fields terminated by ','");

		hiveContext.sql("LOAD DATA "
				+ "LOCAL INPATH "
				+ "'/root/book/stars_score.txt' "
				+ "INTO TABLE stars_scores");
		
		
		//3.從一張已經(jīng)存在的hive表里面拿數(shù)據(jù),轉(zhuǎn)換為DF
		DataFrame superStarDataFrame = hiveContext.sql("SELECT si.name,si.age,ss.score "
				+ "FROM stars_infos si "
				+ "JOIN stars_scores ss ON si.name=ss.name "
				+ "WHERE ss.score>=90");
			
		//4.把DF的數(shù)據(jù)再持久化到hive中去,千萬(wàn)別和registerTemtable搞混了
		hiveContext.sql("DROP TABLE IF EXISTS superStar");
		superStarDataFrame.saveAsTable("superStar");
		
		//5.直接從Hive中得到DF
		hiveContext.table("superStar").show();
		
		sc.close();
	}
}

 元數(shù)據(jù):

可以下載附件,然后上傳到指定的目錄下。

 把程序打包jar后上傳到linux指定的目錄下,寫(xiě)一個(gè)腳本。腳本附件見(jiàn)正文。具體內(nèi)容修改即可。


 運(yùn)行腳本就可以了。當(dāng)然要保證MySQL數(shù)據(jù)庫(kù)正常,hive正常。

附件:http://down.51cto.com/data/2366931
向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI