spark 1.X standalone和on yarn安裝配置

發(fā)布時(shí)間：2020-07-23 16:35:19 來(lái)源：網(wǎng)絡(luò) 閱讀：834 作者：jethai 欄目：大數(shù)據(jù)

安裝JDK 1.7以上 Hadoop 2.7.0不支持JDK1.6，Spark 1.5.0開(kāi)始不支持JDK 1.6

安裝Scala 2.10.4

安裝 Hadoop 2.x 至少HDFS

spark-env.sh

export JAVA_HOME=

export SCALA_HOME=

export HADOOP_CONF_DIR=/opt/modules/hadoop-2.2.0/etc/hadoop //運(yùn)行在yarn上必須要指定

export SPARK_MASTER_IP=server1

export SPARK_MASTER_PORT=8888

export SPARK_MASTER_WEBUI_PORT=8080

export SPARK_WORKER_CORES=

export SPARK_WORKER_INSTANCES=1

export SPARK_WORKER_MEMORY=26g

export SPARK_WORKER_PORT=7078

export SPARK_WORKER_WEBUI_PORT=8081

export SPARK_JAVA_OPTS="-verbose:gc -XX:-PrintGCDetails -XX:PrintGCTimeStamps"

slaves指定worker節(jié)點(diǎn)

xx.xx.xx.2
xx.xx.xx.3
xx.xx.xx.4
xx.xx.xx.5

運(yùn)行spark-submit時(shí)默認(rèn)的屬性從spark-defaults.conf文件讀取

spark-defaults.conf

spark.master=spark://hadoop-spark.dargon.org:7077

啟動(dòng)集群

start-master.sh
start-salves.sh

spark-shell命令其實(shí)也是執(zhí)行spark-submit命令

spark-submit --help

spark 1.X standalone和on yarn安裝配置

deploy-mode針對(duì)driver program(SparkContext)的client(本地)、cluster(集群)

默認(rèn)是client的，SparkContext運(yùn)行在本地，如果改成cluster則SparkContext運(yùn)行在集群上

hadoop on yarn的部署模式就是cluster，SparkContext運(yùn)行在Application Master

spark-shell quick-start鏈接

http://spark.apache.org/docs/latest/quick-start.html

向AI問(wèn)一下細(xì)節(jié)

spark 1.X standalone和on yarn安裝配置

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽