溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

IDEA創(chuàng)建spark maven項目并連接遠程spark集群

發(fā)布時間:2021-08-30 20:45:39 來源:億速云 閱讀:517 作者:chen 欄目:開發(fā)技術(shù)

這篇文章主要講解了“IDEA創(chuàng)建spark maven項目并連接遠程spark集群”,文中的講解內(nèi)容簡單清晰,易于學(xué)習(xí)與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學(xué)習(xí)“IDEA創(chuàng)建spark maven項目并連接遠程spark集群”吧!

環(huán)境:

scala:2.12.10

spark:3.0.3

1、創(chuàng)建scala maven項目,如下圖所示:

IDEA創(chuàng)建spark maven項目并連接遠程spark集群2、

不同版本scala編譯參數(shù)可能略有不同,筆者使用的scala版本是2.12.10,scala-archetype-simple插件生成的pom文件

<plugin>
  <groupId>org.scala-tools</groupId>
  <artifactId>maven-scala-plugin</artifactId>
  <version>2.15.0</version>
  <executions>
    <execution>
      <goals>
        <goal>compile</goal>
        <goal>testCompile</goal>
      </goals>
      <configuration>
        <args>
          <arg>-make:transitive</arg>
          <arg>-dependencyfile</arg>
          <arg>${project.build.directory}/.scala_dependencies</arg>
        </args>
      </configuration>
    </execution>
  </executions>
</plugin>

要去除-make:transitive這個參數(shù),否則會報錯。

3、創(chuàng)建SparkPi Object類

object SparkPi {
 
  def main(args: Array[String]): Unit = {
    val spark = SparkSession
      .builder
      .appName("Spark Pi")
      .master("spark://172.21.212.114:7077")
      .config("spark.jars","E:\\work\\polaris\\polaris-spark\\spark-scala\\target\\spark-scala-1.0.0.jar")
      .config("spark.executor.memory","2g")
      .config("spark.cores.max","2")
      .config("spark.driver.host", "172.21.58.28")
      .config("spark.driver.port", "9089")
      .getOrCreate()
    //spark = new SparkContext(conf).
    val slices = if (args.length > 0) args(0).toInt else 2
    val n = math.min(100000L * slices, Int.MaxValue).toInt // avoid overflow
    val count = spark.sparkContext.parallelize(1 until n, slices).map { i =>
      val x = random * 2 - 1
      val y = random * 2 - 1
      if (x*x + y*y <= 1) 1 else 0
    }.reduce(_ + _)
    println(s"Pi is roughly ${4.0 * count / (n - 1)}")
    spark.stop()
  }
}

4、執(zhí)行打包命令:

IDEA創(chuàng)建spark maven項目并連接遠程spark集群

5、點擊Idea Run執(zhí)行即可:

IDEA創(chuàng)建spark maven項目并連接遠程spark集群

6、結(jié)果如下所示:

IDEA創(chuàng)建spark maven項目并連接遠程spark集群

PS:

 1、創(chuàng)建SparkSession時需要指定Idea所在機器ip地址,因為默認會把Spark Driver所在機器域名發(fā)送過去,導(dǎo)致無法解析(在spark 服務(wù)器上配置IDEA所在機器域名也可以,但是這樣太不靈活)

2、spark-3.0.3默認使用的scala版本是2.12.10,所以要注意IDEA使用scala版本,否則會出現(xiàn)SerailizableId不一致的兼容問題

感謝各位的閱讀,以上就是“IDEA創(chuàng)建spark maven項目并連接遠程spark集群”的內(nèi)容了,經(jīng)過本文的學(xué)習(xí)后,相信大家對IDEA創(chuàng)建spark maven項目并連接遠程spark集群這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關(guān)知識點的文章,歡迎關(guān)注!

向AI問一下細節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI