溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶(hù)服務(wù)條款》

PyCharm+PySpark如何配置遠(yuǎn)程調(diào)試的環(huán)境

發(fā)布時(shí)間:2021-08-13 09:32:13 來(lái)源:億速云 閱讀:244 作者:小新 欄目:開(kāi)發(fā)技術(shù)

這篇文章將為大家詳細(xì)講解有關(guān)PyCharm+PySpark如何配置遠(yuǎn)程調(diào)試的環(huán)境,小編覺(jué)得挺實(shí)用的,因此分享給大家做個(gè)參考,希望大家閱讀完這篇文章后可以有所收獲。

Version :Spark 1.5.0、Python 2.7.14

1. 遠(yuǎn)程Spark集群環(huán)境

首先Spark集群要配置好且能正常啟動(dòng),版本號(hào)可以在Spark對(duì)應(yīng)版本的官方網(wǎng)站查到,注意:Spark 1.5.0作為一個(gè)比較古老的版本,不支持Python 3.6+;另外Spark集群的每個(gè)節(jié)點(diǎn)的Python版本必須保持一致。這里只講如何加入pyspark遠(yuǎn)程調(diào)試所需要修改的部分。在$SPARK_HOME/conf/spark-env.sh中添加一行:

export PYSPARK_PYTHON=/home/hadoop/anaconda2/bin/python2

這里的Python路徑是集群上Python版本的路徑,我這里是用的anaconda安裝的Python2,所以路路徑如上。正常啟動(dòng)Spark集群后,在命令行輸入pyspark后回車(chē),能正確進(jìn)入到pyspark shell。

2. 本地PyCharm配置

首先將Spark集群的spark-1.5.0部署包拷貝到本地機(jī)器,并在/etc/hosts(Linux類(lèi)機(jī)器)或C:\Windows\System32….\hosts(Windows機(jī)器)中加入Spark集群Master節(jié)點(diǎn)的IP與主機(jī)名的映射;本地正確安裝Spark集群同版本Python;

安裝py4j

PyCharm+PySpark如何配置遠(yuǎn)程調(diào)試的環(huán)境

添加spark-1.5.0/python目錄

PyCharm+PySpark如何配置遠(yuǎn)程調(diào)試的環(huán)境

新建一個(gè)Python文件Simple,編輯Edit Configurations添加SPARK_HOME變量

PyCharm+PySpark如何配置遠(yuǎn)程調(diào)試的環(huán)境

寫(xiě)一個(gè)類(lèi)似下面的簡(jiǎn)單測(cè)試程序

# -*- encoding: UTF-8 -*-
# @auther:Mars
# @datetime:2018-03-01
from pyspark import SparkContext

sc = SparkContext("spark://master:7077","Simple APP")
logData = sc.textFile("hdfs://master:9000/README.md").cache()

numAs = logData.filter(lambda s: 'a' in s).count()
numBs = logData.filter(lambda s: 'b' in s).count()

print("Lines with a: %i, lines with b: %i"%(numAs, numBs))

sc.stop()

運(yùn)行可以得到看到下圖,就OK了~

PyCharm+PySpark如何配置遠(yuǎn)程調(diào)試的環(huán)境

切記,1)本地與Spark集群的版本要一致;2)程序中不要用IP地址

關(guān)于“PyCharm+PySpark如何配置遠(yuǎn)程調(diào)試的環(huán)境”這篇文章就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,使各位可以學(xué)到更多知識(shí),如果覺(jué)得文章不錯(cuò),請(qǐng)把它分享出去讓更多的人看到。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI