ฉันสร้าง Spark 1.4 จากต้นแบบการพัฒนา GH และงานสร้างก็ผ่านไปได้ด้วยดี แต่เมื่อฉันทำbin/pyspark
ฉันได้รับ Python 2.7.9 เวอร์ชัน ฉันจะเปลี่ยนสิ่งนี้ได้อย่างไร?
ฉันสร้าง Spark 1.4 จากต้นแบบการพัฒนา GH และงานสร้างก็ผ่านไปได้ด้วยดี แต่เมื่อฉันทำbin/pyspark
ฉันได้รับ Python 2.7.9 เวอร์ชัน ฉันจะเปลี่ยนสิ่งนี้ได้อย่างไร?
คำตอบ:
เพียงตั้งค่าตัวแปรสภาพแวดล้อม:
export PYSPARK_PYTHON=python3
ในกรณีที่คุณต้องการให้เป็นการเปลี่ยนแปลงถาวรให้เพิ่มบรรทัดนี้ในสคริปต์ pyspark
export PYSPARK_PYTHON=python3.5
สำหรับ Python 3.5
$SPARK_HOME/conf/spark-env.sh
ดังนั้นให้spark-submit
ใช้ล่ามคนเดียวกันด้วย
PYSPARK_PYTHON=python3
./bin/pyspark
หากคุณต้องการรันใน IPython Notebook ให้เขียน:
PYSPARK_PYTHON=python3
PYSPARK_DRIVER_PYTHON=ipython
PYSPARK_DRIVER_PYTHON_OPTS="notebook"
./bin/pyspark
หากpython3
ไม่สามารถเข้าถึงได้คุณต้องผ่านเส้นทางไปแทน
โปรดทราบว่าเอกสารประกอบปัจจุบัน (ณ 1.4.1)มีคำแนะนำที่ล้าสมัย โชคดีที่จะได้รับการปะ
1 แก้ไขโปรไฟล์:vim ~/.profile
2 เพิ่มรหัสลงในไฟล์: export PYSPARK_PYTHON=python3
3 ดำเนินการคำสั่ง: source ~/.profile
4, ./bin/pyspark
ดูไฟล์ เส้น shebang อาจชี้ไปที่ไบนารี 'env' ซึ่งค้นหาเส้นทางสำหรับปฏิบัติการที่เข้ากันได้ตัวแรก
คุณสามารถเปลี่ยน python เป็น python3 เปลี่ยน env เพื่อใช้ฮาร์ดโค้ดไบนารี python3 โดยตรง หรือดำเนินการไบนารีโดยตรงกับ python3 และละเว้นบรรทัด shebang
PYSPARK_PYTHON
ตัวแปรสภาพแวดล้อม
สำหรับ Jupyter Notebook ให้แก้ไขspark-env.sh
ไฟล์ตามที่แสดงด้านล่างจากบรรทัดคำสั่ง
$ vi $SPARK_HOME/conf/spark-env.sh
ไปที่ด้านล่างของไฟล์แล้วคัดลอกวางบรรทัดเหล่านี้
export PYSPARK_PYTHON=python3
export PYSPARK_DRIVER_PYTHON=jupyter
export PYSPARK_DRIVER_PYTHON_OPTS="notebook"
จากนั้นเพียงเรียกใช้คำสั่งต่อไปนี้เพื่อเริ่ม pyspark ในโน้ตบุ๊ก
$ pyspark
PYSPARK_DRIVER_PYTHON=ipython3 PYSPARK_DRIVER_PYTHON_OPTS="notebook" ./bin/pyspark
ซึ่งในกรณีนี้จะใช้งานโน้ตบุ๊ก IPython 3