Menghubungkan Pyspark dengan Jupyter Notebook

Menghubungkan Pyspark dengan Jupyter Notebook

1. Install Jupyter

pip install jupyter

Note: Install pip terlebih dahulu jika belum ada

sudo apt install python3-pip

atau untuk python2

sudo apt install python-pip

2. Edit ~/.bashrc

sudo nano ~/.bashrc

Tambahkan:

export PYSPARK_DRIVER_PYTHON=jupyter
export PYSPARK_DRIVER_PYTHON_OPTS='notebook'

3. Update

source ~/.bashrc

4. Masuk ke folder spark

Jalankan pyspark

./bin/pyspark

5. Jika berhasil, akan dibuka di web browser dengan tampilan seperti ini

2019-05-09