Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Tags
- jpa pagination
- spring-boot-maven-plugin
- jwt example
- docker mongodb
- jvm 모델
- springboot mongodb config
- springboot-angular-jwt
- string comparison
- String Pool
- springboot maven plugin
- JWT
- JPA
- docker mongodb install
- HHH000104
- filter ordering
- springboot jwt
- spring jwt
- angular jwt
- jvm 메모리 구조
- String Constants Pool
- springboot jwt example
- jwt token
- spring filter ordering
- install mongodb docker
- mongodb install ec2
- intern
- jvm memory model
- jvm memory structure
- Constants pool
- 기본 Manifest 속성이 없습니다
Archives
- Today
- Total
개발블로그
pyspark 와 jupyter 연동하기(Mac) 본문
1. jupyter notebook 설치
brew install python3
python3 -m pip install --upgrade setuptools
pip3 install jupyter
실행을 위해서 다음 명령을 입력한다.
jupyter notebook
2. spark 설치
spark가 실행되기 위해서는 java가 설치되어 있어야 한다.
oracle download에 접속해 jdk1.8을 다운로드 받는다.
spark download에 접속해 spark tgz파일을 다운로드 후, 다음 명령들을 실행한다.
tar -xzf spark-2.4.4-bin-hadoop2.7.tgz
mv spark-2.4.4-bin-hadoop2.7 /opt/spark-2.4.4
ln -s /opt/spark-2.4.4 /opt/spark
처음에 2.4.4 버전 대신 3.0.0을 다운받았었는데, zeppelin에서 코드가 정상적으로 실행되지 않았다.
zeppelin을 설치할 예정이라면, 2.4.4를 다운받기를 권한다.
Spark 환경 변수 편집을 위해 ~/.bash_profile 파일에 다음을 추가해준다.
export SPARK_HOME=/opt/spark
export PATH=$SPARK_HOME/bin:$PATH
export PYSPARK_PYTHON=python3
3. jupyter에 pyspark 드라이버 추가
환경 변수 편집을 위해 ~/.bash_profile 파일에 다음을 추가해준다.
export PYSPARK_DRIVER_PYTHON=jupyter
export PYSPARK_DRIVER_PYTHON_OPTS='notebook'
'Data Science & Bigdata' 카테고리의 다른 글
zeppelin install (mac) (0) | 2020.01.06 |
---|
Comments