일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- DFS
- 협업필터링
- Image Segmentation
- DilatedNet
- 나는 리뷰어다
- eda
- 입문
- Machine Learning Advanced
- 알고리즘
- Segmentation
- hackerrank
- TEAM EDA
- Recsys-KR
- 튜토리얼
- 3줄 논문
- 프로그래머스
- 추천시스템
- 엘리스
- Object Detection
- 스택
- Python
- 큐
- pytorch
- 나는리뷰어다
- TEAM-EDA
- Semantic Segmentation
- MySQL
- 파이썬
- 코딩테스트
- 한빛미디어
- Today
- Total
TEAM EDA
[정보보호 R&D 2019] Pyspark 설치 본문
1. 자바 설치
- https://java.com/ko/download/
2. Spark 설치
- http://spark.apache.org/downloads.html
3. winutils.exe 설치
- http://github.com/steveloughran/winutils
4. Pyspark 설치
- python -m pip install findspark
5. 설치 확인
import findspark
findspark.init()
import pyspark
from pyspark.sql import SparkSession
spark = SparkSession.buider.getOr.Create()
df = spark.sql("select 'spark' as hello")
df.show()
만약, 위와 같은 과정을 거쳐도 설치가 되지 않는다면 경로의 문제일 가능성이 높음. Java 및 Spark의 경로가 맞게 설정되었는지 확인해야 함.
확인코드
import os
print(os.environ['SPARK_HOME'])
print(os.environ['JAVA_HOME'])
print(os.environ['PATH'])
환경변수
- SPARK_HOME = C:\spark\spark-2.3.2-bin-hadoop2.7
- HADOOP_HOME = C:\spark\spark-2.3.2-bin-hadoop2.7
- JAVA_HOME = C:\Program Files\Java\jdk1.8.0_201
경로변수
- C:\spark\spark-2.3.2-bin-hadoop2.7\bin
- C:\Program Files\Java\jdk1.8.0_201\bin
참고자료
- https://medium.com/@naomi.fridman/install-pyspark-to-run-on-jupyter-notebook-on-windows-4ec2009de21f
- https://bigdata-madesimple.com/guide-to-install-spark-and-use-pyspark-from-jupyter-in-windows/
'EDA Project > 정보보호 R&D 데이터 챌린지' 카테고리의 다른 글
K-사이버 시큐리티 2020 아이온 게임봇 탐지대회 후기 (5) | 2020.12.06 |
---|---|
정보보호 R&D 데이터 챌린지 2019 - 자동차용 침입탐지 (0) | 2019.11.22 |
정보보호 R&D 데이터 챌린지 2019 - 게임봇 탐지 (0) | 2019.10.26 |