Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- TEAM-EDA
- Segmentation
- pytorch
- DilatedNet
- DFS
- 추천시스템
- 나는 리뷰어다
- Python
- Image Segmentation
- 스택
- Machine Learning Advanced
- 파이썬
- 코딩테스트
- Recsys-KR
- eda
- 프로그래머스
- hackerrank
- 협업필터링
- Object Detection
- 한빛미디어
- MySQL
- 알고리즘
- 나는리뷰어다
- TEAM EDA
- 엘리스
- Semantic Segmentation
- 튜토리얼
- 3줄 논문
- 입문
- 큐
Archives
- Today
- Total
목록스파크를 활용한 실시간 처리 (1)
TEAM EDA
[나는 리뷰어다] 스파크를 활용한 실시간 처리
본 포스터는 한빛미디어에서 [나는 리뷰어다]를 통해 책을 지원받아 작성한 리뷰 포스터입니다. 먼저 저는 대학원생이고 스파크의 경우 아예 처음이었습니다. 1. 소개 Apach Spark는 SQL, 머신러닝 등을 위한 대규모 데이터 처리 분석 엔진입니다. 한마디로 빅데이터를 분석하기 위한 언어입니다. 보통 Hadoop과 스파크 둘 중 하나의 언어를 사용하는데, 구글 클라우드 잼의 글에서는 아래와 같이 비교를 한다고 합니다. Hadoop은 주로 디스크 사용량이 많고 맵리듀스 패러다임을 사용하는 작업에 사용됩니다. Spark는 더 유연하지만 대체로 더 많은 비용이 드는 인메모리 처리 아키텍처입니다. 각 기능을 이해하고 있으면 언제 어떤 것을 구현할지 결정하는 데 도움이 됩니다. 출처 : https://cloud..
개인 공간/리뷰
2021. 5. 23. 12:11