일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 나는 리뷰어다
- 추천시스템
- 프로그래머스
- 알고리즘
- 스택
- DilatedNet
- eda
- DFS
- 나는리뷰어다
- Image Segmentation
- Object Detection
- pytorch
- 큐
- Python
- 코딩테스트
- MySQL
- hackerrank
- Machine Learning Advanced
- 파이썬
- 튜토리얼
- Segmentation
- TEAM-EDA
- 3줄 논문
- 한빛미디어
- Recsys-KR
- 엘리스
- TEAM EDA
- Semantic Segmentation
- 입문
- 협업필터링
- Today
- Total
목록TEAM EDA (27)
TEAM EDA
Note: 이번 내용은 Jaeyoon Han님의 자료를 저희 스터디원이 진행 한 발표내용을 중심으로 추가적인 discussion을 정리했습니다. 의사결정나무의 개념과 추가적인 내용 및 파이썬 코드에 관한 부분은 아래의 링크를 참고하시기 바랍니다. 개인적으로 이해한 내용으로 작성한 자료니 틀린 부분이나 모르는 부분은 댓글로 남겨주시기 바랍니다!!! 의사결정나무는 마치 스무고개를 하듯이 Rules에 의해서 Predictors로 Target을 예측하는 모델입니다. 위의 내용에서 Play Golf라는 목적값을 예측하기 위해서 날씨(Outlook), Temp(온도) ,습도(Humidity), 바람(windy)의 4가지 요소를 나누는 것입니다. 오른쪽 그림에서 예를 들면 Outlook이 Sunny이고 Windy가 ..
Note: 이번 내용은 Jaeyoon Han님의 자료를 저희 스터디원이 진행 한 발표내용을 중심으로 추가적인 discussion을 정리했습니다.회귀분석의 개념과 추가적인 내용 및 파이썬 코드에 관한 부분은 아래의 링크를 참고하시기 바랍니다. 개인적으로 이해한 내용으로 작성한 자료니 틀린 부분이나 모르는 부분은 댓글로 남겨주시기 바랍니다!!! 링크 : http://blog.naver.com/choco_9966/221254266558 목차 1. 지도학습/비지도학습/강화학습의 개념 2. 선형회귀법(Linear Regression) 3. 선형회귀법 실습 with R 1. 지도학습/비지도학습/강화학습의 개념 지도학습 (Supervised Learning) 목적값을 알고있는 data를 가지고 기계학습 알고리즘을 진..
NOTE: 대부분의 내용은 https://blog.naver.com/tjdudwo93/220976082118을 기반으로 Titanic 데이터에 실습을 적용하는 것으로 진행됩니다. 군밤고굼님의 설명에 따르면 결측치를 살펴보는 과정은 아래와 같은 과정으로 진행됩니다. 1. 결측 데이터의 종류 | 2. 결측값 유형 탐색하기 (표 만들기, 결측치간 상관관계) | 3. 결측 데이터의 원인 및 각각의 원인에 따른 처리 방법론 | 4. 결측치 처리 방법 선택 ( 1. 합리적 접근법 ) | 5. 결측치 처리 방법 선택 ( 2. 완전제거법 ) | 6. 결측치 처리 방법 선택 ( 3. 다중대체 ) 1. 결측 데이터의 종류 데이터가 누란 된 이유를 이해하는 것은 나머지 데이터를 올바르게 처리하는 데 중요합니다. 결측 데이터..
1.EDA란? 1) 정의 수집한 데이터가 들어왔을 때, 이를 다양한 각도에서 관찰하고 이해하는 과정입니다. 한마디로 데이터를 분석하기 전에 그래프나 통계적인 방법으로 자료를 직관적으로 바라보는 과정입니다. 2) 필요한 이유 데이터의 분포 및 값을 검토함으로써 데이터가 표현하는 현상을 더 잘 이해하고, 데이터에 대한 잠재적인 문제를 발견할 수 있습니다. 이를 통해, 본격적인 분석에 들어가기에 앞서 데이터의 수집을 결정할 수 있습니다. 다양한 각도에서 살펴보는 과정을 통해 문제 정의 단계에서 미쳐 발생하지 못했을 다양한 패턴을 발견하고, 이를 바탕으로 기존의 가설을 수정하거나 새로운 가설을 세울 수 있습니다. 3) 과정 기본적인 출발점은 문제 정의 단계에서 세웠던 연구 질문과 가설을 바탕으로 분석 계획을 세..
1기 (2018-03-25 ~ 2018-09-16) 기본적인 전처리 기법과 대표적인 분석방법인 선형회귀와 의사결정나무에 대해서 배우고, 다양한 프로젝트를 진행하여 연습하였습니다. 이론 Exploratory Data Analysis Missing Value Visualization Regression Decision Tree 프로젝트 Kaggle - Rossmann [상위10%] EDA #1 EDA #2 Model 네이버 데이터 컴피티션 2018 [예선탈락] 빅콘테스트 Innovation 금융 [대상] 신한은행 협엽 프로젝트
2기 (2018-10-03 ~ 2019-06-01) 전처리 기법의 연습과 모델의 성능 향상을 위해 다양한 프로젝트 위주의 스터디를 진행하였습니다. 프로젝트 Kaggle - House Prices: Advanced Regression Techniques [상위1%] Kaggle - KUC Hackathon [수상] Kaggle - Google Analytics Revenue Dacon - Data Visualization Challenge L'point - Digital Trend Analyzer (부제 : 온라인 행동 기반 트렌드 예측) 이론 밑바닥 부터 시작하는 딥러닝2
1기 (2018-03-25 ~ 2018-09-16)기본적인 전처리 기법과 대표적인 분석방법인 선형회귀와 의사결정나무에 대해서 배우고, 다양한 프로젝트를 진행하여 연습하였습니다. 스터디 Exploratory Data AnalysisOutliersVisualizationRegressionDecision Tree 프로젝트 Kaggle - Rossmann [상위10%]네이버 데이터 컴피티션 2018 [예선탈락]빅콘테스트 Innovation 금융 [] 2기 (2018-10-03 ~ )전처리 기법의 연습과 모델의 성능 향상을 위해 다양한 프로젝트 위주의 스터디를 진행하였습니다. 프로젝트 Kaggle - House Prices: Advanced Regression Techniques [상위2%]Kaggle - KUC..