'2018/11/12 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2018/11 »
일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30

Tags more

Archives

Today

Total

관리 메뉴

목록2018/11/12 (4)

TEAM EDA

결측치 처리 (Missing Value)

NOTE: 대부분의 내용은 https://blog.naver.com/tjdudwo93/220976082118을 기반으로 Titanic 데이터에 실습을 적용하는 것으로 진행됩니다. 군밤고굼님의 설명에 따르면 결측치를 살펴보는 과정은 아래와 같은 과정으로 진행됩니다. 1. 결측 데이터의 종류 | 2. 결측값 유형 탐색하기 (표 만들기, 결측치간 상관관계) | 3. 결측 데이터의 원인 및 각각의 원인에 따른 처리 방법론 | 4. 결측치 처리 방법 선택 ( 1. 합리적 접근법 ) | 5. 결측치 처리 방법 선택 ( 2. 완전제거법 ) | 6. 결측치 처리 방법 선택 ( 3. 다중대체 ) 1. 결측 데이터의 종류 데이터가 누란 된 이유를 이해하는 것은 나머지 데이터를 올바르게 처리하는 데 중요합니다. 결측 데이터..

TEAM EDA /EDA 1기 ( 2018.03.01 ~ 2018.09.16 ) 2018. 11. 12. 15:38

EDA (Exploratory Data Analysis) 탐색적 데이터 분석

1.EDA란? 1) 정의 수집한 데이터가 들어왔을 때, 이를 다양한 각도에서 관찰하고 이해하는 과정입니다. 한마디로 데이터를 분석하기 전에 그래프나 통계적인 방법으로 자료를 직관적으로 바라보는 과정입니다. 2) 필요한 이유 데이터의 분포 및 값을 검토함으로써 데이터가 표현하는 현상을 더 잘 이해하고, 데이터에 대한 잠재적인 문제를 발견할 수 있습니다. 이를 통해, 본격적인 분석에 들어가기에 앞서 데이터의 수집을 결정할 수 있습니다. 다양한 각도에서 살펴보는 과정을 통해 문제 정의 단계에서 미쳐 발생하지 못했을 다양한 패턴을 발견하고, 이를 바탕으로 기존의 가설을 수정하거나 새로운 가설을 세울 수 있습니다. 3) 과정 기본적인 출발점은 문제 정의 단계에서 세웠던 연구 질문과 가설을 바탕으로 분석 계획을 세..

TEAM EDA /EDA 1기 ( 2018.03.01 ~ 2018.09.16 ) 2018. 11. 12. 15:36

TEAM-EDA 1기 활동 내역

1기 (2018-03-25 ~ 2018-09-16) 기본적인 전처리 기법과 대표적인 분석방법인 선형회귀와 의사결정나무에 대해서 배우고, 다양한 프로젝트를 진행하여 연습하였습니다. 이론 Exploratory Data Analysis Missing Value Visualization Regression Decision Tree 프로젝트 Kaggle - Rossmann [상위10%] EDA #1 EDA #2 Model 네이버 데이터 컴피티션 2018 [예선탈락] 빅콘테스트 Innovation 금융 [대상] 신한은행 협엽 프로젝트

TEAM EDA /EDA 1기 ( 2018.03.01 ~ 2018.09.16 ) 2018. 11. 12. 15:34

TEAM-EDA 2기 활동내역

2기 (2018-10-03 ~ 2019-06-01) 전처리 기법의 연습과 모델의 성능 향상을 위해 다양한 프로젝트 위주의 스터디를 진행하였습니다. 프로젝트 Kaggle - House Prices: Advanced Regression Techniques [상위1%] Kaggle - KUC Hackathon [수상] Kaggle - Google Analytics Revenue Dacon - Data Visualization Challenge L'point - Digital Trend Analyzer (부제 : 온라인 행동 기반 트렌드 예측) 이론 밑바닥 부터 시작하는 딥러닝2

TEAM EDA /EDA 2기 ( 2018.10.03 ~ 2019.06.01) 2018. 11. 12. 15:33

이전 Prev 1 Next 다음

목록2018/11/12 (4)

TEAM EDA

티스토리툴바