'분류 전체보기' 카테고리의 글 목록 (29 Page)

Notice

Recent Posts

Recent Comments

Link

« 2025/07 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록전체 글 보기 (287)

TEAM EDA

결측치 처리 (Missing Value)

NOTE: 대부분의 내용은 https://blog.naver.com/tjdudwo93/220976082118을 기반으로 Titanic 데이터에 실습을 적용하는 것으로 진행됩니다. 군밤고굼님의 설명에 따르면 결측치를 살펴보는 과정은 아래와 같은 과정으로 진행됩니다. 1. 결측 데이터의 종류 | 2. 결측값 유형 탐색하기 (표 만들기, 결측치간 상관관계) | 3. 결측 데이터의 원인 및 각각의 원인에 따른 처리 방법론 | 4. 결측치 처리 방법 선택 ( 1. 합리적 접근법 ) | 5. 결측치 처리 방법 선택 ( 2. 완전제거법 ) | 6. 결측치 처리 방법 선택 ( 3. 다중대체 ) 1. 결측 데이터의 종류 데이터가 누란 된 이유를 이해하는 것은 나머지 데이터를 올바르게 처리하는 데 중요합니다. 결측 데이터..

TEAM EDA /EDA 1기 ( 2018.03.01 ~ 2018.09.16 ) 2018. 11. 12. 15:38

EDA (Exploratory Data Analysis) 탐색적 데이터 분석

1.EDA란? 1) 정의 수집한 데이터가 들어왔을 때, 이를 다양한 각도에서 관찰하고 이해하는 과정입니다. 한마디로 데이터를 분석하기 전에 그래프나 통계적인 방법으로 자료를 직관적으로 바라보는 과정입니다. 2) 필요한 이유 데이터의 분포 및 값을 검토함으로써 데이터가 표현하는 현상을 더 잘 이해하고, 데이터에 대한 잠재적인 문제를 발견할 수 있습니다. 이를 통해, 본격적인 분석에 들어가기에 앞서 데이터의 수집을 결정할 수 있습니다. 다양한 각도에서 살펴보는 과정을 통해 문제 정의 단계에서 미쳐 발생하지 못했을 다양한 패턴을 발견하고, 이를 바탕으로 기존의 가설을 수정하거나 새로운 가설을 세울 수 있습니다. 3) 과정 기본적인 출발점은 문제 정의 단계에서 세웠던 연구 질문과 가설을 바탕으로 분석 계획을 세..

TEAM EDA /EDA 1기 ( 2018.03.01 ~ 2018.09.16 ) 2018. 11. 12. 15:36

TEAM-EDA 1기 활동 내역

1기 (2018-03-25 ~ 2018-09-16) 기본적인 전처리 기법과 대표적인 분석방법인 선형회귀와 의사결정나무에 대해서 배우고, 다양한 프로젝트를 진행하여 연습하였습니다. 이론 Exploratory Data Analysis Missing Value Visualization Regression Decision Tree 프로젝트 Kaggle - Rossmann [상위10%] EDA #1 EDA #2 Model 네이버 데이터 컴피티션 2018 [예선탈락] 빅콘테스트 Innovation 금융 [대상] 신한은행 협엽 프로젝트

TEAM EDA /EDA 1기 ( 2018.03.01 ~ 2018.09.16 ) 2018. 11. 12. 15:34

TEAM-EDA 2기 활동내역

2기 (2018-10-03 ~ 2019-06-01) 전처리 기법의 연습과 모델의 성능 향상을 위해 다양한 프로젝트 위주의 스터디를 진행하였습니다. 프로젝트 Kaggle - House Prices: Advanced Regression Techniques [상위1%] Kaggle - KUC Hackathon [수상] Kaggle - Google Analytics Revenue Dacon - Data Visualization Challenge L'point - Digital Trend Analyzer (부제 : 온라인 행동 기반 트렌드 예측) 이론 밑바닥 부터 시작하는 딥러닝2

TEAM EDA /EDA 2기 ( 2018.10.03 ~ 2019.06.01) 2018. 11. 12. 15:33

논문을 효율적으로 읽는 방법

원문 : 공돌이pooh 님의 허락을 맡고 올리는 글입니다. How to Read a Paper2013년 8월 2일 S. Keshav David R. Cheriton School of Computer science, University of Waterloo Waterloo, ON, Canada keshav@uwaterloo.ca 요약 연구자들은 논문을 읽는 데 상당한 시간을 쓴다. 그러나 논문 읽는 기술은 거의 교육받지 못했다. 그래서 의미 없는 시간을 허비하는 경우가 많다. 이 글에서 간략하게 실용적이고 효과적으로 논문을 읽는 3-단계를 소개한다. 또한, 문헌 조사에서 이 방법을 어떻게 쓰는지도 설명하겠다. 도입 연구자들은 몇 가지 이유로 논문을 읽어야 한다: 콘퍼런스나 과목을 위해 읽기, 자신 분야의 ..

EDA Study/논문 리뷰 2018. 11. 6. 08:46

Convolutional Neural Network (AlexNet)

Note : 본 자료는 edwith 최성준강사님의 논문으로 짚어보는 딥러닝 맥을 정리한 자료입니다. CNN의 구조 CNN의 구조는 위의 사진과 같습니다. Input이라는 이미지가 들어오면 Convolutions작업을 통해서 feature maps를 만들어 내고 Subsampling을 통해서 그 사이즈를 줄입니다. 마찬가지로 Convolutions - Subsampling 작업을 반복하다가 마지막에 Full Connection이라는 작업을 통해서 Output(Fully Connected layer)을 산출합니다. 위의 과정을 더 자세하게 설명 하겠습니다. 우리는 사진이 들어오면 Output으로 이 사진이 무슨 사물을 가르키는지를 알아보는 Neural Network를 만들것입니다. 먼저 Image로 보트사진..

EDA Study/머신러닝 2018. 11. 5. 11:02

TEAM-EDA 활동 내역

1기 (2018-03-25 ~ 2018-09-16)기본적인 전처리 기법과 대표적인 분석방법인 선형회귀와 의사결정나무에 대해서 배우고, 다양한 프로젝트를 진행하여 연습하였습니다. 스터디 Exploratory Data AnalysisOutliersVisualizationRegressionDecision Tree 프로젝트 Kaggle - Rossmann [상위10%]네이버 데이터 컴피티션 2018 [예선탈락]빅콘테스트 Innovation 금융 [] 2기 (2018-10-03 ~ )전처리 기법의 연습과 모델의 성능 향상을 위해 다양한 프로젝트 위주의 스터디를 진행하였습니다. 프로젝트 Kaggle - House Prices: Advanced Regression Techniques [상위2%]Kaggle - KUC..

TEAM EDA 2018. 10. 31. 08:29

이전 Prev 1 ··· 26 27 28 29 Next 다음

목록전체 글 보기 (287)

TEAM EDA

티스토리툴바