일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 |
- 큐
- Object Detection
- Recsys-KR
- 프로그래머스
- 튜토리얼
- eda
- TEAM EDA
- 엘리스
- 스택
- hackerrank
- TEAM-EDA
- DFS
- Image Segmentation
- pytorch
- Segmentation
- 협업필터링
- 추천시스템
- 파이썬
- 알고리즘
- 나는리뷰어다
- DilatedNet
- MySQL
- 한빛미디어
- 입문
- 3줄 논문
- 코딩테스트
- Python
- Semantic Segmentation
- Machine Learning Advanced
- 나는 리뷰어다
- Today
- Total
목록전체 글 보기 (287)
TEAM EDA
NOTE: 대부분의 내용은 https://blog.naver.com/tjdudwo93/220976082118을 기반으로 Titanic 데이터에 실습을 적용하는 것으로 진행됩니다. 군밤고굼님의 설명에 따르면 결측치를 살펴보는 과정은 아래와 같은 과정으로 진행됩니다. 1. 결측 데이터의 종류 | 2. 결측값 유형 탐색하기 (표 만들기, 결측치간 상관관계) | 3. 결측 데이터의 원인 및 각각의 원인에 따른 처리 방법론 | 4. 결측치 처리 방법 선택 ( 1. 합리적 접근법 ) | 5. 결측치 처리 방법 선택 ( 2. 완전제거법 ) | 6. 결측치 처리 방법 선택 ( 3. 다중대체 ) 1. 결측 데이터의 종류 데이터가 누란 된 이유를 이해하는 것은 나머지 데이터를 올바르게 처리하는 데 중요합니다. 결측 데이터..
1.EDA란? 1) 정의 수집한 데이터가 들어왔을 때, 이를 다양한 각도에서 관찰하고 이해하는 과정입니다. 한마디로 데이터를 분석하기 전에 그래프나 통계적인 방법으로 자료를 직관적으로 바라보는 과정입니다. 2) 필요한 이유 데이터의 분포 및 값을 검토함으로써 데이터가 표현하는 현상을 더 잘 이해하고, 데이터에 대한 잠재적인 문제를 발견할 수 있습니다. 이를 통해, 본격적인 분석에 들어가기에 앞서 데이터의 수집을 결정할 수 있습니다. 다양한 각도에서 살펴보는 과정을 통해 문제 정의 단계에서 미쳐 발생하지 못했을 다양한 패턴을 발견하고, 이를 바탕으로 기존의 가설을 수정하거나 새로운 가설을 세울 수 있습니다. 3) 과정 기본적인 출발점은 문제 정의 단계에서 세웠던 연구 질문과 가설을 바탕으로 분석 계획을 세..
1기 (2018-03-25 ~ 2018-09-16) 기본적인 전처리 기법과 대표적인 분석방법인 선형회귀와 의사결정나무에 대해서 배우고, 다양한 프로젝트를 진행하여 연습하였습니다. 이론 Exploratory Data Analysis Missing Value Visualization Regression Decision Tree 프로젝트 Kaggle - Rossmann [상위10%] EDA #1 EDA #2 Model 네이버 데이터 컴피티션 2018 [예선탈락] 빅콘테스트 Innovation 금융 [대상] 신한은행 협엽 프로젝트
2기 (2018-10-03 ~ 2019-06-01) 전처리 기법의 연습과 모델의 성능 향상을 위해 다양한 프로젝트 위주의 스터디를 진행하였습니다. 프로젝트 Kaggle - House Prices: Advanced Regression Techniques [상위1%] Kaggle - KUC Hackathon [수상] Kaggle - Google Analytics Revenue Dacon - Data Visualization Challenge L'point - Digital Trend Analyzer (부제 : 온라인 행동 기반 트렌드 예측) 이론 밑바닥 부터 시작하는 딥러닝2
원문 : 공돌이pooh 님의 허락을 맡고 올리는 글입니다. How to Read a Paper2013년 8월 2일 S. Keshav David R. Cheriton School of Computer science, University of Waterloo Waterloo, ON, Canada keshav@uwaterloo.ca 요약 연구자들은 논문을 읽는 데 상당한 시간을 쓴다. 그러나 논문 읽는 기술은 거의 교육받지 못했다. 그래서 의미 없는 시간을 허비하는 경우가 많다. 이 글에서 간략하게 실용적이고 효과적으로 논문을 읽는 3-단계를 소개한다. 또한, 문헌 조사에서 이 방법을 어떻게 쓰는지도 설명하겠다. 도입 연구자들은 몇 가지 이유로 논문을 읽어야 한다: 콘퍼런스나 과목을 위해 읽기, 자신 분야의 ..
Note : 본 자료는 edwith 최성준강사님의 논문으로 짚어보는 딥러닝 맥을 정리한 자료입니다. CNN의 구조 CNN의 구조는 위의 사진과 같습니다. Input이라는 이미지가 들어오면 Convolutions작업을 통해서 feature maps를 만들어 내고 Subsampling을 통해서 그 사이즈를 줄입니다. 마찬가지로 Convolutions - Subsampling 작업을 반복하다가 마지막에 Full Connection이라는 작업을 통해서 Output(Fully Connected layer)을 산출합니다. 위의 과정을 더 자세하게 설명 하겠습니다. 우리는 사진이 들어오면 Output으로 이 사진이 무슨 사물을 가르키는지를 알아보는 Neural Network를 만들것입니다. 먼저 Image로 보트사진..
1기 (2018-03-25 ~ 2018-09-16)기본적인 전처리 기법과 대표적인 분석방법인 선형회귀와 의사결정나무에 대해서 배우고, 다양한 프로젝트를 진행하여 연습하였습니다. 스터디 Exploratory Data AnalysisOutliersVisualizationRegressionDecision Tree 프로젝트 Kaggle - Rossmann [상위10%]네이버 데이터 컴피티션 2018 [예선탈락]빅콘테스트 Innovation 금융 [] 2기 (2018-10-03 ~ )전처리 기법의 연습과 모델의 성능 향상을 위해 다양한 프로젝트 위주의 스터디를 진행하였습니다. 프로젝트 Kaggle - House Prices: Advanced Regression Techniques [상위2%]Kaggle - KUC..