일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 |
- 나는리뷰어다
- 프로그래머스
- 추천시스템
- DFS
- 코딩테스트
- 튜토리얼
- TEAM-EDA
- 한빛미디어
- 나는 리뷰어다
- 파이썬
- Image Segmentation
- DilatedNet
- Python
- Recsys-KR
- MySQL
- Object Detection
- TEAM EDA
- Semantic Segmentation
- Machine Learning Advanced
- hackerrank
- 엘리스
- 알고리즘
- 협업필터링
- eda
- 스택
- pytorch
- 입문
- 큐
- Segmentation
- 3줄 논문
- Today
- Total
목록2018/11 (20)
TEAM EDA
이번 EDA 2기 첫 프로젝트로 진행했던 kaggle의 House Prices: Advanced Regression Techniques(https://www.kaggle.com/c/house-prices-advanced-regression-techniques)에 대한 분석 보고서입니다. 추가적으로 해당 내용에 대해 결측치 처리와 모델의 변수 중요도에 대한 해석이 들어간 자료는 [Kaggle] House Prices: Advanced Regression Techniques(2)를 참고하시기 바랍니다. 집의 가격을 예측하는 문제로 사용한 모델은 ridge,lasso, Elastic Net, LightGBM, Xgboost입니다. 최종적으로 성적을 올리기위해 다른 사람들의 결과물을 반영해 추가적으로 앙생블을 ..
1. 회귀를 사용하기 적절하지 않은 경우는 어떤 경우이며 회귀와 분류의 차이는 무엇인가? 반응변수가 Categorical한 경우에 회귀를 사용하기 힘듭니다. 그 이유는 프린트에 나와있듯이 클래스별 차이를 인식하기 때문입니다. 추가로 0~1사이를 예측할 경우 0이하 or 1이상도 예측가능하기 때문입니다. 분류는 회귀와는 다르게 어떠한 class에 속할지 categorical하게 예측하는 것입니다. 2. 로지스틱 모델에서 사용되는 odds는 무엇인가? odds는 https://t1.daumcdn.net/cfile/tistory/9988AA395BF85AF10C의 링크의 식과 같습니다. 3. 신용카드 대금을 연체할 공산(odds)이 0.28인 사람 중 평균 몇 퍼센트가 실제로 연체할 것인가? 위의 식이 0.2..
이번주 슬라이드: https://lagunita.stanford.edu/c4x/HumanitiesScience/StatLearning/asset/classification.pdf 교재 4.4 중 4.4.4와 4.5를 공부하시면 됩니다. (영문: 149~153p, 국문: 172 ~ 178p)*Quadratic Discriminant Analysis and Naive Bayes (10:07)*https://www.youtube.com/watch?v=6FiNGTYAOAA&list=PL5-da3qGB5IC4vaDba5ClatUmFppXLAhE 1. Quadratic Discriminant Analysis ... 2. Naive Bayes 3. LDA 4. Summary 로지스틱 회귀 분석은 특히 K = 2인 경..
이번주 슬라이드: https://lagunita.stanford.edu/c4x/HumanitiesScience/StatLearning/asset/classification.pdf 교재 4.4 중 4.4.3을 공부하시면 됩니다. (영문: 142~148p, 국문: 164 ~ 172p)*Multivariate Linear Discriminant Analysis and ROC Curves (17:42)-4.4.3 (Fri)*https://www.youtube.com/watch?v=X4VDZDp2vqw&list=PL5-da3qGB5IC4vaDba5ClatUmFppXLAhE 1. From δk(x) to probabilities 2. Error의 종류 여기서 error의 종류가 여러개가 나오는데 아래의 표의 값들만..
이번주 슬라이드: https://lagunita.stanford.edu/c4x/HumanitiesScience/StatLearning/asset/classification.pdf 교재 4.4 중 4.4.1, 4.4.2를 공부하시면 됩니다. (영문: 138~ 141, 국문: 159 ~ 164p) *Linear Discriminant Analysis and Bayes Theorem (7:12)-4.4.1*https://www.youtube.com/watch?v=RfrGiG1Hm3M&list=PL5-da3qGB5IC4vaDba5ClatUmFppXLAhE*Univariate Linear Discriminant Analysis (7:37)-4.4.2*https://www.youtube.com/watch?v=QG0..
이번주 슬라이드: https://lagunita.stanford.edu/c4x/HumanitiesScience/StatLearning/asset/classification.pdf 교재 4.3를 공부하시면 됩니다. (영문: 130 ~ 137p, 국문: 151 ~159p) 참고 동영상:*Logistic Regression and Maximum Likelihood (9:07)*https://www.youtube.com/watch?v=31Q5FGRnxt4&list=PL5-da3qGB5IC4vaDba5ClatUmFppXLAhE *Multivariate Logistic Regression and Confounding (9:53)*https://www.youtube.com/watch?v=MpX8rVv_u4E&list..
이번 2주차 공부 주제 : Ch4: Classification 이번주 슬라이드https://lagunita.stanford.edu/c4x/HumanitiesScience/StatLearning/asset/classification.pdf 교재 안내교재 4.1, 4.2를 공부하시면 됩니다. (영문: 127 ~ 130p, 국문: 147 ~151p) 참고 동영상 : Introduction to Classification (10:25)https://www.youtube.com/watch?v=sqq21-VIa1c&list=PL5-da3qGB5IC4vaDba5ClatUmFppXLAhE 3장 지난 선형회귀모델에서는 Y 반응변수를 quantitative하다고 가정했습니다. 한마디로 보통 우리가 생각하는 숫자형태의 데이..
리더님 정답파일
질문1) 유연한 통계학습방법과 덜 유연한 방법중 어느것이 일반적으로 성능이 더 나은지 말해보자. 내 답변) 질문의도를 정확히 모르겠는데, a)의 경우 설명변수의 수에 비해 표본의 크기가 크니 덜 유연한 방법을 사용해도 충분히 학습되서 성능이 좋을 것 같습니다. 반대로 b)의 경우 p가 n에 비해 클 경우 선형회귀 같은 통계적인 방법을 사용할 수 없고 비모수적 기법(k-nearest)도 성능이 좋지 않으니 유연한 방법을 써야할 것 같습니다. 질문2) 각 시나리오가 분류 혹은 회귀문제 인지 설명하고, 가장 관심 있는것이 추론인지 혹은 예측인지 명시해보자. n과 p 또한 생각해보자. 내 답변) A : 회귀문제 - 추론 / n=500개 p = 4 이익, 직원 수, 업종, CEO 연봉 / p에 비해 n이 많은 상..
Ch3-1. Linear Regression *슬라이드*Linear Regression *강의*Simple Linear Regression and Confidence Intervals (13:01)Hypothesis Testing (8:24) 지난시간에 이어 선형회귀분석을 계속하겠습니다. 선형회귀모델은 아래와 같이 결정됩니다. 그리고 우리는 이를 Supervised Learning(Y를 알고 있을 경우/ 만일 Supervised Learning을 처음들어보시면 Day1 : Introduction을 보고오시기 바랍니다.)이라고 하며, Y는 X와 선형이라고 가정합니다.(선형성가정) 하지만 아래의 빨간곡선처럼 실제로 X와 Y와의 관계가 선형인 경우는 거의 없습니다.그럼에도 불구하고 선형회귀분석은 개념적으로나 ..