일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- TEAM EDA
- 3줄 논문
- 나는리뷰어다
- Semantic Segmentation
- 한빛미디어
- DFS
- Machine Learning Advanced
- 나는 리뷰어다
- 큐
- eda
- Image Segmentation
- 추천시스템
- Segmentation
- 협업필터링
- 파이썬
- hackerrank
- 입문
- Python
- 튜토리얼
- 코딩테스트
- 엘리스
- 알고리즘
- 스택
- Object Detection
- 프로그래머스
- DilatedNet
- Recsys-KR
- MySQL
- pytorch
- TEAM-EDA
- Today
- Total
TEAM EDA
Day6 : 1주차 질의응답 본문
내 답변) A : 회귀문제 - 추론 / n=500개 p = 4 이익, 직원 수, 업종, CEO 연봉 / p에 비해 n이 많은 상황. 이
B : 분류문제 - 예측 / n = 20개. p = 14 성공 실패 여부, 판매 가격 등등해서 14개.질문3) 회귀 또는 분류에 대한 기법 중, 매우 유연한 방법이 덜 유연한 방법에 비해 가지는 장점과 단점은 무엇인가? 어떤 경우에 더 유연한 기법을 선호하고, 또 어떤 경우에 덜 유연한 기법을 선호하는지 생각해보자.
질문4) 통계학습 기법에서 모수적 기법과 비모수적 기법의 차이는 무엇인가? 회귀 또는 분류에서 모수적 기법과 비모수적 기법의 장점과 단점은 무엇인가?
질문5) 80페이지의 표 3.4에 주어진 p값에 대응하는 귀무가설을 기술하고 어떠한 결론을 내릴수 있는지 설명하여라. 설명은 sales, TV, radio, newspaper에 대하여 해야 한다.
질문6) KNN분류기와 KNN 회귀방법 사이의 차이를 설명하여라.
이번주에 학습하시면서 이해가 안가셨거나 궁금하신 질문들을 모두 적어주세요.
1. 문제 1번 2번에서 n이 충분히 큰 상황과 p가 n에 비해 큰 상황 두가지를 봤는데, 각각의 상황에 대해 어떠한 모델을 사용해야하는지 궁금합니다. 2. 선형회귀분석(모수적기법)에서 가정을 맞춰주는것이 중요한데, 보통은 정규성가정정도만 맞춰주고 선형성가정이나 그 외의 가정들은 무시하고 사용하는것 같던데 이렇게 해도 괜찮은가요? 3. R-squared에 대한 설명에서 correlation값과 동일하다고 나오는데, 그냥 두 값이 같다고 생각하면 되는건가요? 4. 변수선택 방법에서 all subset의 경우 training error를 최소화 하는 방법을 선택한다고 나와있는데 1개부터 n개씩 제거한 모든 상황에 대해 MSE를 계산하고 그 중 가장 괜찮은것을 고른건가요? R코드로 돌려봤을 때는 all subset의 경우 r-squared와 aic, bic 모두 나오던데 어떻게 해석하면 되는걸까요?
'EDA Study > 수학' 카테고리의 다른 글
Day8 : Classification (0) | 2018.11.24 |
---|---|
Day7 : 1주차 질의응답 해설 (0) | 2018.11.19 |
Day4 : Linear Regression (0) | 2018.11.16 |
Day3 : Statistical Learning(2) (0) | 2018.11.16 |
Day2 : Statistical Learning(1) (0) | 2018.11.16 |