Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
Tags
- MySQL
- TEAM EDA
- DilatedNet
- Python
- 프로그래머스
- 엘리스
- eda
- 3줄 논문
- 코딩테스트
- 협업필터링
- Segmentation
- 추천시스템
- 튜토리얼
- pytorch
- Semantic Segmentation
- hackerrank
- 한빛미디어
- 입문
- Machine Learning Advanced
- 나는 리뷰어다
- 나는리뷰어다
- 알고리즘
- 스택
- DFS
- Object Detection
- 큐
- Image Segmentation
- 파이썬
- TEAM-EDA
- Recsys-KR
Archives
- Today
- Total
목록2023/08/17 (1)
TEAM EDA

연속형 변수를 전처리해야하는 이유는 무엇이 있을까요? 첫째, 일부 머신러닝 알고리즘은 입력 변수의 스케일에 따라 영향을 받아 학습이 불안정할 수 있습니다. 예를들어, 최근접이웃모델(KNN)의 경우 스케일의 전 후에 따라서 모델의 결과가 완전히 달라집니다. 해당 모델의 경우 간단하게 설명하면 새로운 입력이 들어왔을때 자신과 거리가 가까운 K개의 다른 데이터와 거리를 통해 분류 (or 회귀)를 수행하는 방법입니다. 하지만, 하나의 변수의 스케일이 너무 클 경우 거리의 계산이 해당 변수에 의해서만 진행됩니다. 유킬리디안 거리를 통해 보면 x가 proline, y가 hue로 보면거리가 proline 부분이 (800-700)^2으로 만단위이고 hue가 (1-0)^2으로 일의 단위라서 proline 변수에 의해서 ..
EDA Study/Machine Learning Advanced
2023. 8. 17. 18:12