Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
Tags
- 나는 리뷰어다
- 나는리뷰어다
- 스택
- 튜토리얼
- DFS
- 3줄 논문
- Object Detection
- pytorch
- 코딩테스트
- Segmentation
- hackerrank
- 알고리즘
- DilatedNet
- 한빛미디어
- 프로그래머스
- Python
- 파이썬
- Recsys-KR
- MySQL
- 엘리스
- 큐
- Image Segmentation
- Semantic Segmentation
- TEAM-EDA
- 입문
- 추천시스템
- eda
- TEAM EDA
- Machine Learning Advanced
- 협업필터링
Archives
- Today
- Total
목록2023/08 (11)
TEAM EDA

이전 강의인 [Machine Learning Advanced] 2강. 머신러닝 강의 - 데이터 전처리 (결측치)에 이어서 이상치에 대해서 살펴보도록 하겠습니다. 이상치란 무엇일까요? 이상치(outlier)는 일반적인 데이터 패턴에서 벗어나거나 예외적인 값을 가지는 데이터 포인트를 의미합니다. 이러한 이상치는 주로 측정 오류, 혹은 특이한 상황 등으로 인해 발생하는 값입니다. 이러한 이상치는 통계적 결과를 왜곡 하는 원인이 되기도 하고, 모델의 학습을 방해하는 요소이기도 원인을 파악하고 원인에 따른 처리를 하는게 중요합니다. 예를들어, 위의 그래프처럼 축구선수의 평균연봉은 222000으로 크게 느껴지지만, 메시라는 선수 한명을 제외하면 10배 가까이 확 낮아지는 것을 볼 수 있습니다. 그렇기에, 이런 이상..
EDA Study/Machine Learning Advanced
2023. 8. 7. 13:30