관리 메뉴

TEAM EDA

House Prices: Advanced Regression Techniques 본문

TEAM EDA /EDA 2기 ( 2018.10.03 ~ 2019.06.01)

House Prices: Advanced Regression Techniques

김현우 2019. 9. 10. 15:40

이번 자료의 분석 내용은 다음의 링크에 정리해두었습니다. 

 

 

House Prices: Advanced Regression Techniques

이번 EDA 2기 첫 프로젝트로 진행했던 kaggle의 House Prices: Advanced Regression Techniques(https://www.kaggle.com/c/house-prices-advanced-regression-techniques)에 대한 분석 보고서입니다. 코드(커널)은..

eda-ai-lab.tistory.com

피드백 

김미실버(https://brunch.co.kr/@gimmesilver/)님이 피드백해주셨습니다. 

  • 1. 제 생각에 이 문제에서 가장 핵심은 결측치 처리라고 생각합니다. 따라서 결측치를 처리하는 기법에 대해 좀 더 집중해보시면 좋을 것 같습니다.

  • 2. 탐사 분석을 잘 하셨는데 더 나아가 각 변수들이 집값에 미치는 영향을 하나씩 비교하기 보다는 여러 변수의 상호 작용을 분석해 보시면 더 훌륭한 자료가 될 것 같습니다. 또한 다른 변수의 영향력을 없애기 위해선 집값과 변수 간의 관계가 아니라 모델의 잔차와 변수 간의 관계를 보는 것도 좋은 방법입니다.

  • 3. 모델의 결과를 해석하는 방법에 대해 좀 더 공부해 보시면 좋을 것 같습니다. 변수 중요도에 대해서 정리를 하셨는데 좀 더 나아가 Partial Dependence Plot 등을 활용해 보시면 훨씬 훌륭한 자료가 될 것 같네요. 모델 해석 기법에 대해서는 https://christophm.github.io/interpretable-ml-book/agnostic.html 에 잘 정리되어 있습니다. 

피드백을 반영한 수정본 

  • 링크 : 작성중...