House Prices: Advanced Regression Techniques

이번 자료의 분석 내용은 다음의 링크에 정리해두었습니다. 

 

 

House Prices: Advanced Regression Techniques

이번 EDA 2기 첫 프로젝트로 진행했던 kaggle의 House Prices: Advanced Regression Techniques(https://www.kaggle.com/c/house-prices-advanced-regression-techniques)에 대한 분석 보고서입니다. 코드(커널)은..

eda-ai-lab.tistory.com

피드백 

김미실버(https://brunch.co.kr/@gimmesilver/)님이 피드백해주셨습니다. 

  • 1. 제 생각에 이 문제에서 가장 핵심은 결측치 처리라고 생각합니다. 따라서 결측치를 처리하는 기법에 대해 좀 더 집중해보시면 좋을 것 같습니다.

  • 2. 탐사 분석을 잘 하셨는데 더 나아가 각 변수들이 집값에 미치는 영향을 하나씩 비교하기 보다는 여러 변수의 상호 작용을 분석해 보시면 더 훌륭한 자료가 될 것 같습니다. 또한 다른 변수의 영향력을 없애기 위해선 집값과 변수 간의 관계가 아니라 모델의 잔차와 변수 간의 관계를 보는 것도 좋은 방법입니다.

  • 3. 모델의 결과를 해석하는 방법에 대해 좀 더 공부해 보시면 좋을 것 같습니다. 변수 중요도에 대해서 정리를 하셨는데 좀 더 나아가 Partial Dependence Plot 등을 활용해 보시면 훨씬 훌륭한 자료가 될 것 같네요. 모델 해석 기법에 대해서는 https://christophm.github.io/interpretable-ml-book/agnostic.html 에 잘 정리되어 있습니다. 

피드백을 반영한 수정본 

  • 링크 : 작성중... 

댓글(1)

  • 2019.09.10 16:06 신고

    피드백 원문

    네 안녕하세요. 우선 석사생 이상을 원한다는 건 의도가 잘못 전달된 것 같습니다. 여러 지원자들을 비교해 보면 전반적으로 석사 졸업생이 포트폴리오나 이력상에 나와 있는 스펙이 좀 더 풍부해서 상대적으로 유리하다 것이지 석사생을 원한다는 건 아닙니다. 이에 대해서는 제가 며칠 전에 쓴 https://brunch.co.kr/@gimmesilver/49 을 읽어 보시면 좋겠습니다.

    보내 주신 분석 자료는 잘 봤습니다. 독학하신다고 했는데 이 정도면 꽤 높은 수준이라고 생각합니다. 훌륭하십니다. 다만 좀 더 발전하시길 바라는 마음에 몇 가지 피드백 드리자면,

    1. 제 생각에 이 문제에서 가장 핵심은 결측치 처리라고 생각합니다. 따라서 결측치를 처리하는 기법에 대해 좀 더 집중해보시면 좋을 것 같습니다.

    2. 탐사 분석을 잘 하셨는데 더 나아가 각 변수들이 집값에 미치는 영향을 하나씩 비교하기 보다는 여러 변수의 상호 작용을 분석해 보시면 더 훌륭한 자료가 될 것 같습니다. 또한 다른 변수의 영향력을 없애기 위해선 집값과 변수 간의 관계가 아니라 모델의 잔차와 변수 간의 관계를 보는 것도 좋은 방법입니다.

    3. 모델의 결과를 해석하는 방법에 대해 좀 더 공부해 보시면 좋을 것 같습니다. 변수 중요도에 대해서 정리를 하셨는데 좀 더 나아가 Partial Dependence Plot 등을 활용해 보시면 훨씬 훌륭한 자료가 될 것 같네요. 모델 해석 기법에 대해서는 https://christophm.github.io/interpretable-ml-book/agnostic.html 에 잘 정리되어 있습니다.

    감사합니다.

Designed by JB FACTORY