관리 메뉴

TEAM EDA

2019.09.17 회의 본문

강의 내용 정리/종합설계

2019.09.17 회의

김현우 2019. 9. 26. 17:35

2019.09.17 회의

  1. 아파트 실거래가 데이터를 활용하여 이상치 탐지

    • 거래내역

    • 현재 부동산 거래를 하면 계약 체결일부터 60일 이내에 관할 시군구에 실거래가 신고를 해야 한다. 그런데 신고를 허위로 하는 경우가 많다. 2016년에만 실거래가 신고 위반이 3884건이나 됐다. 지난해에도 6월까지 신고 위반이 2748건이나 됐다. 특이한 점은 탈세를 노린 '다운 계약(실거래가 보다 낮은 금액으로 신고)'이 많지만, 가격을 올려 신고하는 '업계약'도 매년 200~300건씩 적발된다는 점이다. 이 자료는 김영진 더불어민주당 의원이 지난해 국정감사 때 국토부에서 제출받아 공개한 내용이다.

      [출처: 중앙일보] " 부동산 계약 취소해도 실거래가 그대로 남아" ...자전 거래 의혹에 신뢰 추락한 실거래가 공개시스템 (https://news.joins.com/article/22306294)

    문제 상황 : 아파트투기 및 탈세의 원인이 되고 있는 이중계약서 작성 등 잘못된 관행을 시정함으로써 부동산거래를 투명화하기 위해서 만든 정책. 하지만

    • 집값 담합에 악용하는 사례

      • 실거래가를 허위로 부풀려 신고한 뒤 계약해지를 신고하지 않음

      • 중개업소 관계자나 매도자가 실거래가를 높이기 위해 혼자 허위로 계약서를 써 실거래가를 신고한 뒤 계약을 파기

    • 사용 예)

      • 감정평가법인 관계자는 “비슷한 기간에 평균 시세에서 10% 이상 차이가 나면 이상 가격으로 본다”

      [출처: 중앙일보] " 부동산 계약 취소해도 실거래가 그대로 남아" ...자전 거래 의혹에 신뢰 추락한 실거래가 공개시스템

2019.09.17 회의

 

 

이상치 탐지라는게 어떤 알고리즘을 사용해서 탐지를 하는 시스템이기 떄문에 아파트 데이터를 활용해서 넣어보고 좀 더 할 여유가 있으면 다른 카테고리의 토지까지 확장.

 

 

  • 이상치정의 :

    • 수기작성으로 인한 오류

    • 계약해지에 의한 거래

    • 과세를 피하기 위해서 가격을 줄여서 올림.

  • 시계열에서 unsupervised learning 을 진행하겠음.

  • 방법론.

    • 찾아보기.

  • 교수님 생각.

    • 여러가지 방법을 사용할 수 있는데, 흥미나 도전측면에서는 시계열 데이터를 정상적이라고 판단할 수 있는 기간에 가격에 대해 이거를 학습을 시키는데, 모형을 가지고 학습을 하는 것도 방법이고, 정상 구간이라고 판단했던 것을 차원을 축소

      • 차원축소 : 오토인코더(추세를 반영해서 고려해보기), 스파시코딩(?) - 적절하지 않은 것 같음!!!

      • 정보모형 :

    • 정상이라고 모든 데이터로 학습했을 떄, 이상치가 들어오면 벗어나니깐 ~ 있는데... 이거의 문제점등에 대해서 토론해보기.

    • 사용할 방법들의 후보들에 대해서 만들어두고, 그것들 방법을 각각 적용해보면 어떤결과가 나올지에 대해서 세우기.

    • 아파트별, 지역별로 데이터를 받는 작업 한사람 진행.

    • 방법들 여러가지에 대해 디스커션해보고 생각해보기. 어떤 한 값이 이상치인지 판단하기위해서는 오토인코더는 좀 안어울리는것 같음.

    • 목적 : 건별로 이상치를 찾고 싶다.

      • 범위내에서 벗어나는것 찾아야 함. 

      • 트렌드가 반영되야 함. 
    • 다음주, 어떻게 분석을 해볼지에 대한 방법을 디스커션해보고 그것에 대해 디스커션 하기.

    • 해야할 일.

      • 데이터를 어느정도 기간으로 설정할지에 대해 필요. (데이터확보)

      • 건별 이상치 감지 방법들 디스커션해서 오기. (먼저 자료조사해보고 생각해보는 작업이 필수적일 듯. (참고자료))