관리 메뉴

TEAM EDA

브런치 사용자를 위한 글 추천 대회 - 모델(2) 본문

EDA Project/카카오 아레나

브런치 사용자를 위한 글 추천 대회 - 모델(2)

김현우 2019. 9. 22. 19:52

TEAM-EDA Kakao Arena Brunch Recommendation

 

설명 : 베이스라인을 토대로 계속 모델을 개선해서 만든 최종 모델입니다.
링크 : https://github.com/yeonmin/team-eda-brunch-recommendation
점수 : (공개) 0.095604 (3) 0.193543 (4) 10.921002 (3) / (파이널) 0.096109 (3) 0.191240 (8) 11.215200 (3)

 

폴더 구조

카카오 베이스라인 구조와 동일.

 

  1. res 폴더는 아래와 같이 폴더 구성

  2. submission 폴더에 recommend.txt 파일 생성됨

.
├── res
│   ├── predict
│   │   └── test.users
│   ├── read
│   │   ├── 20181000100_2018...
│   │   └── ...
│   ├── magazine.json
│   ├── metadata.json
│   └── users.json
└── submission

실행 환경

 

  • python3.6

필요 라이브러리

 

  • numpy

  • pandas

  • tqdm

실행 방법

$> python inference.py

최종 결과물

./submission/recommend.txt

모델 설명

 

  • weekly_model : 내가 구독하는 작가 중, 가장 선호하는 작가의 위클리 매거진글을 추천. (단, 내가 보지 않은 글의 바로 1주 전과 2주 전은 무조건 봐야 함)

  • sereis_model : 내가 구독하는 작가 중, 가장 선호하는 작가의 매거진글을 추천. (단, 내가 보지 않은 글의 바로 1주 전과 2주 전은 무조건 봐야 함)

  • dont_weekly_model : 내가 구독하지 않는 작가 중, 가장 선호하는 작가의 위클리 매거진글을 추천. (단, 내가 보지 않은 글의 바로 1주 전과 2주 전은 무조건 봐야 함)

  • dont_series_model : 내가 구독하지 않는 작가 중, 가장 선호하는 작가의 매거진글을 추천. (단, 내가 보지 않은 글의 바로 1주 전과 2주 전은 무조건 봐야 함)

  • following_favor_many_read_model : 내가 구독하는 작가 중, 가장 선호하는 작가의 인기 글을 추천. (선호 : 작가의 글을 많이 읽음)

  • following_favor_repeat_read_model : 내가 구독하는 작가 중, 가장 선호하는 작가의 인기 글을 추천. (선호 : 작가의 글을 다양한 날 읽음)

  • variable_user_model : 다양한 사람이 많이 읽은 인기 글.

  • brunch_model : 브런치 공지글(151, 153).

  • regression_user_model : 3월의 글 중에서 사람들이 가장 많이 읽은 것 같은 구독하는 작가의 글.

  • correction_favor_model : 내가 한 번이라도 읽은 작가의 글 중에서 내가 좋아하는 작가이면서 다른 사람들도 많이 읽은 글.

  • most_read_article_model : 사람들이 가장 많이 읽은 글.