일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 |
- 스택
- 큐
- 한빛미디어
- 입문
- 튜토리얼
- Semantic Segmentation
- 코딩테스트
- Python
- MySQL
- Segmentation
- 프로그래머스
- Recsys-KR
- hackerrank
- Image Segmentation
- 협업필터링
- 알고리즘
- TEAM EDA
- Object Detection
- eda
- 3줄 논문
- 추천시스템
- DFS
- TEAM-EDA
- 나는 리뷰어다
- DilatedNet
- 나는리뷰어다
- Machine Learning Advanced
- 파이썬
- 엘리스
- pytorch
- Today
- Total
목록전체 글 (287)
TEAM EDA

[빅콘테스트2019] 데이터탐색을 토대로 얻은 아이디어를 통해서 모델링을 한 과정입니다. 1. 전처리 [빅콘테스트2019] 데이터탐색에서 확인한 내용을 토대로 전처리를 한 부분은 아래와 같습니다. Train에만 존재하는 이벤트의 영향을 줄이기. 통신오류로 인해 낚시시간 > 플레이시간 혹은 30레벨 미만인데 낚시시간이 있는 경우 조정. Train과 Test의 플레이타임 등 스케일이 다른 것을 조정하기 위해서 파일별로 Normalization. 2. 28일의 정보를 1주차, 2주차, 3주차, 4주차의 평균으로 계산 기존의 데이터는 1일부터 28일까지 제공되었고, 이를 그대로 학습하게 될 경우 유저별로 다른 접속패턴에 의해서 모델이 안좋을 수 있습니다. 예를 들어서, 직장인의 경우 주말에만 접속할 가능성이 높..

빅콘테스트 2019 주제 : 게임 활동 데이터를 활용하여 “게임유저 잔존가치를 고려한 고객 이탈 예측 모형” 개발 엔씨소프트에서 제공하는 ‘리니지’ 고객 활동 데이터를 활용하여 향후 고객 이탈 방지를 위한 프로모션 수행 시 예상되는 잔존가치를 산정하는 예측 모형 개발 기간 : 2019.07.17 ~ 2019.09.10 0. Overview 데이터 activity: 캐릭터별 활동이력. combat : 캐릭터별 전투이력 pledge : 소속 혈맹 전투 활동 정보 trade : 거래 이력 payment : 결제 이력 day, server, acc_id, char_id 4가지에 의해서 결합되는 형태이고, payment의 경우는 char_id가 따로 없이 char_id의 모든합을 acc_id의 payment에 넣..

카카오 아레나 후기 안녕하세요. TEAM-EDA라는 팀명으로 대회에 나간 김현우라고 합니다. 다른분들에게 도움이 되고자 저희팀의 분석과정및 후기를 정리했습니다. 동기 카카오 추천팀 입사지원 혜택 추천시스템 분야에 대한 도전 분석과정 참고자료의 분석 카카오 추천시스템팀의 분석 브런치 / 유튜브 플랫폼 분석 EDA 진행 베이스라인 생성 및 모델 개선 베이스라인 최종 모델 코드 어려움 추천시스템이라는 생소한 분야 Github통해서 제출하는 점 대회기간이 한달로 짧은 점 소숫점까지 같을 때 sort의 순서가 바뀌는 문제 3가지 스코어를 모두 만족해야 하고 점수가 랭크로 체점되는 점 느낀점 대회기간이 짧고 하루에 제출이 10개까지 가능한 점에서 대회가 되게 속도감이 있었습니다. 그러다보니 많은 실험을 하고 분석하..
TEAM-EDA Kakao Arena Brunch Recommendation 설명 : 베이스라인을 토대로 계속 모델을 개선해서 만든 최종 모델입니다. 링크 : https://github.com/yeonmin/team-eda-brunch-recommendation 점수 : (공개) 0.095604 (3) 0.193543 (4) 10.921002 (3) / (파이널) 0.096109 (3) 0.191240 (8) 11.215200 (3) 폴더 구조 카카오 베이스라인 구조와 동일. res 폴더는 아래와 같이 폴더 구성 submission 폴더에 recommend.txt 파일 생성됨 . ├── res │ ├── predict │ │ └── test.users │ ├── read │ │ ├── 2018100010..
4. What is the Kakao Team Baseline ? 먼저, 우리팀의 베이스라인을 만들기 전에 주최측에서 만든 베이스라인을 확인하도록 하겠습니다. 주최측 베이스라인 링크 README.md의 파일 내용을 읽어보면, 추천방식은 Rule-based기반의 2월1일부터 3월1일까지 가장 인기가 좋았던 글 100건을 추천하는 방식이고 과정은 아래와 같습니다. 학습데이터와 개발데이터를 나눔. 개발데이터에서 평가할 사용자 리스트를 추출. 학습데이터로 만든 모델을 통해서 2에서 뽑은 사용자의 평가점수를 매김. 모든데이터를 학습데이터로 사용해서 3000명의 제출 모델을 만듬. 결론적으로, 제출물의 경우 아래와 같이 모든 유저 3000명이 똑같은 추천 결과물을 가지게 됩니다. -#user_1 @bakchacru..