일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- Segmentation
- 프로그래머스
- DilatedNet
- 알고리즘
- Python
- 나는리뷰어다
- Image Segmentation
- 엘리스
- TEAM EDA
- 3줄 논문
- 협업필터링
- eda
- 한빛미디어
- 파이썬
- 추천시스템
- 코딩테스트
- 튜토리얼
- MySQL
- DFS
- Object Detection
- 입문
- hackerrank
- TEAM-EDA
- Recsys-KR
- 스택
- pytorch
- Machine Learning Advanced
- 큐
- Semantic Segmentation
- 나는 리뷰어다
- Today
- Total
목록EDA Project (26)
TEAM EDA
기간 : 2018.07.01 ~ 2018.07.29 멤버 : 김현우, 박주연, 이주영 데이터 : Favorita Grocery Sales ( https://www.kaggle.com/c/favorita-grocery-sales-forecasting ) 전통적인 수요 예측 모델과 최신 모델 사이의 성능비교 Favorita Grocery Sales Data를 통해 0. Overview 유통업체의 경우 정확한 수요예측은 과거부터 중요한 이슈 중 하나이다. 과거에는 linear regression, logMA 모델이 많이 쓰였지만 최근에는 LSTM, LightGBM등의 모델을 사용하는 추세이다. 이에 대해 전통적인 수요예측 모델과 최신 모델 간의 성능에 비교 분석을 진행하였다. 다음은 분석의 진행 방향이다. 정..
기간 : 2018.03 ~ 2018.06 멤버 : 김현우, 류지승 결과 : 406/3946(11%) 중간발표 : 데이터 탐색 최종발표 : 변수생성부터 모델링 분석 내용 : - 중간발표 : 데이터 탐색 - 최종발표 : 피쳐엔지니어링 ~ 모델링
0. 들어가며 위 대회는 데이콘에서 열린 4차 대회입니다. 직방에서 주어진 아파트 실거래가를 바탕으로 rmse를 최소화하는게 목표입니다. 대회 참여 기간은 2018.11.12 ~ 2019.1.31 입니다. 저희팀은 public score 3등 / private score 1등으로 우승을 했습니다. 분석의 내용은 데이터 탐색 / 모델링 두가지 부분으로 나뉘게 되며 모델링은 이어지는 글에 작성하겠습니다. 1. 서론 통계청 2015년 자료에 의하면 일반적인 한국인의 절반(48.1%)은 아파트에 살고 있습니다. 그들은 아파트 주거 선호도가 매우 높고 또한 부의 증식 수단으로 아파트 가격에 관심이 많습니다. 이번 대회의 이번 대회의 데이터 제공자는 직방입니다. 직방은 부동산 정보의 비대칭성과 불투명성을 해소하기 ..
description 이번 대회의 스폰서인 뱅크샐러드는 통합 자산조회, 맞춤형 자산관리, 금융상품 추천 등의 서비스를 제공하는 회사입니다. 또 마이데이터 사업(표준화된 정보 제공 방식을 통해 데이터의 주체인 국민, 즉 개인이 스스로 정보를 제공하고 관리할 수 있도록 하는 것을 말합니다.)을 시작으로 정부의 데이터 산업 활성화 전략에 앞장서 많은 사람들이 금융을 쉽게 알고, 부담없이 접근할 수 있도록 노력하고 있으며, 이러한 일환으로 이번 대회를 후원하게 되었습니다. 5회 대회는 1회 대회의 소상공인 신용카드 거래 내역 데이터를 사용하여 1회 대회에서 다 보여주지 못한 인사이트 발굴 및 시각화 대회를 진행합니다. R, Python의 시각화 패키지 및 라이브러리 등을 활용하여 데이터와 비즈니스를 보다 쉽게 ..
Google Analytics Customer Revenue PredictionPredict how much GStore customers will spend 대회 목적 80/20 규칙은 많은 비즈니스에서 입증되었습니다. 적은 수의 고객 만이 대부분의 수익을 창출합니다. 따라서 마케팅 팀은 홍보 전략에 대한 적절한 투자를 유도해야합니다. RStudio는 팀을 위해 작업을 확장하고 공유 할 수있는 R 및 기업용 제품을위한 무료 및 개방형 도구 개발자로, Google Cloud 및 Kaggle과 파트너 관계를 맺어 철저한 데이터 분석에서 얻을 수있는 비즈니스 영향을 보여줍니다. 이 경쟁에서 고객 당 수익을 예측하기 위해 Google Merchandise Store (Google 판매원이 판매되는 GStore..
이번 EDA 2기 첫 프로젝트로 진행했던 kaggle의 House Prices: Advanced Regression Techniques(https://www.kaggle.com/c/house-prices-advanced-regression-techniques)에 대한 분석 보고서입니다. 추가적으로 해당 내용에 대해 결측치 처리와 모델의 변수 중요도에 대한 해석이 들어간 자료는 [Kaggle] House Prices: Advanced Regression Techniques(2)를 참고하시기 바랍니다. 집의 가격을 예측하는 문제로 사용한 모델은 ridge,lasso, Elastic Net, LightGBM, Xgboost입니다. 최종적으로 성적을 올리기위해 다른 사람들의 결과물을 반영해 추가적으로 앙생블을 ..