일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 3줄 논문
- 튜토리얼
- Image Segmentation
- DilatedNet
- Segmentation
- pytorch
- DFS
- 입문
- 파이썬
- 스택
- 엘리스
- TEAM EDA
- Python
- Machine Learning Advanced
- hackerrank
- 알고리즘
- 협업필터링
- 추천시스템
- 한빛미디어
- 나는 리뷰어다
- 프로그래머스
- 코딩테스트
- Object Detection
- eda
- TEAM-EDA
- MySQL
- Recsys-KR
- Semantic Segmentation
- 큐
- 나는리뷰어다
- Today
- Total
목록전체 글 보기 (287)
TEAM EDA
Author: Team-EDA 김현우,박주연,이주영,이지예,주진영,홍정아 NOTE : 아래의 자료는 Christian Thieli의 자료를 토대로 스터디원이 함께 배운 내용과 IDEA를 추가해서 만든 자료입니다. 첫번째 자료에서는 Vote가 가장높은 자료를 토대로 팀원들의 아이디어를 합쳐서 데이터 탐색을 진행하고, 두번째 자료에서는 다른사람들의 EDA자료를 통해서 아이디어를 더 발굴할 것 입니다. 마지막으로는 얻을 아이디어를 통해서 모델링을 하도록 하겠습니다. 1. 대회 소개 ( Introduction ) 2.데이터 설명 ( Data Description ) 3.패키지 설치 및 불러오기 ( Retrieving the Data ) 4.데이터 구조 확인 ( Data Structure ) 5.데이터 전처리 (..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bz54mX/btqx81UCk0M/Qd5YW7dBxRicJLziNERr8k/img.png)
Note: 이번 내용은 Jaeyoon Han님의 자료를 저희 스터디원이 진행 한 발표내용을 중심으로 추가적인 discussion을 정리했습니다. 의사결정나무의 개념과 추가적인 내용 및 파이썬 코드에 관한 부분은 아래의 링크를 참고하시기 바랍니다. 개인적으로 이해한 내용으로 작성한 자료니 틀린 부분이나 모르는 부분은 댓글로 남겨주시기 바랍니다!!! 의사결정나무는 마치 스무고개를 하듯이 Rules에 의해서 Predictors로 Target을 예측하는 모델입니다. 위의 내용에서 Play Golf라는 목적값을 예측하기 위해서 날씨(Outlook), Temp(온도) ,습도(Humidity), 바람(windy)의 4가지 요소를 나누는 것입니다. 오른쪽 그림에서 예를 들면 Outlook이 Sunny이고 Windy가 ..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/cFHKS6/btqyaqF4bIg/vg16yfycwmrlggfK8UGUKK/img.png)
Note: 이번 내용은 Jaeyoon Han님의 자료를 저희 스터디원이 진행 한 발표내용을 중심으로 추가적인 discussion을 정리했습니다.회귀분석의 개념과 추가적인 내용 및 파이썬 코드에 관한 부분은 아래의 링크를 참고하시기 바랍니다. 개인적으로 이해한 내용으로 작성한 자료니 틀린 부분이나 모르는 부분은 댓글로 남겨주시기 바랍니다!!! 링크 : http://blog.naver.com/choco_9966/221254266558 목차 1. 지도학습/비지도학습/강화학습의 개념 2. 선형회귀법(Linear Regression) 3. 선형회귀법 실습 with R 1. 지도학습/비지도학습/강화학습의 개념 지도학습 (Supervised Learning) 목적값을 알고있는 data를 가지고 기계학습 알고리즘을 진..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/Ovfbp/btqygjfm2Ez/gjKYGUBkA4Z9urCyKkzU30/img.png)
기간 : 2018.03 ~ 2018.06 멤버 : 김현우, 류지승 결과 : 406/3946(11%) 중간발표 : 데이터 탐색 최종발표 : 변수생성부터 모델링 분석 내용 : - 중간발표 : 데이터 탐색 - 최종발표 : 피쳐엔지니어링 ~ 모델링
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/dy6Ekf/btqxTLw60aJ/LwERK221Qb1uYaXeKMHuYK/img.png)
0. 들어가며 위 대회는 데이콘에서 열린 4차 대회입니다. 직방에서 주어진 아파트 실거래가를 바탕으로 rmse를 최소화하는게 목표입니다. 대회 참여 기간은 2018.11.12 ~ 2019.1.31 입니다. 저희팀은 public score 3등 / private score 1등으로 우승을 했습니다. 분석의 내용은 데이터 탐색 / 모델링 두가지 부분으로 나뉘게 되며 모델링은 이어지는 글에 작성하겠습니다. 1. 서론 통계청 2015년 자료에 의하면 일반적인 한국인의 절반(48.1%)은 아파트에 살고 있습니다. 그들은 아파트 주거 선호도가 매우 높고 또한 부의 증식 수단으로 아파트 가격에 관심이 많습니다. 이번 대회의 이번 대회의 데이터 제공자는 직방입니다. 직방은 부동산 정보의 비대칭성과 불투명성을 해소하기 ..
작년까지만 해도 블로그활동을 열심히 했는데 캐글, 공모전, 각종 대회에 치여살면서 블로그활동을 못한 것 같습니다. 이제부터라도 그동안 해왔던 활동들을 하나씩 정리해보려고 합니다. 공모전 참여 - 네이버 2018 DataScience Competition - Dacon 4th competition : 직방 실거래가 예측 - Dacon 5th competition : 시각화 경진 대회 - Dacon 8th competition : 금융 시각화 경진 대회 - 2019년도 L'point - 카카오 아레나 - 2018 빅콘테스트 - 2019 빅콘테스트 캐글 참여 - Talkingdata adTracking - Home credit - Google Revenue Prediction - Elo merchant - u..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/NU3bS/btqwVUIqSfW/8m6Aiy2LSOr3Qq49fMKV3k/img.png)
본 포스터는 길벗에서 책을 지원받아 작성한 리뷰 포스터입니다. 먼저 저는 비전공자이고 책의 코드인 Keras는 조금만 아는 상황입니다. 딥러닝은 텐서플로우로 입문해서 1년 가까이 공부하고 있지만 아직 딥러닝을 잘 못하는 학생입니다. 1. 책소개 케라스 창시자에게 배우는 딥러닝은 YES24 기준으로 평점9인 딥러닝교재입니다. 번역은 박해선님으로 핸즈온 머신러닝, 머신 러닝 교과서 with 파이썬, 사이킷런, 텐서플로, 파이썬 라이브러리를 활용한 머신러닝 등 유명한 책들을 많이 번역하신분으로 번역 자체는 믿고 봐도 무방합니다. 책의 가격은 33,000원으로 다른 책에 비해서 싼 가격은 아니고 최신의 책도 아니지만 캐글 코리아방이나 다른 톡방에서 딥러닝 교재를 추천받았을 때 한 손안에 뽑히는 책입니다. 저자의..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/cdwpIM/btqwfl7ksHu/HrOefi5xBBPdVrJGSd2tSk/img.png)
Preprocessing Feature Selection with variance KERNEL PCA Try and Fail : PCA, SVD, AutoEncoder, DAE etc Feature Engineering We used the following three methods to make variable of the distribution of the dataset. GMM_PRED GMM_SCORE HIST_PRED By the way, one of the mistakes I found was that GMM_PRED and GMM_SCORE would increase their score if they were duplicated. The results below are still a mys..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/cVULyi/btqwb19EVz6/Mg5AxxClMcxGBZ9LkWoDJ0/img.png)
본 포스터는 인사이트에서 책을 지원받아 작성한 리뷰 포스터입니다. 먼저 저는 비전공자이고 책의 코드인 C++은 전혀 모르는 상황이고 프로그래밍은 2년 정도 알고리즘은 작년에 3달 정도 공부한 학생입니다. 먼저 책을 읽고 난 느낌부터 말하자면, (1) C++을 전혀 모르시는 분 (2) 공부 의지가 약하신 분한테는 추천드리지 않고 (1) 프로그래밍 대회를 나가고 싶은 분 (2) C++ 코드의 성능을 높이고 싶은 분들한테는 적극적으로 추천합니다. 그 이유는 아래에 내용 부분에서 설명해 드리도록 하겠습니다. 1. 책 소개 는 다른 책들과는 다르게 경진 프로그래밍 대회에 참여해서 성적을 거둘 수 있도록 하는 가이드 책입니다. 300페이지에 걸쳐서 (1) 효율적 코드 작성 (2) 기초 알고리즘 (3) 고급 알고..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/FD5xV/btquDAMJIcp/olZmHmQElBjmePzIJa5M4K/img.png)
이번 Lecture3에서는 지난Lecture2(https://eda-ai-lab.tistory.com/122)에 이어서 Word window Classification과 NN에 대해 알아보도록 하겠습니다. 지난번과 마찬가지로 파리의 언어학도블로그의 글을 토대로 내용을 추가하였습니다. 일반적으로 우리는 training dataset을 i=1부터 N까지 xi라는 inputs과 yi라는 output(label or class)에 대해 가지고 있습니다. nlp에서는 xi는 단어나 문장, 문서를 의미하고 yi는 classes일수도 words나 다른 것들일 수도 있습니다. 위의 데이터를 ML/ Deep Learning 방법으로 분류의 과정을 거치게 됩니다. 분류는 아래의 그림처럼 비슷한 비슷한 Output끼리 모이..