일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 나는리뷰어다
- 한빛미디어
- 나는 리뷰어다
- MySQL
- 3줄 논문
- 큐
- pytorch
- Image Segmentation
- 코딩테스트
- 튜토리얼
- TEAM EDA
- hackerrank
- 알고리즘
- Machine Learning Advanced
- 프로그래머스
- DFS
- 입문
- 파이썬
- Recsys-KR
- 협업필터링
- 추천시스템
- Semantic Segmentation
- Segmentation
- DilatedNet
- TEAM-EDA
- eda
- 엘리스
- 스택
- Python
- Object Detection
- Today
- Total
목록EDA Study (202)
TEAM EDA
본 자료는 Elice Academy에서 진행한 SQL 기초라는 과목을 정리한 자료입니다. 목차 GROUP BY HAVING INNER JOIN LEFT OUTER JOIN RIGHT OUTER JOIN 1. GROUP BY 데이터를 GROUP 지어서 정보를 확인할 때 사용하는 명령어입니다. 예를 들어, 대여 정보가 저장되어있는 rental 테이블에서 각 회원이 책을 몇 번 대여하였는지 검색해보려고 할 때 사용합니다. GROUP BY 절의 기본 문법으로는 SELECT 검색할 컬럼 FROM 테이블 GROUP BY 기준 컬럼입니다. 실습 1. 데이터 그룹 짓기 문제 : rental테이블에는 어떤 사람이 어떤 책을 빌려 갔는지 저장되어있습니다. 이 정보를 이용해서 어떤 사람이 몇 권의 책을 빌려 갔는지 확인하려..
본 자료는 Elice Academy에서 진행한 SQL 기초라는 과목을 정리한 자료입니다. 목차 COUNT LIMIT SUM과 AVG MIN와 MAX 1. COUNT COUNT란 검색한 결과의 데이터의 개수를 가져오는 명령어입니다. 예를 들어, 책 정보를 저장하는 book 테이블에서 전체 책 수를 조회해보려고 할 때 사용할 수 있습니다. 문법으로는 SELECT COUNT(컬럼) FROM 테이블입니다. 만일 검색할 데이터에 *을 입력하면 모든 데이터가 검색이 됩니다. (전체의 row의 수가 출력이 됩니다. ※참고 컬럼 자리에 *을 넣을 경우 모든 컬럼에 대한 값을 볼 수 있습니다. count의 경우 NULL은 개수에 포함되지 않습니다. 실습 1. 데이터 수 카운트하기 문제 : 도서관의 전체 책의 수를 조회해..
본 자료는 Elice Academy에서 진행한 SQL 기초라는 과목을 정리한 자료입니다. 목차 다양한 조건 - WHERE LIKE 데이터 정렬 - ORDER BY 데이터 삽입 - INSERT 데이터 수정 - UPDATE 데이터 삭제 - DELETE 1. 다양한 조건 - WHERE LIKE LIKE는 특정 문자가 포함된 문자열을 찾고 싶을 때 사용하는 명령어입니다. 예를 들어, 책 정보를 저장하는 book 테이블에서 제목에 '왕자'로 끝나는 책을 검색하고 싶을 때 사용할 수 있습니다. LIKE 조건의 기본 형태는 WHERE 조건절의 뒤에 들어가는 형태입니다. 구성은 아래와 같이 3가지가 있습니다. %문자열 : 문자열로 끝나는 값 조회 문자열% : 문자열로 시작하는 값 조회 %문자열% : 문자열이 포함된 값..
본 자료는 Elice Academy에서 진행한 SQL 기초라는 과목을 정리한 자료입니다. 목차 SQL 이란? 검색 - SELECT 조건 - WHERE 다양한 조건 - WHERE 1. SQL 이란? SQL이란 데이터베이스에서 데이터를 정의, 조작, 제어하기 위해 사용되는 명령어입니다. SQL의 구성요소로는 크게 3가지 데이터 정의어(DDL), 데이터 조작어(DML), 데이터 제어어(DCL)으로 구성됩니다. 데이터 정의어(DDL) : 데이터 베이스를 생성하거나 테이블을 만드는 언어 데이터 조작어(DML) : 데이터베이스에 저장된 데이터를 조회하거나 수정, 삭제하는 등의 역할을 하는 언어 데이터 제어어(DCL) : 사용자의 권한을 설정하는 언어 테이블이란 항상 이름을 가지고 있는 리스트로 데이터가 저장되어있는..
아래의 내용은 edwith에서 강의하는 주재걸 교수님의 [인공지능을 위한 선형대수] 강의 필기를 정리한 자료입니다. 핵심 키워드 스칼라(Scalar), 벡터(Vector) 그리고 행렬(Matrix) 열 벡터와 행 벡터(Row Vector, Column Vector) 벡터와 행렬의 연산 스칼라, 벡터 그리고 행렬은 선형대수의 값들을 표현하는 방식입니다. 스칼라의 경우 하나의 숫자로 표현하고, 벡터의 경우는 숫자들의 순서가 있는 리스트로 표현하고 행렬의 경우 배열이 모여서 값을 표현합니다.(하나의 배열로 이루어진 경우도 행렬이라고 할 수 있습니다.) 선형대수에서 중요한 점은 Vector의 표현은 기본적으로 Column vector을 기준으로 하는 점입니다. Column vector의 경우 헷갈리기 쉬운데, ..
원문 : https://www.kaggle.com/c/ieee-fraud-detection/discussion/108575#latest-624919 IEEE-CIS Fraud Detection Can you detect fraud from customer transactions? www.kaggle.com Feature Engineering Techniques Engineering features is key to improving your LB score. Below are some ideas on how to engineer new features. Create a new feature and then evaluate it with a local validation scheme to see if it..
Feature selection using target permutation (Null Importance) 아래의 글은 Olivier의 feature selection with null importances를 번역한 글입니다. 논문 https://academic.oup.com/bioinformatics/article/26/10/1340/193348 원문 링크 https://www.kaggle.com/ogrellier/feature-selection-with-null-importances 이 Notebook 파일은 다음의 논문 를 토대로 만든 자료입니다. kaggle의 Home Credit Default Risk 라는 대회에서 변수 제거를 하기 위해 만들어진 커널 입니다. Null Importance F..
원문 아티클 : Attn: Illustrated Attention Attn: Illustrated Attention GIFs를 활용한 기계번역(ex. 구글번역기)에서의 Attention 신경망을 활용한 기계 번역모델(NMT)이 나오기 전 수십 년 동안, 통계기반 기계 번역(Statistical Machine Translation)이 지배적인 모델이었습니다[9]. NMT는 거대한 단일 신경망을 구축하고 훈련합니다. 이러한 방식은 입력 텍스트를 읽고 번역을 출력하는 기계번역의 새로운 접근법입니다. [1]. 기계 번역모델의 선구 연구들은 Kalchbrenner and Blunsom (2013), Sutskever et. al (2014) 와 Cho. et. al (2014b)입니다. 여기서 더 익숙한 구조는 ..
Winning Tips on Machine Learning Competitions by Kazanova, Current Kaggle #3 Introduction 머신러닝은 교활합니다(?). 너가 얼마나 많은 책을 읽든지, 많은 문제를 풀고 튜토리얼을 끝냈든지 ~. 특히 너가 머신러닝에 일찍 접했을 수록. 그렇지 않니? 이번 포스트에서는, 너는 많은 사람들이 경험한 머신러닝모델을 생성하는 근본적인 팁에 대해 배울 것이다. 이 팁들은 Marios Michaildis (a.k.a Kazanova), 캐글 그랜드마스터, 2016년 5월 5일 현재 Current Rank #3에 의해 공유되었습니다.(참고로, 지금은 5등입니다) 영상 자료 - 유튜브 링크 슬라이드 자료 - 슬라이드쉐어 링크 질의 응답 자료 - 아래..
교재 : 데이터 분석 준 전문가 Adsp 2017 데이터 분석 1장. 데이터 분석 개요 2장. R프로그래밍 기초 3장. 데이터 마트 4장. 통계 분석 5장 정형 데이터 마이닝 4장. 통계 분석 - PCA 주성분 분석 : 기존의 상관성이 높은 변수들을 요약, 축소하여 선형결합으로 만드는 방법!!! = 차원을 축소하는 방법. Proportion of Variance : 변수가 설명하는 정도. 주성분1은 95.5%를 설명함. Cumulative Proportion : 위의 Proportion of Variance의 누적값. 위와는 다른 예시지만 Component Number의 수에 따라 변동성을 보여 줌. 위의 테이블은 2개의 변수 long과 diag가 주성분1과 2에 기여하는 가중치를 보여주는 부분. Com..