'분류 전체보기' 카테고리의 글 목록 (26 Page)

Notice

Recent Posts

Recent Comments

Link

« 2024/04 »
일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

Tags more

Archives

Today

Total

관리 메뉴

목록전체 글 보기 (287)

TEAM EDA

Lecture 2: Word Vectors and Word Senses

이번 Lecture2에서는 지난Lecture1(https://eda-ai-lab.tistory.com/120)에 이어 word2vec에 대해 자세히 알아보도록 하겠습니다. 그리고 counting 기법과 GloVe model에 대해서 살펴보도록 하겠습니다. 대부분의 내용은 파리의 언어학도의 글을 토대로 만들었습니다. 1. Review: Main idea of word2vec 지난 시간에 배운것부터 복습해보면, Word2vec는 one-hot-vector의 한계를 극복하려고 등장한 개념입니다. 중심단어가 주어졌을 때, 주변단어가 나타날 확률을 계산하고 window내의 이 확률의 곱을 최대화 하도록 학습을 하게 됩니다. Objective function은 위의 P(o|c)가 되고, 우변의 v는 입력층과 은닉층..

강의 내용 정리/CS224N 2019. 4. 14. 19:40

Lecture 1 – Introduction and Word Vectors

CS224N의 1주차 강의 Introduction and Word Vectors의 강의 순서입니다. 기본적인 인간의 언어에 대해 먼저 이야기를 하고 Wor2Vec와 Gensim에 대해서 이야기를 진행합니다. 1. The course CS224n의 강의를 통해서 배울 수 있는 것은 아래와 같습니다. 첫째로, attention과 같은 최근 deep learning의 기법들을 배우고 이해할 수 있습니다. 두번째로, 사람의 언어가 왜 이해하기 어려운지 그리고 어떻게 생산해야 하는지, 이해해야 하는지에 대해 알 수 있습니다. 마지막으로, PyTorch를 이용하여 자연어처리의 많은 문제들을 해결할 능력을 기를 수 있습니다. 2. Human language and word meaning 우리는 단어의 의미를 어떤식으..

강의 내용 정리/CS224N 2019. 4. 13. 17:59

Chapter 4 : 위키피디아 외부 링크를 이용한 추천 시스템 구축

Note : 이 포스터는 (주)느린생각의 지원을 받아 딥러닝 쿡북이라는 교재로 스터디를 하고 작성하는 포스터입니다. 코드는 아래의 저자 링크(https://github.com/Dosinga/deep_learning_cookbook)를 활용하였습니다. 목차 4.1 데이터 수집하기 4.2 영화 임베딩 학습하기 4.3 영화 추천 시스템 만들기 4.4 단순 영화 평점 예측 이번 챕터에서는 위키피디아의 외부 링크를 기반으로 데이터를 수집할 것 입니다. 그리고 이를 바탕으로 임베딩 훈련을 시킨 후 SVM 모델로 간단한 추천시스템을 구현해보도록 하는 작업을 하겠습니다. 4.1 데이터 수집하기. 먼저 위키피디아의 덤프 페이지에서 최신 덤프 데이터를 수집합니다. # https://dumps.wikimedia.org/en..

책 내용 정리/딥러닝 쿡북 2019. 4. 7. 11:36

Chapter 3 : 단어 임베딩을 사용하여 텍스트 유사성 계산하기

Note : 이 포스터는 (주)느린생각의 지원을 받아 딥러닝 쿡북이라는 교재로 스터디를 하고 작성하는 포스터입니다. 이론은 딥러닝을 이용한 자연여 처리 입문(https://wikidocs.net/22660) 교재를 사용하였고 코드는 딥러닝 쿡북이라는 교재를 사용하였습니다. 단어 임베딩이란? 이 장에서는 단어 임베딩을 사용해 텍스트 간 유사도를 계산하는 방법을 설명합니다. 단어 임베딩은 원-핫 인코딩과는 다른방식으로 단어를 공간상의 벡터로 표현하는 기술 입니다. 단어 임베딩을 사용할 경우 비슷한 의미가 있는 단어들이 서로 가까운 곳에 나타나게 됨으로써 벡터 상에 단어의 의미를 포함시킬 수 있습니다. 이번 챕터에서는 단어 임베딩의 방법으로 구글의 Word2Vec을 사용할 것입니다. Word2Vec은 '비슷한..

책 내용 정리/딥러닝 쿡북 2019. 3. 10. 08:28

ADSP 3과목 정리내용 - 5장: 정형 데이터 마이닝

교재 : 데이터 분석 준 전문가 Adsp 2017 데이터 분석 1장. 데이터 분석 개요 2장. R프로그래밍 기초 3장. 데이터 마트 4장. 통계 분석 5장 정형 데이터 마이닝 4장. 통계 분석 - PCA 주성분 분석 : 기존의 상관성이 높은 변수들을 요약, 축소하여 선형결합으로 만드는 방법!!! = 차원을 축소하는 방법. Proportion of Variance : 변수가 설명하는 정도. 주성분1은 95.5%를 설명함. Cumulative Proportion : 위의 Proportion of Variance의 누적값. 위와는 다른 예시지만 Component Number의 수에 따라 변동성을 보여 줌. 위의 테이블은 2개의 변수 long과 diag가 주성분1과 2에 기여하는 가중치를 보여주는 부분. Com..

EDA Study/머신러닝 2019. 3. 2. 16:23

Elo Merchant Category Recommendation - Help understand customer loyalty

개요 이번 자료는 Elo Merchant Category Recommendation - Help understand customer loyalty(https://www.kaggle.com/c/elo-merchant-category-recommendation)의 데이터 탐색부터 모델링 작업까지의 과정을 정리한 자료입니다. 마을의 익숙지 않은 지역에서 배고파하며 개인의 취향에 따라 적절한 순간에 레스토랑 추천을 받았다고 상상해보십시오. 이 추천서는 아주 가까이에 있는 지역의 신용 카드 제공 업체로부터 할인 된 가격으로 제공됩니다! 현재 브라질의 최대 결제 브랜드 중 하나 인 Elo는 카드 회원에 대한 프로모션 또는 할인을 제공하기 위해 상인과의 파트너십을 구축했습니다. 그러나 이러한 프로모션은 소비자 또는 ..

EDA Study/캐글 2019. 3. 2. 15:16

Chapter 01 도구와 기술

Note : 이 포스터는 (주)느린생각의 지원을 받아 딥러닝 쿡북이라는 교재로 스터디를 하고 작성하는 포스터입니다. 동일한 교재로 공부하는 사람들에게 도움이 되었으면 좋겠습니다. 포스터 자체는 처음하는 사람들을 위한게 아니라 사전지식을 알고 있다는 전제하에서 코드구현과 하면서 생긴 의문점 등을 위주로 정리하도록 하겠습니다. 요약 : Chapter 01의 대략적인 내용은 신경망을 학습하면서 배우게 될 용어와 데이터를 구하는 사이트들 기본적인 테크닉들에 대해서 설명하고 있습니다. 하지만 중급자들을 위한 책답게 자세한 설명은 나와 있지 않고 간단한 용어정리 위주로 되어 있습니다. 개인적으로 이 부분은 뻈어도 크게 무방하지 않았나 싶은 마음은 있습니다. 그래도 책에 나왔으니 가볍게 정리하고 넘어가도록 하겠습니다..

책 내용 정리/딥러닝 쿡북 2019. 2. 23. 10:15

[5차대회] Data Visualization Challenge 평가기준

description 이번 대회의 스폰서인 뱅크샐러드는 통합 자산조회, 맞춤형 자산관리, 금융상품 추천 등의 서비스를 제공하는 회사입니다. 또 마이데이터 사업(표준화된 정보 제공 방식을 통해 데이터의 주체인 국민, 즉 개인이 스스로 정보를 제공하고 관리할 수 있도록 하는 것을 말합니다.)을 시작으로 정부의 데이터 산업 활성화 전략에 앞장서 많은 사람들이 금융을 쉽게 알고, 부담없이 접근할 수 있도록 노력하고 있으며, 이러한 일환으로 이번 대회를 후원하게 되었습니다. 5회 대회는 1회 대회의 소상공인 신용카드 거래 내역 데이터를 사용하여 1회 대회에서 다 보여주지 못한 인사이트 발굴 및 시각화 대회를 진행합니다. R, Python의 시각화 패키지 및 라이브러리 등을 활용하여 데이터와 비즈니스를 보다 쉽게 ..

EDA Project/Dacon 2018. 12. 28. 13:38

Analysis of Variance (분산 분석)

참고 : 이 내용은 Sheldon_Ross의 Introduction to probability and statistics의 ch10을 번역, 정리한 내용입니다. ONE-WAY-ANALYSIS OF VARIANCE TWO-FACTOR ANALYSIS OF VARIANCE TWO-WAY ANALYSIS OF VARIANCE WITH INTERACTION 예제 1번 A college administrator claims that there is no difference in first-year grade point averages for students entering the college from any of three different city high schools. The following data g..

EDA Study/머신러닝 2018. 12. 23. 13:13

선형 회귀 : Linear Regression

참고: 아래의 포스터 내용은 Sheldon_Ross - Introduction to Probability 교재의 ch9 : Regression을 정리한 자료입니다. 9.1 Introduction 많은 분야에서 사람들은 *변수들간의 관계*를 알고 싶어 했습니다. 고민 끝에 그들은 단순하면서도 강력한 방법을 고안해내게 되고 이것이 바로 선형회귀(linear regression)입니다. 선형 회귀의 공식은 아래와 같습니다. dependent variable(독립변수) X를 가지고 reponse variable(반응변수) Y를 예측해 내는 방법입니다. 이를 통해서 베타값을 구해내게 되고 베타가 변수들간의 관계를 표현해내는 값이 됩니다. 추가로, random하게 발생하는 error를 보정하기 위해서 평균값 0을 ..

EDA Study/선형대수학 2018. 12. 21. 11:21

이전 Prev 1 ··· 23 24 25 26 27 28 29 Next 다음

목록전체 글 보기 (287)

TEAM EDA

티스토리툴바