일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 파이썬
- Image Segmentation
- Segmentation
- DilatedNet
- TEAM-EDA
- 나는리뷰어다
- Recsys-KR
- 3줄 논문
- Machine Learning Advanced
- 코딩테스트
- DFS
- Semantic Segmentation
- 엘리스
- 추천시스템
- hackerrank
- eda
- 큐
- pytorch
- 협업필터링
- MySQL
- 튜토리얼
- 프로그래머스
- 한빛미디어
- TEAM EDA
- Object Detection
- 입문
- 알고리즘
- Python
- 스택
- 나는 리뷰어다
- Today
- Total
목록TEAM EDA (27)
TEAM EDA
안녕하세요. 오랜만에 글로 찾아뵙게 되네요. 이번에 캐글 메달리스트가 알려주는 캐글 노하우라는 책을 출판하게 되었습니다. 총 8명의 저자가 각자의 파트를 맡아서 하나의 책으로 엮는 행태였는데 저는 IEEE-CIS Fraud Detection이라는 부분을 맡았습니다. 사실 작업은 3년전에 시작했지만, 이런저런 일들이 있으면서 올해 드디어 출판하게 되었네요. 몇몇 지인분들이 읽어주고 연락도 주셔서 기쁜 마음도 있지만 내가 쓴 글이 남들한테 어떻게 보이질 두려운 마음도 있는 것 같습니다. (확실한건 책은 다신 못쓸 것 같네요 ㅋㅋㅋ) 길고 긴 시간이었지만, 책 출판까지 도움주셨던 분들과 같이 작업하신 분들 너무 감사합니다. 그리고, 읽어주시는 분들께도 감사한 마음이며 이 책이 많은 도움이 되길 바랍니다.
이번 글에서는 추천 모델을 생성한 후에 적용하는 후처리에 대해서 알아보겠습니다. 요새 개인적으로 많이 고민하는 주제인데, 후처리는 추천 모델이 제공한 추천 결과를 보완하여 사용자에게 더욱 적합한 추천을 제공하는 과정입니다. 예를 들어, 사용자의 취향을 더욱 정확하게 반영하여 추천 나가는 상품의 순서를 섞거나 특정 상품을 구매하지 않은 이유를 분석하여, 추천 모델이 해당 상품을 추천하지 않도록 제외시킬 수 있습니다. 혹은, 문제가 될만한 상품들 (ex. 성인 상품)을 추천에서 제외해주기도 합니다. [일부 추천 상품 제외] 추천 상품을 제외하는 대표적인 필터링 기법 중에 하나는 이미 구매한 상품을 추천에서 제외하는 로직입니다. 모델의 추천결과를 보게 되면 실제 클릭하거나 구매, 좋아요를 누른 상품들이 대부..
지난 글에서 공유했던 것처럼 카이스트 대학원을 졸업하고 22년도 10월에 업스테이지 정규직에 합격했습니다. 업스테이지는 인공지능(AI)을 기반으로 하는 스타트업으로 OCR과 추천 AI Pack을 만들어서 기업에 제공하는 회사입니다. 최근에는 한화생명에 OCR Pack을 브랜디에 Recsys Pack을 제공한 기사가 나면서 기술력을 입증하기도 했습니다. 저는 업스테이지의 챌린지스팀에 AIRE (AI Research Engineer) 직군으로 합류를 하였는데, 챌린지스팀은 다양한 대회에 참가해 수상하여 기술력을 홍보하고 이때 대회에서 얻은 노하우들을 제품에 녹여내는 역할을 하는 팀입니다. 대표적으로는 RecSys 2022 챌린지나 캐글 AI 대회들에서 좋은 성과를 거두었고 최근에는 브랜디라는 쇼핑몰에 추천 ..
Cassava Leaf Disease Classification Public 13, Private 171 Solution 이번 포스팅에서는 Pseudo Lab 소속으로 4명의 팀원과 함께 나간 캐글 - Cassava Leaf Disease Classification 대회 솔루션의 후기를 작성하겠습니다. 정리한 내용이 길어서 이번 글에서는 저희 팀의 솔루션을 다음 글에서는 다른 팀의 솔루션과 배운점을 위주로 정리하도록 하겠습니다. 김현우 : https://github.com/choco9966 코드 : https://github.com/choco9966/Cassava-Leaf-Disease-Classification 영상 : https://www.youtube.com/watch?v=ofSsnFcerV4 1...
NIPA 2021 인공지능 온라인 경진대회, 한국인 헤어스타일 세그멘테이션 2등 이번 포스팅에서는 ARTuna이라는 팀으로 4명의 팀원과 함께 나간 인공지능 온라인 경진대회의 후기를 작성하겠습니다. 김현우 : https://github.com/choco9966 코드 : https://github.com/choco9966/Korean-Hair-Segmentation 저희 팀은 카이스트 산업 및 시스템공학과인 저와 세이지리서치에서 근무하는 하헌진님, 아트랩에서 근무하시는 3분의 팀원 훈재님, 재희님, 대선님 이렇게 5명이 팀을 이루어서 대회를 진행했습니다. 본선 저희 팀이 참여한 대회는 이미지 분야에서도 한국인 헤어스타일 세그멘테이션 대회였습니다. 과학기술정보통신부 - 한국인 헤어스타일 세그멘테이션 모델 (..
대학원 신입생의 2020년 회고록 졸업, 입학 2020.08월 6년 반이라는 시간을 보낸 한양대 산업공학과를 졸업했습니다. 총 학점 3.96, 전공 학점 4.07로 나쁘지 않은 학과생활을 했습니다. 동아리 생활도 많이 했는데 이때 한양대의 FRAME 동아리에서 TEAM-EDA라는 스터디를 했기에 지금의 제가 있지 않았나 생각합니다. 라이즈, KT 스카이 라이프 올해 1월부터 6월 동안 학교의 인턴십 프로그램을 통해서 라이즈라는 스타트업에서 데이터 분석 직무를 맡았습니다. 업무는 KT 스카이라이프의 사용자 데이터와 VOD 정보를 가지고 VOD 큐레이션을 개발하는 역할이었습니다. 주로 했던 역할은 사용자에 대한 분석과 VOD 추천시스템 개발 그리고 2주 동안 할인 쿠폰을 추천해줄 고객을 선정하는 작업을 진행..
NIPA 2020 인공지능 문제해결 경진대회, 4관왕 달성 후기 이번 포스팅에서는 해달이라는 팀으로 2명의 팀원과 함께 나간 인공지능 문제 해결 대회의 후기를 작성하겠습니다. 김현우 : https://github.com/choco9966 박수희 : https://github.com/Soohee410 박기찬 : https://github.com/CentralPark-gichan 저희 팀은 카이스트 산업 및 시스템공학과인 저와 고려대학교 통계학과 대학원에 다니는 2명 팀을 이루어 대회에 참여했습니다. 이번 경진대회는 기존의 경진대회와는 다르게 예선을 통해서 상위 150팀을 선정하고 150팀이 2주 동안 최대 5개의 대회에 참여하는 형식이었습니다. 예선 예선의 경우 7일이라는 짧은 기간동안 대회가 진행되었습니..
지난 글 2020년 취업뽀개기 상반기 결과에서, 삼성전자와 카카오 면접을 포기한 이유를 알려드리겠다고 했습니다. 저는 2020 가을학기 카이스트 대학원에 최종 합격하였고, 지금은 산업 및 시스템공학과 학생으로 현재 석사생으로 연구실에 출근하고 있습니다. 취업을 포기하고 대학원을 가게 된 이유는 지난번의 글처럼 학부생으로 취업하기에는 한계가 있다고 생각했습니다. 그리고 대학원에 가게 되면 연구 쪽으로 경력을 쌓을 수도 있고 AI 쪽으로 승진이나 노후에도 더 유리할 거로 생각했습니다. 취업도 그렇지만, 카이스트도 입학하는 게 쉽지 않았습니다. 제가 합격한 산업 및 시스템공학과는 서류 - 필기 - 면접으로 진행되는데, 코로나 때문에 필기가 사라지고 구술면접으로 대체되어서 줌으로 진행되었습니다. 구술면접은 통계..
TEAM-EDA 3기의 활동내용 중 하나인 2020년 취업뽀개기 : 취업을 위해 준비한 내용, 취업 과정을 정리의 결과가 나와서 공유해드리고자 합니다. 일단, 결론부터 말씀드리면 상반기 취준은 실패했습니다. 저의 기본적인 스펙에 대해 말씀드리면,캐글상위5% 6번 (최고 0.5%)상위10% 2번캐글 대학생 해커톤 수상공모전데이콘 3회 수상 (우승2번, 3등 1번)빅콘테스트 우승 (과학기술부 장관상)COMPAS 동메달 4등카카오 아레나 2차 대회 4등정보보호 R&D 챌린지 4등대외활동한양대 데이터 분석 동아리 1년반 활동 (FRAME 동아리의 TEAM-EDA 리더)데이터 뽀개기 운영진 1년회사경험신한은행 : 전처리 알고리즘 고도화 및 피어그룹 프로젝트 2개월AI 스타트업 : KT SkyLife VOD 큐레이..
3기 (2020-04-01 ~ ) 이번 3기는 저 혼자서 진행하는 스터디입니다. 올 한해 많은 목표들을 세웠고, 하나씩 이루는 활동을 하겠습니다. 프로젝트 Kaggle - Do you want to be a Chris? : 캐글 커널 그랜드마스터 크리스의 모든 분석내역을 정리 Dacon, Kaggle 책 집필 : Dacon과 Kaggle에서 했던 내용을 토대로 책 집필 T 아카데미 강의 : T 아카데미에서 5시간정도의 강의를 위한 발표자료 생성 Kaggle Kernel Master 달성 Kaggle Competition Master 달성 2020년 취업뽀개기 : 취업을 위해 준비한 내역, 취업 과정을 정리 블로그 일 방문자 수 1000 만들고 애드센스 신청하기 밑바닥부터 시작하는 딥러닝, CS224n, ..