TEAM-EDA 3기 활동내역

3기 (2020-04-01 ~ )

이번 3기는 저 혼자서 진행하는 스터디입니다. 올 한해 많은 목표들을 세웠고, 하나씩 이루는 활동을 하겠습니다.

프로젝트

  1. Kaggle - Do you want to be a Chris? : 캐글 커널 그랜드마스터 크리스의 모든 분석내역을 정리
  2. Dacon, Kaggle 책 집필 : Dacon과 Kaggle에서 했던 내용을 토대로 책 집필
  3. T 아카데미 강의 : T 아카데미에서 5시간정도의 강의를 위한 발표자료 생성
  4. Kaggle Kernel Master 달성
  5. Kaggle Competition Master 달성
  6. 2020년 취업뽀개기 : 취업을 위해 준비한 내역, 취업 과정을 정리
  7. 블로그 일 방문자 수 1000 만들고 애드센스 신청하기
  8. 밑바닥부터 시작하는 딥러닝, CS224n, 선형대수학, 확률과 통계, 머신러닝, 자연어처리, CS231 관련해서 블로그 글 전부 작성하기
  9. 이제까지 진행했던 대회들 다시하면서 1등 만들고, 그 과정을 블로그 글과 PPT로 남기기
  10. 클래스 101, 탈잉 혹은 스터디파이에서 강의 하기 

다짐

혼자 진행하는 만큼 많이 부족한 점도 있고 의지도 많이 약해질 수 있겠지만 열심히 해보겠습니다. 모든 데이터 분석 취준생을 파이팅입니다!!

'TEAM EDA  > EDA 3기 (2020.04.01 ~ )' 카테고리의 다른 글

TEAM-EDA 3기 활동내역  (4) 2020.04.02

댓글(4)

  • 핵발차기
    2020.04.12 20:35

    안녕하세요. EDA에 관심이 생겨서 알아보다가 블로그를 발견하게 되었습니다. 글을 몇개 읽었는데 데이터 분석쪽으로 프로젝트를 많이 하셨네요. 부럽습니다.
    저는 원래는 인공지능에 관심이 있어서 딥러닝쪽으로 석사까지 마쳤는데요. 사실 이쪽 분야가 딱히 재미가 있진 않아요. 그 이유를 생각해보니 왜 되는지를 모르기 때문인 것 같습니다. 그래서 EDA에 관심을 가지게 된 것이구요. 즉 데이터를 이해하는 것에 관심이 생겼는데 오호힛님께서는 어떻게 시작을 하셨나요?
    강의를 듣고 시작을 하셨나요? 아니면 그냥 바로 캐글같은 대회를 시작하셨나요?
    답변 부탁드립니다

    그리고 글의 목표중에 8번을 보니 인공지능쪽의 기초를 다지시려는 것 같은데 제 개인적인 생각으로는 다른건 몰라도 선형대수와 확률통계는 머신러닝, 딥러닝 쪽에 크게 도움은 안되는 것 같습니다. 물론 머신러닝 알고리즘의 근본은 수학이지만 실전에서는 몰라도 되는 것 같아요. 저도 수학기초를 열심히 공부를 하고나서 머신러닝,딥러닝 쪽 공부를 시작했는데 별 도움 안됩니다. 다만 예를 들어서 본인이 random forest를 사용하려 하는데 이게 현재 해결하려는 문제와 잘 맞지 않아서 random forest라는 알고리즘을 좀 변형해서 자신만의 알고리즘을 만드는 경우에는 수학이 필요할 겁니다. 근데 박사를 안하고 이런 수준까지 갈수 있을지는 의문이네요. 어쨋든, 데이터 분석측면에서는 수학보다는 해당 알고리즘을 직관적으로 잘 이해하는게 중요한 것 같습니다. 혹시 저한테 질문하실게 있으시면 해주시면 저도 답변 달아드릴게요.

    같은 목표를 가진 만큼 서로 정보를 공유하면 좋을 것 같네요.

    • 2020.04.13 09:19 신고

      안녕하세요. 김현우입니다. 먼저 많은 글 읽어주셔서 감사합니다.

      데이터 분석을 시작한 이유는 재밌고 논리적이기 때문이었습니다. 팀프로젝트 중 제일 열정적으로 했던 프로젝트가 머신러닝 관련 프로젝트였습니다. EDA에 관심이 생긴게 데이터를 이해하고 인사이트를 뽑고, 논리적인게 재미있기 때문입니다. (사실 모델링쪽이 약하기도 했구요). 단순히 결측치를 대체하더라도 데이터의 분포에 맞게 평균, 중앙값으로 대체할 지 다른 방법을 찾아야할 지 고민하는 과정이 딱 공대스러웠습니다.

      AI분야는 6~8개월 정도 스터디(EDA1기)를 하면서 이론 공부와 캐글 데이터로 실습을 했습니다. 전반적인 실력이 늘은 것은 빅콘테스트2018에 나갔을 때입니다. 캐글이나 분석대회도 EDA부터 모델링까지 전반적으로 실력쌓기 좋지만, 점수에 치우치다보니 EDA의 중요도가 상대적으로 떨어지는 부분이 있습니다. 그런데 시각화 대회나 인사이트를 발굴하는 공모전 같은 경우는 EDA에 가장 중점을 두기때문에 공부하기에는 가장 좋은 것 같습니다.

      ---
      실전에서는 모델이 어떻게 작동하는 지 몰라도 구글링해서 코드 가져다 쓰면 되는게 맞긴 하죠. 저도 그러고 있는 것 같습니다. 그런데 첫문단에서 말씀해주신 것 처럼 '왜 되는지 모르기 때문이란게' 수학때문인 것 같아서 아쉽더라구요. 해당 알고리즘을 직관적으로 이해하고 싶어 논문을 읽으도 수식을 이해하지 못하니 한계가 있는 것 같았습니다. 안그래도 학사수준에서는 알고리즘 변형해서 하기 힘들 것 같아서 오늘 대학원 원서를 냈습니다 ㅎㅎ... 대학원에 붙은게 아니라 대학원 선배님으로 불러야 할지는 모르겠지만, 궁금한 부분있으면 질문드리겠습니다.

      질문 남겨주셔서 감사합니다. (어제까지 자소서를 쓰다보니 뭔가 말투가 딱딱하네요 ㅎㅎ)

  • 비밀이에요
    2020.04.20 02:03

    화이팅!!

Designed by JB FACTORY