[ Contents ]
1. 캐글이란?
캐글은 데이터 분석 경진대회 플랫폼입니다. 간단한 통계 분석, 데이터 시각화부터 머신러닝과 딥러닝까지 폭넓게 다루고 있습니다. 전세계의 데이터 과학자, 엔지니어가 모여서 활동하며, 데이터 사이언스 계의 '깃허브'로 불립니다.
위 링크는 캐글 사이트입니다. 무료로 가입하고 이용할 수 있습니다. 회원가입을 하고 '캐글러(Kaggler)'가 되어보세요. 캐글에서는 유저를 '캐글러'라고 부르며, 캐글에서 하는 활동을 '캐글링(Kaggling)'이라고 합니다.
2. 데이터 분석을 시작하는 초보자를 위한 캐글
1) 초보자를 위한 다양한 가이드와 참고 자료
캐글은 경진대회 플랫폼이면서, 동시에 교육 플랫폼입니다. 파이썬부터 데이터 전처리, 시각화, 머신러닝, 딥러닝까지 간단히 코스를 통해서 배울 수 있습니다.
Kaggle Course는 이론 강의가 아니라 '실습'으로 이루어집니다. 직접 코드를 작성하며, 정답을 맞춰야 다음 코스를 진행할 수 있습니다. 단순히 이론과 예제 코드만 다루지 않습니다.
실제로 코드를 작성하고 실행하면서, 코스 내용을 체득할 수 있습니다.
2) 연습용 경진대회와 자유롭게 열람가능한 노트북
캐글은 공개된 노트북이 많습니다. 뭐든 시작은 '모방'이죠. 잘하는 사람들의 코드를 보면서, 데이터 분석 기법을 배울 수 있습니다.
여기서 노트북(NoteBook)은 셀 단위로 실행 가능한 인터프리터 환경을 말합니다. 대표적으로 주피터 노트북이 있으며, 주피터 노트북 환경과 매우 유사합니다. 셀 단위로 코드와 실행된 결과가 나타나며, 마크다운 형식으로 쓰여진 셜명을 함께 볼 수 있습니다.
데이터 분석 과제에 따라, 데이터 전처리와 사용되는 분석기법(머신러닝, 딥러닝)은 다르지만 전반적인 노하우를 엿볼 수 있습니다.
이미 끝난 경진대회나 연습용 경진대회의 노트북도 열람할 수 있습니다. 연습용 경진대회에 도전해보고, 어려운 건 다른 사람의 코드를 보면서 공부해보세요!
3) 캐글 노트북 지원
구글 코랩(Colab)과 같이 메모리와 GPU를 빌려줍니다. 캐글은 구글의 모회사인 '알파벳'에 인수되면서 안정적인 개발환경을 제공하고 있습니다. 많은 컴퓨팅 자원이 들어가는 분석은 어렵지만, 간단한 머신러닝, 딥러닝 분석은 캐글 노트북을 통해서 충분히 할 수 있습니다.
3. 데이터 전문가를 위한 캐글
1) 자신의 능력을 키우는 플랫폼
캐글 코스로 기본을 다지고, 경진대회에 도전하며 데이터 분석 능력을 키울 수 있습니다. 전 세계의 유능한 데이터 분석가들의 코드를 보며, 빠르게 실력을 키울 수 있어요.
2) 자신의 능력을 PR하는 스펙
캐글은 '등급'이 있습니다. 마치 네이버 카페의 멤버 등급과 비슷합니다. 일정 조건을 달성해야만 등업(?)할 수 있습니다. 맨 처음 등급은 'Novice'로 가입 직후의 등급입니다.
Contributor는 프로필 기입, 노트북 실행, 연습용 경진대회 제출, 토론 답변 및 추천을 달성해야 합니다.
이후 등급은 실제 경진대회에서 유의미한 성과를 내야 획득할 수 있습니다. 최근 데이터 관련 취업 우대사항에 캐글 등급이 등장하고 있으며, 캐글 등급이 높으면 기업으로부터 헤드 헌팅(취업 권유)이 들어오기도 합니다.
또, 국내 다양한 기업에서 경진대회를 열고 있습니다. 경진대회 수상 시, 취업에 유리한 특전과 상금이 주어집니다. 캐글을 통해 돈도 벌고, 좋은 스펙도 쌓을 수 있는 능력자가 되시길 바랍니다.
'Etc . . .' 카테고리의 다른 글
[Tistory] 티스토리 5분 만에 다크모드 적용하기 (feat. Dark Reader) (5) | 2022.04.06 |
---|---|
[Kaggle/캐글] 코스(Course) 하는 방법: Exercise 제출/정답확인, 진행도 올리기 (0) | 2022.02.15 |
[Github] 깃허브에서 브랜치(branch) 생성하고 활용하기 (0) | 2022.02.14 |
[Github] Add, Commit, Push 이해하기 (로컬 저장소와 원격 저장소) (0) | 2022.02.12 |
[Github] 깃허브 레포지토리(Repository) 생성하기 (0) | 2022.02.12 |
댓글