현재 데이터 사이언티스트인 저는 데이터 사이언티스트가 되기까지 얼마나 걸렸는지 종종 질문을 받습니다. 사실은 그렇게 오래 걸리지 않았습니다. 사실 저는 불과 6개월 만에 데이터 과학자가 되었습니다.
6개월 만에 데이터 과학자가 되는 것이 쉽다는 말은 아닙니다. 확실히 노력과 헌신이 필요합니다. 하지만 기꺼이 노력한다면 단 6개월 만에 데이터 과학자가 될 수 있습니다.
6개월 만에 데이터 과학자가 될 수 있는 방법은 다음과 같습니다.
1. 프로그래밍의 기초부터 배우기
데이터 과학자가 되려면 강력한 프로그래밍 기술이 필요합니다. 좋은 소식은 데이터 과학자가 되기 위해 전문 프로그래머가 될 필요가 없다는 것입니다. 프로그래밍에 대한 기본적인 이해만 있으면 충분합니다.
자원:
- 코딩 방법: 어린이와 성인을 위한 간단한 프로그래밍, Max Wainewright 저;
- Camille McCue의 Coding for Kids For Dummies;
- 안녕하세요 월드입니다! Warren Sande의 어린이 및 기타 초보자를 위한 컴퓨터 프로그래밍;
- Craig Richardson의 Minecraft로 코딩 배우기
- 아이들을 위한 Python: Jason R. Briggs의 프로그래밍에 대한 재미있는 소개;
- Jon Woodcock의 스크래치 게임 코딩;
- Jennifer Frantz의 Anna와 Elsa와 함께 코딩하기;
- The Coding Club의 Coding Club;
- Codecademy의 성인 코딩 부트캠프;
- Sean McManus의 쉬운 단계에서 초보자를 위한 코딩.
2. 통계 및 기계 학습 알고리즘 배우기
통계 학습은 기계 학습의 이론적 기초를 다루는 기계 학습의 하위 분야입니다. 통계 학습은 기계 학습 알고리즘의 기본 원리를 이해할 수 있도록 해주기 때문에 데이터 과학자에게 중요한 기술입니다.
자원:
- 통계 학습 소개 — 이 책은 통계 학습의 기초를 배울 수 있는 훌륭한 리소스입니다.
- 통계 학습의 요소 — 이 책은 통계 학습의 기초를 학습하기 위한 훌륭한 리소스입니다.
- 기계 학습 소개 — 이 책은 기계 학습의 기초를 학습하기 위한 훌륭한 리소스입니다.
3. 통계 프로그래밍 언어 배우기
데이터 과학자가 되려면 최소한 하나의 통계 프로그래밍 언어에 능숙해야 합니다. 가장 많이 사용되는 통계 프로그래밍 언어는 R과 Python입니다. 데이터 과학 커뮤니티에서 더 널리 사용되는 Python 학습을 개인적으로 추천합니다.
시작하는 방법:
- 선택한 언어에 대한 기본 자습서로 시작하십시오. R의 경우 Code School의 R 시작하기 자습서를 사용해 보십시오. Python의 경우 Codecademy Python 트랙을 사용해 보십시오.
- 기본 자습서를 완료하면 보다 전문화된 리소스로 이동할 수 있습니다. R의 경우 Coursera의 데이터 분석 및 통계 추론 과정을 시도하십시오. Python의 경우 Dataquest의 Python으로 데이터 랭글링 과정을 시도하십시오.
- 마지막으로 두 언어 중 하나를 실제로 마스터하려면 실제 환경에서 사용하는 연습을 해야 합니다. 이를 수행하는 가장 좋은 방법은 데이터 세트를 찾고 배운 기술을 사용하여 분석하는 것입니다. R의 경우 UC Irvine Machine Learning Repository는 선택할 수 있는 다양한 데이터 세트를 제공합니다. Python의 경우 Kaggle 데이터 세트 페이지를 사용해 보세요.
4. 데이터 랭글링 도구 사용법 배우기
데이터 랭글링은 데이터 과학자에게 필수적인 기술입니다. 데이터 랭글링은 분석을 위해 데이터를 정리하고 준비하는 프로세스입니다. 다양한 데이터 랭글링 도구가 있지만 가장 많이 사용되는 도구는 Excel과 R입니다.
자원:
- Jacqueline Kazil과 Katharine Jarmul의 "Python으로 데이터 랭글링": 이 책은 Python으로 데이터 랭글링 방법을 배우기 위한 훌륭한 리소스입니다.
- Jennifer Bryan의 "Data Wrangling with R": 이 책은 R로 데이터를 랭글링하는 방법을 배울 수 있는 훌륭한 리소스입니다.
- Wes McKinney의 "Data Wrangling with pandas": 이 책은 pandas와 데이터를 랭글링하는 방법을 배울 수 있는 훌륭한 리소스입니다.
- Ken Puls의 "Data Wrangling with Excel": 이 책은 Excel로 데이터를 랭글링하는 방법을 배울 수 있는 훌륭한 리소스입니다.
5. 데이터 분석 도구 사용법 배우기
데이터 분석은 데이터 과학자에게 또 다른 필수 기술입니다. 데이터 분석은 데이터를 분석하여 통찰력을 추출하는 프로세스입니다. 다양한 데이터 분석 도구를 사용할 수 있지만 가장 인기 있는 두 가지는 R과 Python입니다.
자원:
- Google 애널리틱스 아카데미: 초보자를 위한 Google 애널리틱스
- Codecademy: SQL 배우기
- HarvardX: 데이터 과학
- Udacity: 데이터 분석 소개
- 총회: 데이터 분석 기초
- DataCamp: R 소개
6. 데이터 시각화 도구 사용 방법 배우기
데이터 시각화는 데이터의 시각적 표현을 만드는 프로세스입니다. 데이터 시각화는 데이터 과학자에게 중요한 기술입니다. 데이터 과학자가 발견한 내용을 다른 사람에게 전달할 수 있기 때문입니다. 다양한 데이터 시각화 도구를 사용할 수 있지만 가장 인기 있는 두 가지 도구는 Tableau와 R입니다.
시작하는 방법:
- R을 사용한 데이터 시각화 — 이 과정에서는 ggplot2 패키지를 사용하여 기본 차트를 만드는 방법과 고급 기능을 사용하여 보다 정교한 시각화를 만드는 방법을 포함하여 R로 시각화를 만드는 기본 사항을 다룹니다.
- Python을 사용한 데이터 시각화 소개 — 이 과정에서는 matplotlib 및 seaborn 패키지를 사용하여 기본 차트를 만드는 방법과 고급 기능을 사용하여 보다 정교한 시각화를 만드는 방법을 포함하여 Python으로 시각화를 만드는 기본 사항을 다룹니다.
- Tableau의 데이터 시각화 — 이 과정에서는 Tableau 소프트웨어를 사용하여 대화형 시각화를 만드는 방법을 다룹니다. 주제에는 기본 차트 생성, 필터 및 매개변수 사용, 고급 시각화 생성이 포함됩니다.
- 데이터를 사용한 스토리텔링 — 이 과정에서는 데이터 시각화를 사용하여 스토리를 전달하는 방법을 다룹니다. 주제에는 데이터에서 스토리 찾기, 효과적인 시각화 디자인 및 데이터 스토리를 효과적으로 전달하는 것이 포함됩니다.
7. 데이터 과학자로 취업하기
데이터 과학자가 되기 위해 필요한 기술을 배웠다면 이제 일자리를 찾아야 할 때입니다. 데이터 과학자로서 직업을 찾는 가장 좋은 방법은 온라인 구인 게시판을 검색하는 것입니다.
데이터 과학 작업을 나열하는 다양한 온라인 작업 게시판이 있습니다. 가장 인기 있는 직업 게시판은 인디드, 몬스터, 다이스입니다. 이 모든 작업 게시판과 찾을 수 있는 다른 모든 게시판을 검색하는 것이 좋습니다.
인기 있는 구직 웹사이트:
- Indeed
- Glassdoor
- Monster
- CareerBuilder
- Dice
- The Ladders
결론적으로 단 6개월 만에 데이터 과학자가 되는 것은 분명히 가능합니다. 프로그래밍, 통계 프로그래밍, 데이터 랭글링, 데이터 시각화 및 데이터 분석의 기초를 배우는 것으로 시작하십시오. 이러한 기술을 배우면 데이터 과학 직업 검색을 시작할 수 있습니다.
'Daily Review' 카테고리의 다른 글
5개의 데이터 시각화 대시보드 템플릿 (1) | 2022.09.10 |
---|---|
데이터 과학자가 되어서는 안 되는 이유 (2) | 2022.09.10 |
PyOD로 이상값 감지 (1) | 2022.09.09 |
이상 탐지를 위한 다변량 가우스 분포(Multivariate Gaussian distribution) (0) | 2022.09.09 |
데이터 초보자가 Excel을 즉시 배워야 하는 10가지 이유 (0) | 2022.09.08 |
댓글