데이터 과학자가 되려는 시도 는 매우 지루한 여정 입니다. 저를 믿으십시오. 처음에는 즐길 수 있지만 계속 진행하면 완료하는 데 영원히 걸립니다. 개인적으로 저는 데이터 과학과 기계 학습을 배우는 두 사람을 알고 있습니다. 그들 중 하나는 데이터 엔지니어로 MNC에 정착했습니다. 그는 1~2년 동안 주당 3~4시간만 일했다. 그는 업그레이드에서 PG 디플로마 인증 프로그램을 완료했습니다. 다른 하나는 2개의 PG 디플로마(데이터 과학 및 기계 학습, 다른 하나는 인공 지능)를 수료했으며 런던 리버풀 대학에서 기계 학습 및 딥 러닝 석사 과정을 마쳤습니다.
(업그레이드를 통해). 현재 3년 동안 힘들게 일했지만 2차 면접에도 진출하지 못했다. 제가 언급한 디플로마와 MS는 장기 연구에 불과합니다. 그는 Udemy, Coursera(Google Data Analyst Program), Coursera(IBM 인증)에서 많은 시간제 과정을 이수했으며 심지어는 Certification by Kaggle도 수행했습니다. 저를 믿으세요. 그의 이력서를 처음 봤을 때 그 사람만큼 열심히 일할 수 있는 사람은 없다고 생각했습니다. 그런데 왜 그가 일자리를 얻지 못했다고 생각했습니까? 잠시 후에 설명하겠습니다.
먼저 데이터 사이언스 지망생이 MS Excel을 배워야 하는 10가지 이유는 ..... 글쎄, 아무도 없다. 죄송하지만 화내지 마세요. 이렇게 제목을 붙인 데에는 그럴만한 이유가 있습니다.
사람들이 새로운 기술을 배우기 시작하면 주요 목표(좋은 일입니다, TBH)로 뛰어드는 경향이 있지만 데이터 과학은 단순한 기술이 아닙니다. 더 많은 연구입니다. 데이터 사이언스의 연구는 나날이 발전하고 있습니다.
내가 제목에서 10가지 이유를 언급했기 때문에 이 이야기를 여는 사람이 얼마나 되는지 솔직히 말해 주세요. 나쁜 점은 아닙니다. 우리 인간은 단일 샘플 데이터로 아무 것도 해석할 수 없습니다(이 경우 하나의 이유일 뿐입니다). 무엇이든 해석하려면 여러 샘플이 필요합니다. 실제로 유아에 관한 연구가 있습니다. 즉, 새로 태어난 아기는 정보의 양이 매우 적기 때문에 아무것도 이해할 수 없습니다. 단순히 데이터만으로는 상황을 분석하기에 충분하지 않습니다. 이에 대해서는 나중에 자세히 설명합니다. 질문(DS 열망자에게 Excel이 중요한 이유)은 다음과 같습니다.
데이터 과학은 프로그래밍 언어에 의존하는 것보다 통계 모델을 관찰하여 시각화하고 결론을 도출하는 것에 관한 것입니다.
회귀, 클러스터링 -(고급 통계 모델 - 나중에 자세히 설명)과 같은 다양한 유형의 기존 데이터 과학 기술에 대해 배울 때 주어진 데이터를 시각화해야 합니다. 따라서 Python이나 R과 같은 프로그래밍 언어를 배워야 하지만 다양한 분포(Normal, Student's-T)와 같은 통계의 기초를 배우는 것은 어떨까요? 어떻게 시각화합니까? 물론 Tableau, Power BI와 같은 다른 과정을 배울 수 있다고 말할 수 있지만 데이터를 조작하거나 시각화하려고 할 때 데이터가 어떻게 작동하는지 아는 것이 중요하지 않습니까?
이때 엑셀이 등장합니다. Tableau 또는 다른 것만큼 많은 데이터를 저장할 수는 없지만. 그러나 이것은 통계 모델의 완전한 기초를 배우는 데 도움이 될 것입니다.
따라서 Excel이 데이터 과학 초보자에게 중요한 이유를 알고 싶다면.
'Daily Review' 카테고리의 다른 글
PyOD로 이상값 감지 (1) | 2022.09.09 |
---|---|
이상 탐지를 위한 다변량 가우스 분포(Multivariate Gaussian distribution) (0) | 2022.09.09 |
Python에서 루프와 함께 loc/iloc을 사용하지 말고 대신 이것을 사용하십시오! (0) | 2022.09.08 |
효과적인 데이터 시각화를 위한 8가지 팁 (0) | 2022.09.08 |
사람들은 왜 직장을 그만둘까? 3단계 McKinsey 차트 (1) | 2022.09.07 |
댓글