반응형 데이터분석기초4 시계열 분석 및 예측에 대한 종합 가이드 (2) 시계열 성분 조합론 시계열 모델은 2가지 방법론으로 나타낼 수 있습니다. 가법 방법론 - 시계열 추세가 적분 간의 선형 관계인 경우, 즉 계열의 주파수(너비)와 진폭(높이)이 같으면 가법 규칙이 적용됩니다. 덧셈 방법론은 계절적 변동이 타임스탬프에 대해 선형이거나 일정한 시계열이 있을 때 사용됩니다. 다음과 같이 나타낼 수 있습니다. y(t) 또는 x(t) = 수준 + 추세 + 계절성 + 노이즈 여기서 모델 y(다변량) 또는 x(단변량)은 시간 t의 함수입니다. 승법 방법론 - 시계열이 적분 사이의 선형 관계가 아닌 경우 곱셈 규칙에 따라 모델링이 수행됩니다. 승법 방법론은 계절적 변동이 시간에 따라 증가하는 시계열이 있을 때 사용되며, 이는 지수 또는 2차일 수 있습니다. 그것은 다음과 같이 표현됩니다.. 2022. 9. 12. 사람들은 왜 직장을 그만둘까? 3단계 McKinsey 차트 최근의 흥미로운 McKinsey 연구의 차트는 몇 가지 이상한 데이터 시각화 선택을 했습니다. 이 게시물은 3단계로 수정하는 방법을 보여줍니다. 최근에 인터넷을 사용한 적이 있다면 피드에 아래 차트가 표시되는 것을 보았을 것입니다. 최근 McKinsey 보고서에서 발췌한 내용 입니다. 적합한 인재 풀을 찾고 있습니까? ". 이 보고서는 회사가 5가지 유형의 직원("페르소나")을 충족시켜 인재를 유치하고 유지할 수 있는 방법에 관한 것입니다. 이는 6개국의 직원을 대상으로 한 대규모 설문조사를 기반으로 합니다. 가장 흥미로운 결과 중 하나가 이 차트에 보고되어 있습니다. 보고서는 흥미롭고 아름답게 준비되었지만 이 차트는 끔찍 하기 때문에 짜증이 났습니다 . 여기서 설문조사 방법론을 말하는 것이 아닙니다. .. 2022. 9. 7. 데이터 사이언스 관련 직무 급여 데이터셋을 분석했습니다. Kaggle에서 데이터 과학 Job Salaries 데이터셋을 발견하고 이에 대한 분석 기술을 시험해봤습니다. 이 데이터 세트에는 2020년 고용 유형, 회사 위치 등과 같은 요소를 기반으로 하는 전 세계 데이터 과학 전문가의 급여에 대한 세부 정보가 포함되어 있습니다. 또한 2021년 데이터 과학 전문가의 예상 급여도 함께 제공됩니다. 저는 2020년과 2021년에 대한 급여 분포를 시각화했습니다. 2020년부터 2021년까지의 기간 동안 급여 상한선이 크게 증가한 것을 볼 수 있습니다. 또한 최대 300,000 USD까지 봉급을 자루에 넣는 전문가의 수가 크게 증가한 것을 관찰할 수 있습니다. 인도 기준으로 분석을 해봤어요. 질문 1. 초급 데이터 과학 전문가에게 가장 적합한 고용 유형은 무엇입니까?.. 2022. 9. 5. SQL을 사용한 레스토랑 판매의 탐색적 데이터 분석(EDA) 이 프로젝트에서는 SQL을 사용하여 레스토랑 판매 데이터 세트에 대해 EDA를 수행합니다. 데이터 세트는 Kaggle에서 다운로드하여 SQL Server Management Studio로 가져왔습니다. 이전 프로젝트에서 레스토랑 비즈니스에 대한 정보를 표시했으므로 이를 위해 SQL을 사용하여 동일한 분석을 수행할 것입니다. 시작하자. 다음 질문에 답하겠습니다 1. 총 주문 금액은 얼마입니까? 2. 판매된 상품의 총 수량은 얼마입니까? 3. 평균 배송 시간은 어떻게 됩니까? 4. 음식에 대한 평균 등급은 무엇입니까? 5. 가장 많이 주문한 고객은? 6. 가장 많이 주문한 식당은? 7. 고객이 자주 사용하는 결제 수단은 무엇입니까? 8. 가장 좋아하는 요리는? 9. 하루 중 고객이 가장 많이 주문한 시간은?.. 2022. 8. 30. 이전 1 다음 반응형