본문 바로가기
Daily Review

시계열 분석 및 예측에 대한 종합 가이드 (1)

by data-analyst-luke 2022. 9. 11.
반응형
출처 — Bounteous

 

시계열 분석 및 예측은 데이터 과학, 데이터 분석 및 인공 지능 분야에서 매우 뚜렷하고 강력한 연구입니다. 변화하는 시간과 관련하여 저장된 데이터를 기반으로 사고의 확률을 분석하고 예측하거나 계산하는 데 도움이 됩니다.

 

예를 들어, 흉통 때문에 병원을 방문했고 심장이 건강하고 기능하는지 확인하기 위해 (ECG) 검사를 받고 싶다고 가정해 보겠습니다. 생성된 ECG 그래프는 시간에 따른 심박변이도(HRV)가 표시된 시계열 데이터로, 의사가 심장을 돌보고 뇌졸중이나 심장마비의 위험을 줄이기 위한 중요한 조치를 제안할 수 있는 분석입니다. 시계열은 의료 분석, 지리 공간 분석, 일기 예보 및 시간에 따라 지속적으로 변화하는 데이터의 미래 예측에 널리 사용됩니다!

 

시계열 분석이란 무엇입니까?

시계열 분석은 시계열 데이터에서 유용한 정보를 추출하여 예측하고 통찰력을 얻는 프로세스입니다. 시간에 따라 변하는 일련의 데이터로 구성되므로 본질적으로 연속적이고 비정적입니다. 몇 시간에서 몇 분, 심지어 몇 초(밀리초에서 마이크로초)까지 다양할 수 있습니다. 고정적이지 않고 연속적인 특성으로 인해 시계열 데이터로 작업하는 것은 오늘날에도 참으로 어렵습니다!

시계열 데이터는 시간 순서대로 취한 일련의 관측으로 구성되므로 본질적으로 완전히 비정적입니다.

 

 

시계열 - 분석 대 예측

시계열 분석은 시계열 데이터에서 유용한 정보를 과학적으로 추출하여 통찰력을 수집하는 것입니다. 시간에 따라 변하는 일련의 데이터로 구성됩니다. 그것은 본질적으로 정적이지 않습니다. 마찬가지로, 시간에서 분, 심지어 초(밀리초에서 마이크로초)까지 다양할 수 있습니다. 연속적이고 비정적이기 때문에 시계열 데이터로 작업하는 것은 어렵습니다!

시계열 데이터는 시간 순서대로 취한 일련의 관측으로 구성되므로 본질적으로 완전히 비정적입니다.

시계열 분석과 시계열 예측은 대부분 상호 교환적으로 사용되는 두 가지 연구입니다. 그러나 이 둘 사이에는 매우 얇은 선이 있습니다. 명명할 명명은 기존 시계열 데이터에서 보고서를 분석 및 요약하거나 이를 통해 미래 추세를 예측하는 것을 기반으로 합니다.

따라서 설명 대입니다. 시계열 문제 설명을 기반으로 한 예측 전략.

간단히 말해서, 시계열 분석은 기술적이고 추론적인 통계적 방법을 사용하여 시계열 데이터 프레임의 패턴과 추세를 연구하는 것입니다. 반면, 시계열 예측에는 오래된 데이터 포인트를 기반으로 미래 추세 또는 값을 예측하고 외삽하고(감독된 시계열 예측), 그룹으로 클러스터링하고, 미래 패턴을 예측하는(감독되지 않은 시계열 예측)이 포함됩니다.

 

시계열 적분

모든 시계열 문제 또는 데이터는 분석 및 예측을 수행하는 데 유용할 수 있는 여러 적분으로 분해되거나 분해될 수 있습니다. 시계열을 일련의 적분으로 변환하는 것을 시계열 분해라고 합니다.

 

언급할 가치가 있는 빠른 것은 적분기가 2가지 유형으로 더 나뉩니다.

1. 체계적 — 예측 모델링에 사용할 수 있고 반복적으로 발생하는 구성 요소입니다. 레벨, 추세 및 계절성이 이 범주에 속합니다.

2. 비체계적 — 예측 모델링에 직접 사용할 수 없는 구성요소. 소음은 이 범주에 속합니다.

따라서 원래 시계열 데이터는 5개 부분으로 분할되거나 분해됩니다.

1. 레벨 — 모든 시계열 데이터에서 가장 일반적인 적분은 레벨입니다. 시계열의 평균 또는 평균값일 뿐입니다. 자체에 대해 플롯할 때 분산이 0입니다.

2. 추세 - 증가, 감소 또는 중립적일 수 있는 시계열의 선형 이동 또는 드리프트. 추세는 전체 시간 범위에 걸쳐 양수(증가) 및 음수(감소) 및 선형 기울기에 대해 관찰할 수 있습니다.

3. 계절성 — 계절성은 시간 경과에 따라 반복되는 것입니다(예: 1년). 여름, 겨울, 봄, 몬순과 같이 지정된 기간 동안 주기적으로 왔다 갔다 하는 계절성에 대한 아이디어를 쉽게 얻을 수 있습니다. 그러나 데이터 과학의 관점에서 계절성은 유사한 빈도로 반복되는 적분입니다.

 

참고 — 계절성이 동일한 빈도로 발생하지 않는 경우 이를 주기라고 합니다. 주기에는 사전 정의되고 고정된 신호가 없거나 주파수가 확률 측면에서 매우 불확실합니다. 때로는 무작위일 수 있으며 이는 예측에 큰 도전이 됩니다.

 

4. 노이즈 — 불규칙 또는 노이즈는 무작위로 발생하는 적분이며, 피처가 서로 상관 관계가 없고 가장 중요한 것은 분산이 계열 전체에서 유사한 경우에만 선택 사항이며 관찰에 도달합니다. 노이즈는 더럽고 지저분한 데이터로 이어질 수 있고 예측을 방해할 수 있으므로 노이즈 제거 또는 최소한 감소는 시계열 데이터 전처리 단계에서 매우 중요한 부분입니다.

5. 주기성( Cyclicity) — 몇 개월, 몇 년 또는 심지어 수십 년과 같은 큰 간격이나 시간 간격 후에 반복되는 특정 시계열 패턴입니다.

 

시계열 예측 애플리케이션

시계열 분석 및 예측은 다음과 같은 다양한 작업을 자동화하여 수행됩니다.

  1. 일기 예보
  2. 이상 예측
  3. 판매 예측
  4. 주식 시장 분석
  5. ECG 분석
  6. 위험도 분석

 

반응형

댓글