반응형 시계열데이터분석3 시계열 분석 및 예측에 대한 종합 가이드 (3) 시계열 데이터 고정 검사 그럼 먼저 고정 시계열 데이터가 무엇인지 요약해 보겠습니다! 고정은 용어에서 알 수 있듯이 일관성이 있습니다. 시계열에서 계절성이나 추세가 포함되지 않은 데이터를 정상적이라고 합니다. 따라서 특정 추세 또는 계절성이 있는 다른 시계열 데이터는 고정적이지 않습니다. 우리가 작업한 두 개의 시계열 데이터 중 출산 데이터에는 추세나 계절성이 없고 고정적이라는 것을 기억할 수 있습니까? 반면, 일일 평균 기온 데이터에는 계절성 요인과 드리프트가 있으므로 비정상적이며 모델링하기 어렵습니다! 시계열의 정상성은 3가지 유형에서 두드러진다 - (a) 고정 추세 - 이러한 종류의 시계열 데이터에는 추세가 없습니다. (b) 계절성 고정 — 이러한 종류의 시계열 데이터에는 계절성 요인이 없습니다. .. 2022. 9. 12. 시계열 분석 및 예측에 대한 종합 가이드 (2) 시계열 성분 조합론 시계열 모델은 2가지 방법론으로 나타낼 수 있습니다. 가법 방법론 - 시계열 추세가 적분 간의 선형 관계인 경우, 즉 계열의 주파수(너비)와 진폭(높이)이 같으면 가법 규칙이 적용됩니다. 덧셈 방법론은 계절적 변동이 타임스탬프에 대해 선형이거나 일정한 시계열이 있을 때 사용됩니다. 다음과 같이 나타낼 수 있습니다. y(t) 또는 x(t) = 수준 + 추세 + 계절성 + 노이즈 여기서 모델 y(다변량) 또는 x(단변량)은 시간 t의 함수입니다. 승법 방법론 - 시계열이 적분 사이의 선형 관계가 아닌 경우 곱셈 규칙에 따라 모델링이 수행됩니다. 승법 방법론은 계절적 변동이 시간에 따라 증가하는 시계열이 있을 때 사용되며, 이는 지수 또는 2차일 수 있습니다. 그것은 다음과 같이 표현됩니다.. 2022. 9. 12. 시계열 데이터에 K-평균 클러스터링을 적용하는 방법 Intro 클러스터링은 알고리즘이 "실제" 레이블 없이 유사한 데이터 포인트를 그룹화하는 비지도 학습 작업입니다. 데이터 포인트 간의 유사성은 일반적으로 유클리드 거리( Euclidean distance )라고 하는 거리 측정법으로 측정됩니다 . 서로 다른 시계열을 유사한 그룹으로 클러스터링하는 것은 각 데이터 포인트가 순서가 지정된 시퀀스이기 때문에 어려운 클러스터링 작업입니다. 시계열 클러스터링에 대한 가장 일반적인 접근 방식은 시계열을 각 시간 인덱스(또는 시리즈 집계)에 대한 열이 있는 테이블로 평면화하고 k-means 와 같은 표준 클러스터링 알고리즘을 직접 적용하는 것 입니다. (K-평균은 샘플을 k 그룹으로 분할하고 각 클러스터의 제곱합을 최소화하여 데이터 클러스터를 구성하는 일반적인 클러스.. 2022. 8. 29. 이전 1 다음 반응형