본문 바로가기
반응형

Isolation Forest2

비지도 학습 기법을 적용한 사기 탐지 (Fraud Detection) 기초 이론 이상값 감지라고도 하는 이상 감지는 데이터 세트에서 발견된 이상 유형을 확인하고 해당 발생에 대한 세부 정보를 확인하는 데 사용되는 데이터 마이닝 프로세스입니다. 간단히 말해서, 이상 탐지는 일반적인 경향을 따르지 않는 비정상적인 패턴/행동의 식별을 처리합니다. 이상치는 주어진 데이터 세트의 다른 데이터 요소와 크게 다른 데이터 요소일 뿐입니다. 이상값은 환경에 따라 포인트 이상값 , 컨텍스트 이상값 또는 집합 적 이상값 과 같이 다양한 형태로 나타날 수 있습니다 . 포인트 이상치는 나머지 분포에서 멀리 떨어져 있는 단일 데이터 포인트입니다. 컨텍스트 이상값은 텍스트 분석을 구현할 때 구두점 기호 또는 음성 인식을 수행할 때 배경 노이즈 신호와 같은 데이터의 노이즈일 수 있습니다. 집합적 이상.. 2022. 9. 5.
데이터사이언티스트에게 필요한 3가지 이상 탐지 모델(Anomaly Detection) 아래 2가지 상황을 경험해본 적 있을 것이다. 모델이 원하는 대로 작동하지 않습니다. 일부 포인트가 나머지 포인트와 크게 다르다는 사실에 주목하지 않을 수 없습니다. 이런 상황이라면, 아마도 데이터에 이상치가 있다는 거다. 이상치란 무엇입니까? 통계에서 이상치는 다른 관측치와 크게 다른 데이터입니다. 위의 그림에서 우리는 대부분의 점이 선형 초평면 안에 있고 그 주위에 있지만 단일 점이 나머지 부분에서 발산하는 것을 볼 수 있음을 분명히 알 수 있습니다. 이 점은 이상치 입니다. 예를 들어 아래 목록을 살펴보십시오. [ 1,35,20,32,40,46,45 , 4500 ] 여기에서 1과 4500이 데이터 세트의 이상값임을 분명히 쉽게 알 수 있습니다. 내 데이터에 이상치가 있는 이유는 무엇입니까? 일반적으.. 2022. 9. 1.
반응형