본문 바로가기
Daily Review

데이터 분석 분야를 바꿀 3가지 Python 패키지

by data-analyst-luke 2022. 9. 5.
반응형

1. Mito

Mito 는 코드를 생성하는 Python용 스프레드시트 인터페이스를 제공하여 사용자가 훨씬 빠르게 코딩할 수 있도록 합니다. 

Mito에서 편집할 때마다 아래 코드 셀에 동등한 Python이 생성됩니다 . 

스프레드시트 인터페이스에서 작업을 수행하기만 하면 코드가 자동으로 생성되기 때문에 코드를 작성하는 매우 빠른 방법입니다.

 

데모 비디오는 다음과 같습니다.

 

Mito용 설치 명령:

python -m pip install mitoinstaller
python -m mitoinstaller install

 

그런 다음 Jupyter Lab을 열고 Mitosheet를 호출합니다.

import mitosheet
mitosheet.sheet()

 

전체 지침은 Mito 웹사이트 의 "docs"에서 찾을 수 있습니다.

 

Mito의 기능은 다음과 같습니다.

  • 그래프 작성
  • 피벗 테이블
  • 병합
  • 필터링 및 정렬
  • 요약 통계
  • 중복 제거
  • Null 값 채우기
  • Excel 파일 가져오기 및 내보내기
  • 등등..

 

 

2. Plotly

Python의 데이터 시각화는 Matplotlib 및 Seaborn과 같은 패키지를 통해 데이터 과학자에게 매우 인기가 있습니다. 

그러나 이러한 패키지는 철저하기는 하지만 시각적으로 자극적이거나 인터랙티브한 차트를 만들지는 않습니다. 

Plotly는 이 두 영역에서 큰 발전을 이루고 있습니다.

 

Plotly는 모든 Python 사용자가 사용하고 싶어하는 표준 차트를 제공합니다. 다음은 웹사이트의 스크린샷입니다.

 

 

그러나 ML 및 AI를 중심으로 한 고급 그래픽에 대한 액세스도 제공합니다.

 

 

그러나 진정한 혁신은 대화형 차트에 대한 Plotly의 초점입니다. 

보기를 변경하고 싶을 때마다 코드를 조정하는 것에 대해 걱정할 필요 없이 Plotly는 그렇게 할 수 있는 GUI를 제공합니다.

 

이것은 Plotly Graphing Package 문서 의 첫 번째 예입니다 .

 

 

이 간단한 예에서도 오른쪽의 UI 드롭다운을 사용하여 그래프의 색상을 변경할 수 있습니다.

설정의 용이성과 그래프의 유연성의 조합 측면에서 Plotly는 내가 만난 최고의 그래프 패키지입니다.

 

3.  Arrow

날짜 작업은 Python 데이터 분석에서 가장 성가신 부분 중 하나입니다. Arrow는 이것을 해결합니다.

 

Arrow를 사용하면 시간 값과 타임 스탬프를 쉽게 조작, 생성 및 관리할 수 있습니다.

설치하려면 다음을 실행하십시오.

pip install -U arrow
import arrow

 

다음은 패키지의 비디오입니다.

 

날짜를 처리하려면 다양한 패키지와 기술이 필요할 수 있습니다. 

Arrow의 가장 큰 장점 중 하나는 이러한 모든 요구 사항을 하나의 패키지로 결합하여 날짜 및 시간 처리를 통합한다는 것입니다.

 

Arrow 내에서 다음을 수행할 수 있습니다.

  • 시간대 처리 및 통합
  • 문자열에서 날짜와 시간 추출
  • 타임스탬프 생성
  • 시간이 지남에 따라 반복
  • 유닉스 시간을 사용
  • 날짜 형식 조작
  • 등등..
반응형

댓글