EDA, AutoML, 모델 비교, 초매개변수 조정 등…
캐글이란?
Kaggle은 데이터 과학 목표를 달성하는 데 도움이 되는 강력한 도구와 리소스를 제공하는 세계 최대 데이터 과학 커뮤니티입니다.
Kaggle은 데이터 과학자와 기계 학습 엔지니어의 온라인 커뮤니티입니다. Kaggle에는 데이터 과학자가 쉽게 작업하고 기술을 향상할 수 있는 많은 실제 데이터 세트가 포함되어 있습니다. 또한 Kaggle에 있는 대회는 기계 학습 모델을 위한 훌륭한 벤치마크 플랫폼입니다. Kaggle의 대회를 보면 강력한 ML 모델을 찾을 수 있습니다.
1. 데이터 과학에서 무엇이 바뀌었습니까?
https://medium.com/databulls/welcome-2022-what-has-changed-in-data-science-in-2021-dac24bd37929
Welcome, 2022🎉. What Has Changed in Data Science in 2021?
Best Data Science Tools, Methods, and Techniques such as Cloud Computing Product, Automated ML Tools, Courses, IDEs, Data Product, Data…
medium.com
2. 베이스라인 모델 CLF, Random-ML-AutoML
이 작업의 목적은 데이터 과학의 기본 모델을 설명하는 것입니다. 여기 에서 데이터 세트 와 아래 작업 기사를 볼 수 있습니다 .
What Are Baseline Models and Benchmarking For Machine Learning, Why We Need Them?
Random, Machine Learning, Automated ML Baseline Models and Benchmarking For ML…
pub.towardsai.net
3. TPS-2월 22일, EDA -> Ignore-Important Cols
이 연구의 목적은 탐색적 데이터 분석을 수행하는 것입니다. 이것은 TPS-Feb22 대회의 1부입니다.
여기 에서 데이터세트 와 전체 코드를 아래에서 찾을 수 있습니다 .
https://www.kaggle.com/hasanbasriakcay/tps-feb22-eda-ignore-important-cols
📊 TPS-Feb22, EDA -> Ignore-Important Cols 🔥
Explore and run machine learning code with Kaggle Notebooks | Using data from Tabular Playground Series - Feb 2022
www.kaggle.com
4. Pycaret 모델 비교 [0.97LB]
TPS-Feb22 대회 2부입니다. 이 노트북에서 모델링 작업을 했고 ml 모델의 정확도 점수는 0.97입니다.
여기 에서 데이터세트 와 전체 코드를 아래에서 찾을 수 있습니다 .
https://www.kaggle.com/hasanbasriakcay/tps-feb22-pycaret-model-comparisons-0-97-lb
🏆 TPS-Feb22, Pycaret-Model Comparisons [0.97 LB]
Explore and run machine learning code with Kaggle Notebooks | Using data from Tabular Playground Series - Feb 2022
www.kaggle.com
5. 500💲 — 225.000💲 DS 소득의 차이
이 기사는 데이터 과학에서 고소득을 위한 중요한 재능, 도구, 국가의 특징 및 회사의 특징에 관한 것입니다.
https://www.kaggle.com/c/kaggle-survey-2019
2019 Kaggle Machine Learning & Data Science Survey
www.kaggle.com
What Are The Differences Between Data Scientists That Earn 500💲 And 225.000💲 Yearly?
This article is about important talents, tools, features of the country, and features of the company for high income in data science.
medium.com
6. EDA + Feature Engineering
이 작업의 목적은 탐색적 데이터 분석 및 기능 엔지니어링을 수행하는 것입니다. 이것은 TPS-Jan22 대회의 1부입니다. 여기 에서 데이터세트 와 전체 코드를 아래에서 찾을 수 있습니다 .
https://www.kaggle.com/hasanbasriakcay/playground-jan-22-eda-feature-engineering
📊Playground-Jan 22, EDA + Feature Engineering🔥
Explore and run machine learning code with Kaggle Notebooks | Using data from Tabular Playground Series - Jan 2022
www.kaggle.com
7. TSA + FE + 모델링
이것은 TPS-Jan22 대회의 2부입니다.
이 노트북에서는 피쳐 엔지니어링 및 모델링 작업을 수행했습니다.
여기 에서 데이터세트 와 전체 코드를 아래에서 찾을 수 있습니다 .
8. EDA + Feature Engineering
나는 이 기사에서 TPS-Mar21 경쟁에 대한 나의 작업을 말했다.
이것은 내가 LB %14에 속한 TPS-Mar21 대회의 1부입니다.
이 파트에서는 EDA 및 기능 엔지니어링에 대해 작업했습니다.
여기 에서 데이터 세트를 볼 수 있으며 아래 작업 기사를 찾을 수 있습니다.
Tabular Playground Series-Mar 2021, Leaderboard %14, EDA + Feature Engineering 🔥
This is part 1 of the TPS-Mar21 competition that I am in LB %14.
medium.com
9. EDA + Feature Engineering XGB, CatBoost, LGBM, Optuna LB:%14
이것은 내가 LB %14에 속한 TPS-Mar21 대회의 2부입니다.
기사의 이 부분에서는 Xgboost, Catboost 및 LGBM의 세 가지 기계 학습 모델을 비교했습니다.
경쟁 메트릭은 ROC AUC(수신기 작동 특성 곡선 아래 면적)입니다.
여기 에서 데이터 세트를 볼 수 있으며 아래 작업 기사를 찾을 수 있습니다.
https://medium.com/databulls/tps-mar21-leaderboard-14-xgb-catboost-lgbm-optuna-cdffb5124368
TPS-Mar21, Leaderboard %14, XGB, CatBoost, LGBM + Optuna 🚀
Part 2, Xgboost, CatBoost, and Lightgbm with Optuna…
medium.com
10. 전자상거래 예측 Fbprophet + Optuna
이 기사에서는 Optuna와 함께 Fbprophet을 사용하는 방법에 대해 자세히 살펴보았습니다.
이 문서에서 작업할 때 전자 상거래 데이터 데이터 세트를 사용 했습니다. 작품의 기사는 아래에서 찾을 수 있습니다.
https://medium.com/databulls/e-commerce-forecasting-fbprophet-optuna-6e9a83d89079
E-Commerce Forecasting Fbprophet + Optuna
A quick article about how to use Optuna with Fbprophet.
medium.com
'Daily Review' 카테고리의 다른 글
라벨 불균형 사기 탐지(Fraud Detection)의 분류 모델링 - 2 (1) | 2022.09.06 |
---|---|
라벨 불균형 사기 탐지(Fraud Detection)의 분류 모델링 - 1 (0) | 2022.09.06 |
비지도 학습 기법을 적용한 사기 탐지 (Fraud Detection) (0) | 2022.09.05 |
데이터 분석 분야를 바꿀 3가지 Python 패키지 (0) | 2022.09.05 |
데이터 사이언스 관련 직무 급여 데이터셋을 분석했습니다. (0) | 2022.09.05 |
댓글