ClumnTransformer
2024. 5. 8. 19:21ㆍ데이터분석
ColumnTransformer는 파이썬의 scikit-learn 라이브러리에서 제공하는 클래스로, 데이터 전처리 과정에서 서로 다른 변환을 다른 열 또는 열 그룹에 적용할 수 있도록 해준다.
이를 통해 각 열에 가장 적합한 전처리 방법을 선택적으로 적용할 수 있어, 데이터 처리 파이프라인을 효율적으로 구성할 수 있다.
예를 들어, 데이터 세트에 숫자형 데이터와 범주형 데이터가 혼합되어 있는 경우, 숫자형 데이터에는 표준화나 정규화를 적용하고, 범주형 데이터에는 원-핫 인코딩을 적용할 수 있다.
ColumnTransformer를 사용하면 이러한 다양한 처리를 단일 변환기 인터페이스를 통해 간단하게 적용할 수 있다.
'데이터분석' 카테고리의 다른 글
[시계열 분석 개념 및 실습] Kaggle(Store Sales - Time Series Forecasting) (0) | 2024.07.18 |
---|---|
시계열 데이터 분석 (1) | 2024.07.07 |
서울 법정동(자치구) 코드북 (0) | 2024.01.30 |
melt(데이터프레임 변형) 개념 및 예제 (0) | 2024.01.19 |
linear regression(ridge & lasso) coding implementation (0) | 2023.11.22 |