데이터 분석 스터디 네번째
머신러닝 모델을 만들기 앞서 그 과정을 크게 살펴보면 전처리 - 모델 만들기 - 예측 및 성능 평가 과정으로 이뤄진다. 데이터셋은 adult_csv파일을 이용하였고 데이터를 불러왔다. 우리가 만들 모델은 소득 예측 모델이다. 모델을 만들기 전 예측 변수와 타겟 변수를 지정해야하는데 타겟 변수는 종속변수 y로 이해하고 예측 변수는 독립변수 x로 이해할 수 있다. 이 데이터셋에서 파란색으로 표시된 income이 타겟 변수 나머지 핑크색 변수들이 예측 변수이다. 노락색으로 표시된 ' fnlwgt'변수는 가중치를 나타내는 변수이므로 분석에 큰 영향을 주지 못하므로 제거해주었다. [원핫 인코딩] get_dummies 함수를 사용 원핫 인코딩은 문자형 데이터를 숫자형 데이터로 변환시키는 것이다. 예시1을 통해 살펴..
2023.11.12