chapter 1.
1.피처 정규화 수치형 데이터에 대한 피처 정규화가 중요한 이유는? 모든 특징을 대략적으로 비슷한 수치 구간 내로 이동시킬 수 있음 두 가지 방법 선형함수 정규화(min - max scailng) 데이터에 대해 선형변환을 진행하여 결괏값이 [0, 1] 범위에 투영되도록 만듬 표준 정규화(z-score) 데이터를 평균이 0이고 표준편차가 1인 분포상으로 투영시킴 왜 수치형 데이터에 대해 정규화를 진행해야 하는가? 정규화되지 않은 데이터를 사용하면 비교적 많은 반복 과정을 거쳐야만 최적해를 찾을 수 있는 반면 정규화를 거치면 더 바르게 경사하강법을 이용해 최적해를 찾을 수 있음 2. 범주형 피처 데이터 정제 작업을 진행할 때 범주형 피처는 어떻게 처리해야 하는가? 순서형 인코딩 (=대소관계 - ) 원핫인코딩..
2024.01.06