Data preprocessing(데이터사이언스개론3-2)
Aggregation 여러 attributte(특성)을 하나로 통합하는 것 목적 : attribute나 object를 감소시키기 위함 Sampling 데이터를 감소하기 위한 메인 기술 통계자료에서 모든 데이터를 얻기는 매우 힘든 일 데이터 마이닝에 주로 사용 샘플링의 주요포인트 샘플이 대표성(representative)을 띈다면 전체 데이터를 사용하는 만큼 효과가 있음 이를 위한 조건은 오리지날 데이터와 대략 비슷한 properties(특성)를 가지는 것임. 샘플링의 타입 심플 랜덤 샘플링 (simple random sampling) 특정한 아이템이 선택되는 것에 동일한 가능성이 존재 계층 샘플링 (stratified sampling) Split the data into several partition ..
2023.09.21