파이썬(9)
-
데이터사이언스_attribute transform / discretization
attribute transform은 크기의 차이를 해소하기 위해 속성 값을 변환하는 것이다. 예를들어 평균, 표준편차, z-score와 같이 변환할 수 있을 것이다. 이처럼 normalization이나 standardization은 데이터를 처음 받을 때 즉, 거리를 재기 전이나 머신러닝 모델을 만들기 전에 진행하는 것이 좋다고 말할 수 있다. discretization은 카테고리형 데이터를 numerical 형태로 변환하는 것이다. cut함수를 사용하여 범위를 가진 형태로 변환한다.
2023.11.13 -
데이터사이언스_거리 계산
1.맨해튼 거리, 유클리디안 거리, infinite 거리 계산 1차 거리 계산(맨해튼 거리 방식) 2차 거리 계산(유클리디안 거리 방식) infinite(무한대) 거리 계산 2.코사인 거리 계산 3.상관관계 계산
2023.11.13 -
numpy - vstack과 hstack 함수
2행 5열과, 2행 3열의 행렬에 vstack을 진행하면 다음과 같은 오류가 발생한다. 따라서, vstack을 사용할 시에는 열을 동일시 해야한다는 것을 확인할 수 있다.
2023.11.13