머신러닝 완벽가이드(2)
-
분류
지도학습 (정답이 주어진 상태) 주어진 데이터의 피처와 레이블 값을 머신러닝 알고리즘으로 학습하고 모델을 생성하여 새로운 데이터(피처)가 주어졌을 때 해당 데이터의 레이블 값이 무엇인지 예측하도록 하는 것 알고리즘 종류 나이브 베이즈 (Naïve Bayes) : 특성들 사이의 독립을 가정하는 베이즈 정리를 기반으로 한 알고리즘 로지스틱 회귀 (Logistic Regression) : 회귀 알고리즘이지만 시그모이드 함수를 사용하여 분류에도 사용이 가능. 독립 변수와 선형 관계성에 기반한다. 결정트리 (Decision Tree) : 데이터 균일도에 따른 규칙을 기반으로 하는 알고리즘 서포트 벡터 머신 (Support Vector Machine, SVM) : 개별 클래스 간 최대 분류 마진을 효과적으로 잡아줌..
2024.01.05 -
회귀
회귀 Linear Regression 회귀에서 RSS는 비용(Cost), 비용 함수, 손실 함수(loss function)라고 함 머신러닝 회귀 알고리즘은 데이터를 계속 학습하면서 이 비용 함수가 반환하는 값을 지속해서 감소시키고 최종적으로는 더 이상 갑소하지 않는 최소의 오류 값을 구하는 것임 1)단순 선형 회귀(simple linear regression) : 한개의 독립 변수로 타겟 변수 예측 2)다중 선형 회귀(multiple linear regression) : 다수의 독립변수로 타겟 변수 예측 ex) 아들의 키 예측(y) = 아버지의 키 (x1) + 어머니의 키(x2) ...... 어머니 몸무게 …etc.. 경사하강법 점진적으로 반복적인 계산을 통해 w 파라미터를 업데이트하면서 오류 값이 최소..
2024.01.05