전체 글(124)
-
데이터 세트 분리 및 시각화(선형 회귀)
import matplotlib.pyplot as plt import pandas as pd dataset=pd.read_csv('LinearRegressionData.csv') dataset.head() X=dataset.iloc[:,:-1].values #독립변수 y=dataset.iloc[:,-1].values #종속변수score만 iloc 진행 from sklearn.model_selection import train_test_split X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.2,random_state=0) #test_size는 8:2비율로 나눈다는 의미 / random_state는 랜덤으로 데이터를 뽑기 X,len(X) #..
2023.09.17 -
선형 회귀(LinearRegression)
선형 회귀 import matplotlib.pyplot as plt import pandas as pd dataset=pd.read_csv('LinearRegressionData.csv') dataset.head() X=dataset.iloc[:,:-1].values #처음부터 마지막 컬럼 직전까지의 데이터 (독립 변수)) y=dataset.iloc[:,-1].values #마지막 칼럼 데이터(종속변수 - 결과) from sklearn.linear_model import LinearRegression reg=LinearRegression() #객체 생성 reg.fit(X,y) #fit은 학습을 시키는 것(모델 생성) y_pred=reg.predict(X) #X에 대한 예측값 y_pred plt.scatt..
2023.09.17 -
머신러닝 기초개념
머신러닝의 분류 1.지도학습(supervised learning) 정답이 있는 데이터를 통해 데이터 분류 / 올바른 결과 예측 지도학습은 회귀(regression) / 분류(classfication)로 나눠진다. 1-1)회귀(regression) 연속형 변수 변수들 간의 상관관계를 찾는 것, 연속적인 데이터로부터 결과를 예측하는 것 (예측 결과가 숫자일 때) ex)근속연수에 따른 임금, 키에 따른 몸무게, 사용 기간에 따른 스마트폰 가격 1-2)분류(classification) 범주형 변수 주어진 데이터를 정해진 범주에 따라 분류 (예측 결과가 숫자가 아닐 때) ex) 스팸 메일 필터링, 시험 합격 여부 ,재활용 분리수거 품목, 악성 종양 여부 2.비지도 학습(unsupervised learning) 정..
2023.09.17 -
(파이썬)class 개념 이해
class FourCal: def setdata(self,first,second): self.first=first self.second=second def add(self): result=self.first+self.second return result def minus(self): #minus 함수만들기 result=self.first-self.second return result def multiple(self): #곱셈 result=self.first*self.second return result def division(self): #나눗셈 result=self.first/self.second return result a=FourCal() #a를 fourcal 객체에 적용하기 a.setdata(4,..
2023.09.17