선형 회귀(LinearRegression)
2023. 9. 17. 14:57ㆍ데이터분석
선형 회귀
import matplotlib.pyplot as plt
import pandas as pd
dataset=pd.read_csv('LinearRegressionData.csv')
dataset.head()
X=dataset.iloc[:,:-1].values #처음부터 마지막 컬럼 직전까지의 데이터 (독립 변수))
y=dataset.iloc[:,-1].values #마지막 칼럼 데이터(종속변수 - 결과)
from sklearn.linear_model import LinearRegression
reg=LinearRegression() #객체 생성
reg.fit(X,y) #fit은 학습을 시키는 것(모델 생성)
y_pred=reg.predict(X) #X에 대한 예측값
y_pred
plt.scatter(X,y) #산점도
plt.plot(X,y_pred,color='green') #선 그래프 #y는 예측값으로지정
plt.title('score by hours')
plt.xlabel('hour')
plt.ylabel('score')
plt.show()
print('9시간 공부 시 예장점수',reg.predict([[9]]))
9시간 공부 시 예장점수 [93.77478776]
In [44]:
reg.coef_ #기울기(a)
array([10.44369694])
In [42]:
reg.intercept_ # y 잘편 (b)
-0.218484702867201
In [ ]:
마지막으로 결과확인을 위해 검토를 하면 93.7748의 값이 나오는 것을 확인할 수 있다.
학습자료:
파이썬 코딩 무료 강의 (활용편7) - 머신러닝, 영화 추천 시스템 만들기
https://www.youtube.com/watch?v=TNcfJHajqJY&t=2391s
'데이터분석' 카테고리의 다른 글
Regression analysis(선형 회귀) 개념 & 코딩 실습 (0) | 2023.11.15 |
---|---|
데이터사이언스_결측치 처리/인덱싱 (0) | 2023.11.13 |
데이터사이언스_원핫인코딩 (0) | 2023.11.13 |
데이터 세트 분리 및 시각화(선형 회귀) (0) | 2023.09.17 |
머신러닝 기초개념 (0) | 2023.09.17 |