Python ile Multiple Lineer Regresyon

Bir y eksenine birden fazla faktörlerin etki etmesiyle multiple lineer regresyon durumu gerekmektedir. Lineer regresyon anlatımındaki maaş ve deneyime yaş eklersek multiple olur yani maaşı etkileyen iki faktör var artık elimizde. Matematiksel olarak lineer regresyon ve multiple regresyon :

Lineer regresyon : y = b0 + b1*x

Multiple lineer regresyon : y = b0 + b1*x1 +b2*x2+…+bn*xn

Veri setimiz şu şekildedir :

Python ile multiple lineer regresyon nasıl yapılır?

import pandas as pd
import numpy as np

#Multiple lineer Regresyon için sklearn ktüphanesini import ediyoruz.
from sklearn.linear_model import LinearRegression

#veri setimizi dataframe'e çeviriyoruz.
df = pd.read_csv("/MultipleLineerRegresyonDataset.csv",sep=";")

#bütün satırları ve  0,1 ve 2. kolonları al.
x = df.iloc[:,[0,2]].values

y = df.maas.values.reshape(-1,1)

multiple_linear_regression = LinearRegression()

#yukarıda verdiğimiz x ve y değerini kullanarak bir line fit etmek için
multiple_linear_regression.fit(x,y)

#bo değerini bulalım.
print("bo: ",multiple_linear_regression.intercept_)

bo:  [10376.62747228]

#b1, b2 değerini bulalım.
print("b1, b2: ",multiple_linear_regression.coef_)
b1, b2:  [[1525.50072054 -416.72218625]]

#tahmin yaptıralım. Yaş 35 10 yıllık tecrübe ve yaş 35 5 yıllık tecrübeye sahip birinin maaşını bulalım.
multiple_linear_regression.predict(np.array([[10,35],[5,35]]))
Out[4]: 
array([[11046.35815877],
       [ 3418.85455609]])

ouput :

Yorum bırakın