Die Polynomregression ist eine Form der linearen Regression, bei der die Beziehung zwischen der unabhängigen Variablen x und der abhängigen Variablen y als Polynom n-ten Grades modelliert wird . Die Polynomregression passt zu einer nichtlinearen Beziehung zwischen dem Wert von x und dem entsprechenden bedingten Mittelwert von y, bezeichnet mit E (y | x).

Warum Polynomregression:

  • Es gibt einige Beziehungen, von denen ein Forscher annehmen wird, dass sie krummlinig sind. Es ist klar, dass solche Fälle einen Polynomterm enthalten.
  • Inspektion von Rückständen. Wenn wir versuchen, ein lineares Modell an gekrümmte Daten anzupassen, enthält ein Streudiagramm von Residuen (Y-Achse) auf dem Prädiktor (X-Achse) Flecken mit vielen positiven Residuen in der Mitte. Daher ist es in einer solchen Situation nicht angemessen.
  • Bei der üblichen multiplen linearen Regressionsanalyse wird davon ausgegangen, dass alle unabhängigen Variablen unabhängig sind. Im polynomialen Regressionsmodell ist diese Annahme nicht erfüllt.

Verwendung der Polynomregression:
Diese werden im Wesentlichen verwendet, um nichtlineare Phänomene zu definieren oder zu beschreiben, wie z.

  • Wachstumsrate von Geweben.
  • Fortschreiten von Krankheitsepidemien
  • Verteilung von Kohlenstoffisotopen in Seesedimenten

Das grundlegende Ziel der Regressionsanalyse besteht darin, den erwarteten Wert einer abhängigen Variablen y als Wert einer unabhängigen Variablen x zu modellieren. In der einfachen Regression haben wir folgende Gleichung verwendet:

y = a + bx + e

Hier ist y eine abhängige Variable, a ist ein y-Achsenabschnitt, b ist die Steigung und e ist die Fehlerrate.



In vielen Fällen funktioniert dieses lineare Modell nicht. Wenn wir beispielsweise die Produktion der chemischen Synthese in Bezug auf die Temperatur analysieren, bei der die Synthese in solchen Fällen stattfindet, verwenden wir ein quadratisches Modell

y = a + b1x + b2 ^ 2 + e

Hier ist y eine abhängige Variable von x, a ist ein y-Achsenabschnitt und e ist die Fehlerrate.

Im Allgemeinen können wir es für den n-ten Wert modellieren.

y = a + b1x + b2x ^ 2 + .... + bnx ^ n

Da die Regressionsfunktion in Bezug auf unbekannte Variablen linear ist, sind diese Modelle vom Schätzpunkt aus linear.

Berechnen wir daher mithilfe der Least Square-Technik den Antwortwert y.

Polynomregression in Python:
Klicken Sie hier, um den für die Analyse der Polynomregression verwendeten Datensatz abzurufen .

Schritt 1: Bibliotheken und Dataset importieren
Importieren Sie die wichtigen Bibliotheken und das Dataset, die wir zur Durchführung der Polynomregression verwenden.

import numpy as np 
import matplotlib.pyplot as plt 
import pandas as pd 
  
datas = pd.read_csv('data.csv') 
datas 


 



Schritt 2: Teilen Sie den Datensatz in 2 Komponenten

Teilen Sie den Datensatz in zwei Komponenten auf: X und yX enthalten die Spalte zwischen 1 und 2. y enthält die Spalte 2.

X = datas.iloc[:, 1:2].values 
y = datas.iloc[:, 2].values 

 
Schritt 3: Anpassen der linearen Regression an den Datensatz

Anpassen des linearen Regressionsmodells An zwei Komponenten.

from sklearn.linear_model import LinearRegression 
lin = LinearRegression() 
  
lin.fit(X, y) 

 
Schritt 4: Anpassen der Polynomregression an den Datensatz

Anpassen des Polynom-Regressionsmodells an zwei Komponenten X und y.

from sklearn.preprocessing import PolynomialFeatures 
  
poly = PolynomialFeatures(degree = 4) 
X_poly = poly.fit_transform(X) 
  
poly.fit(X_poly, y) 
lin2 = LinearRegression() 
lin2.fit(X_poly, y) 

 
Schritt 5: In diesem Schritt visualisieren wir die Ergebnisse der linearen Regression mithilfe eines Streudiagramms.

plt.scatter(X, y, color = 'blue') 
  
plt.plot(X, lin.predict(X), color = 'red') 
plt.title('Linear Regression') 
plt.xlabel('Temperature') 
plt.ylabel('Pressure') 
  
plt.show() 


 
Schritt 6: Visualisierung der Ergebnisse der Polynomregression mithilfe eines Streudiagramms.

plt.scatter(X, y, color = 'blue') 
  
plt.plot(X, lin2.predict(poly.fit_transform(X)), color = 'red') 
plt.title('Polynomial Regression') 
plt.xlabel('Temperature') 
plt.ylabel('Pressure') 
  
plt.show() 


 
Schritt 7: Vorhersage eines neuen Ergebnisses sowohl mit linearer als auch mit polynomieller Regression.

lin.predict(110.0) 

lin2.predict(poly.fit_transform(110.0)) 

 

Vorteile der Verwendung der Polynomregression:

  • Darunter kann ein breiter Funktionsumfang eingepasst werden.
  • Das Polynom passt grundsätzlich zu einem breiten Krümmungsbereich.
  • Das Polynom liefert die beste Annäherung an die Beziehung zwischen abhängiger und unabhängiger Variable.

Nachteile der Verwendung der Polynomregression

  • Diese reagieren zu empfindlich auf Ausreißer.
  • Das Vorhandensein von einem oder zwei Ausreißern in den Daten kann die Ergebnisse einer nichtlinearen Analyse ernsthaft beeinflussen.
  • Darüber hinaus gibt es leider weniger Modellvalidierungswerkzeuge zur Erkennung von Ausreißern bei nichtlinearer Regression als bei linearer Regression.

machine learning