Lassen Sie uns sehen, wie der Luftqualitätsindex mit Python vorhergesagt werden kann. Der AQI wird basierend auf der Menge der chemischen Schadstoffe berechnet. Durch machine learning können wir den AQI vorhersagen.

AQI: Der Luftqualitätsindex ist ein Index für die tägliche Berichterstattung über die Luftqualität. Mit anderen Worten, es ist ein Maß dafür, wie sich die Luftverschmutzung innerhalb kurzer Zeit auf die Gesundheit auswirkt. Der AQI wird basierend auf der durchschnittlichen Konzentration eines bestimmten Schadstoffs berechnet, die über ein Standardzeitintervall gemessen wurde. Im Allgemeinen beträgt das Zeitintervall für die meisten Schadstoffe 24 Stunden, für Kohlenmonoxid und Ozon 8 Stunden.

Wir können anhand des AQI sehen, wie hoch die Luftverschmutzung ist

AQI Level AQI-Bereich
Gut 0 - 50
Mäßig 51 - 100
Ungesund 101 - 150
Ungesund für starke Leute 151 - 200
Gefährlich 201+

Lassen Sie uns den AQI basierend auf chemischen Schadstoffen mithilfe des Machine Learning-Konzepts ermitteln. 

Hinweis: Um den Datensatz herunterzuladen, klicken Sie hier .



Datensatzbeschreibung

Es enthält 8 Attribute, von denen 7 chemische Verschmutzungsmengen und eines der Luftqualitätsindex sind. PM2.5-AVG, PM10-AVG, NO2-AVG, NH3-AVG, SO2-AG und OZONE-AVG sind unabhängige Attribute. air_quality_index ist ein abhängiges Attribut. Da air_quality_index basierend auf den 7 Attributen berechnet wird.

Da die Daten numerisch sind und keine fehlenden Werte in den Daten vorhanden sind, ist keine Vorverarbeitung erforderlich. Unser Ziel ist es, den AQI vorherzusagen. Diese Aufgabe ist also entweder Klassifizierung oder Regression. Da unser Klassenlabel kontinuierlich ist, ist eine Regressionstechnik erforderlich.

Regression ist eine überwachte Lerntechnik, die zu den Daten in einem bestimmten Bereich passt. Beispiel für Regressionstechniken in Python:

  • Zufälliger Waldregressor
  • Ada Boost Regressor
  • Bagging Regressor
  • Lineare Regression usw.
import pandas as pd 
  
train=pd.read_csv('AQI.csv') 
  
train.head()

Ausgabe:

from sklearn.ensemble import AdaBoostRegressor 
from sklearn.ensemble import RandomForestRegressor 
  
m1 = RandomForestRegressor() 
  
train1 = train.drop(['air_quality_index'], axis=1) 
target = train['air_quality_index'] 
  
m1.fit(train1, target) 
                      
                      
                      
                      
                      
                      
  
m1.score(train1, target) * 100
  
m1.predict([[123, 45, 67, 34, 5, 0, 23]]) 
  
  
m2 = AdaBoostRegressor() 
  
m2.fit(train1, target) 
  
                  
  
m2.score(train1, target)*100
  
m2.predict([[123, 45, 67, 34, 5, 0, 23]])

 

Ausgabe:

 

Auf diese Weise können wir sagen, dass wir durch gegebene Testdaten 123 und 95 erhalten haben, so dass der AQI ungesund ist.

machine learning