Tutorial 1: Vorhersage von Netzlasten
Ziel
Nachdem wir in Tutorial 2 Muster in den Netzlasten analysiert und Unterschiede zwischen Wochentagen und Sonn-/Feiertagen identifiziert haben, ist das Ziel dieses Tutorials, die Netzlast basierend auf historischen Daten vorherzusagen. Wir nutzen die bereinigten Daten der Global Energy Forecasting Competition Hong, Pinson, and Fan (2014) und entwickeln zwei verschiedene Modelle, um die Netzlast zu prognostizieren. Die Vorhersagen und die tatsächlichen Werte werden mit Plotly interaktiv visualisiert, um die Modellleistung intuitiv zu vergleichen. Zusätzlich berechnen wir den Mean Absolute Percentage Error (MAPE) für Trainings-, Validierungs- und Testsets, um die Genauigkeit der Modelle zu bewerten.
Aufgaben
- Datenaufteilung: Teilen Sie die Zeitreihendaten in 70% Training, 15% Validierung und 15% Test auf, wobei die zeitliche Reihenfolge erhalten bleibt (kein Shuffling).
- Modellentwicklung: Entwickeln Sie zwei verschiedene Modelle zur Vorhersage der Netzlast z.B.:
- Modell 1: Lineare Regression mit Prädiktoren wie Wochentag, Stunde des Tages, Temperatur und einer Interaktion zwischen Wochentag und Stunde.
- Modell 2: Entscheidungsbaum mit denselben Prädiktoren, ergänzt um eine Transformation (z. B. quadratische Temperatur).
- Fehlerbewertung: Berechnen Sie den MAPE für Trainings-, Validierungs- und Testsets für beide Modelle.
- Visualisierung: Erstellen Sie eine interaktive Zeitreihenvisualisierung mit Plotly, die die tatsächliche Netzlast und die Vorhersagen beider Modelle für das Testset darstellt.