Home Data Science Wie prognostiziert man hierarchische Zeitreihen?

Wie prognostiziert man hierarchische Zeitreihen?

Wenn es um die Prognose von Zeitreihen geht, heiligt grundsätzlich der Zweck die Mittel, d. h. das akkurateste Modell ist das Modell der Wahl. Dabei sollte das Modell jedoch stets so einfach wie möglich gehalten werden, um das Risiko einer Überanpassung möglichst zu minimieren. Datengetriebene Algorithmen prognostizieren Zeitreihen in der Regel univariat, es wird also jede Beobachtungsreihe separat modelliert.

Das bedeutet, eine Zeitreihe, wie zum Beispiel der Gewinn eines Unternehmens, wird zunächst auf zentrale Charakteristika untersucht und anhand derer modelliert: 

Auf dieser Basis wird die entsprechende Zeitreihe über den gewünschten Horizont vorhergesagt. Die Smart Predict Funktionalität in der SAP Analytics Cloud bietet einen guten Einstieg in die Prognose von Zeitreihen. Für die Umsetzung komplexerer und individualisierter Methoden eignen sich statistische Softwarelösungen wie R oder Python. 

 

Mehr zur Prognose von Zeitreihen allgemein (inkl. Definition, Funktion und Prognosemodellen) finden Sie in diesem Wiki-Artikel.

 Was sind hierarchische Zeitreihen? 

Hierarchische Zeitreihen sind in jedem Unternehmen, zum Beispiel in Form einer Gewinn- und Verlustrechnungs- (GuV) oder einer Bilanzhierarchie, allgegenwärtig. 

Der Einfachheit halber betrachten wir in diesem Artikel eine simple GuV-Hierarchie mit drei Ebenen. Die oberste Hierarchieebene besteht lediglich aus einer Position, dem Unternehmensergebnis. Dieses Ergebnis ist die Summe der beiden Zeitreihen Aufwand und Ertrag, die sich auf der mittleren Ebene befinden. Auf der untersten Ebene sind die sogenannten Basiszeitreihen Personalkosten, Materialkosten, Umsatzerlöse und ausserordentliche Erträge angesiedelt. Dabei bildet der Aufwand die Summe aus Personal– und Materialkosten, der Ertrag die Summe aus Umsatzerlösen und ausserordentlichen Erträgen. Insgesamt betrachten wir also sieben Zeitreihen, wobei die Beobachtungen der oberen beiden Ebenen, also Unternehmensergebnis, Aufwand und Ertrag, lediglich Aggregationen der Basiszeitreihen sind. 

In der Praxis sind Hierarchien in Konzernen wesentlich komplexer, sodass zehn oder mehr Ebenen keine Seltenheit sind. Die drei Ebenen im vorangegangenen Beispiel genügen jedoch, um alle essenziellen Konzepte mit Bezug zur Prognose hierarchischer Zeitreihen zu erläutern. 

 

Methoden zur Prognose hierarchischer Zeitreihen 

Der einfachste Ansatz wäre, für jede der sieben Zeitreihen in der beschriebenen Hierarchie das akkurateste Modell zu wählen und dieses eine Prognose erstellen zu lassen. Allerdings wird bei diesem Vorgehen die Struktur der Hierarchie verletzt. So ist beispielsweise die Prognose des Aufwands für gewöhnlich nicht gleich der Summe der Vorhersagen für die Personalkosten und die Materialkosten. Um diese notwendige Bedingung der Hierarchie zu erfüllen, existieren drei Methoden, die im Folgenden kurz erläutert werden: 

Der wohl intuitivste Ansatz prognostiziert lediglich die Basiszeitreihen – in diesem Fall Personalkosten, Materialkosten, Umsatzerlöse und ausserordentliche Erträge, mittels gängiger Algorithmen. Dann werden die Vorhersagen gemäss der oben beschriebenen Hierarchie auf aggregiert, d. h. die Prognose des Aufwands ist die Summe der Vorhersagen für die Personalkosten und die Materialkosten 

Obwohl diese Methode auf den ersten Blick die naheliegendste Variante ist, hat sie vor allem bei komplexen und vielschichtigen Hierarchien ihre Schwächen. Dies liegt darin begründet, dass die Zeitreihen auf den untersten Ebenen häufig wenig Struktur haben und daher schwer zu prognostizieren sind. Hier kann es also zu erheblichen Prognosefehlern kommen. Werden die Vorhersagen dieser Basiszeitreihen nun über zahlreiche Hierarchieebenen auf aggregiert, ist auch die Gefahr der Aggregierung von Prognosefehlern real. Dies kann unter Umständen zu starken Abweichungen bei den wichtigsten betriebswirtschaftlichen Kennzahlen, die üblicherweise auf den höheren Hierarchieebenen angesiedelt sind, führen. 

Alternativ kann man nur die Zeitreihe auf der obersten Hierarchieebene, im beschriebenen Szenario das Unternehmensergebnis, mittels eines geeigneten Algorithmus vorhersagen. Dies hat den Vorteil, dass dieser Indikator in der Regel eine solide Struktur hat und somit akkurat prognostiziert werden kann. Leider ist nicht intuitiv klar, wie sich diese Prognose auf die unteren Ebenen verteilt. Hier gibt es verschiedene Ansätze, zum Beispiel kann die Vorhersage des Unternehmensergebnisses anhand der historischen Gewichte auf die Prognosen für den Aufwand und den Ertrag verteilt werden und so weiter. Dieses Vorgehen hat zum Nachteil, dass etwaige Trends und Saisonalitäten in den Basiszeitreihen in den Prognosen möglicherweise ignoriert werden.

Dieser Ansatz ist ein Hybrid aus „Bottom-up“ und „Top-down“. Es werden direkt mittels statistischer Verfahren die Positionen einer Ebene prognostiziert, die weder der untersten noch der obersten Ebene entspricht. In unserem Beispiel wären das die Zeitreihen der mittleren Hierarchieebene, der Aufwand und der Ertrag. Die Vorhersagen aller Positionen auf den Ebenen darüber, hier das Unternehmensergebnis, würden mittels Bottom-up ermittelt. Auf der anderen Seite berechnen sich die Prognosen der Zeitreihen auf den darunterliegenden Ebenen, hier Personalkosten, Materialkosten, Umsatzerlöse und ausserordentliche Erträge, gemäss eines Top-down Ansatzes. 

 

Fazit 

Die vorgestellten Ansätze sind lediglich die Grundrisse der zur Verfügung stehenden Methodenpalette. Es gibt zahlreiche Parameter, die angepasst werden können, wie beispielsweise die Disaggregationsmethode innerhalb des Top-down Ansatzes. Anwender sollten zunächst für sich beantworten, was sie mit der Prognose in erster Linie bezwecken wollen. Behandeln sie vielschichtige Hierarchiestrukturen und der Fokus liegt hauptsächlich auf einer Vorschau auf die entscheidenden betriebswirtschaftlichen Kennzahlen? In diesem Fall ist ein Top-down oder ein Middle-out Ansatz, der auf einer oberen Ebene ansetzt, ratsam. Sollen hingegen alle aktuellen Entwicklungen abgebildet werden, um möglichst schnell und flexibel auf diese reagieren zu können? Dann empfiehlt sich eher ein Bottom-up oder ein Middle-out Ansatz, der auf einer tieferen Ebene ansetzt. Insgesamt lässt sich leider keine pauschale Aussage, welche Methode die besten Ergebnisse liefert, treffen. Es gilt, zunächst die obigen Fragen zu beantworten, dann die verschiedenen Möglichkeiten zu testen, sie objektiv zu bewerten und die beste Alternative für das vorliegende Szenario auszuwählen.  

Sie möchten mehr wissen?

Sie möchten tiefer in dieses Thema einsteigen? Dann freuen wir uns, Ihnen die Prognose von hierarchischen Zeitreihen persönlich zu präsentieren – sehr gerne auch kombiniert mit Details zu weiteren Funktionen der SAP Analytics Cloud. Nehmen Sie einfach Kontakt mit uns auf!

Ihre Analytics Ansprechpartnerin
Christiane Kalfass-sPeers Mood Print-150
Recruiting & Marketing Specialist

Published by:

Dr. Dominik Bertsche

Professional Analytics Consultant

autor:IN

Wie hat Ihnen der Artikel gefallen?

Wie hilfreich war dieser Beitrag?

Klicken Sie auf einen Stern, um zu bewerten!

Durchschnittliche Bewertung 5 / 5.
Anzahl Bewertungen: 2

Bislang keine Stimmen! Seien Sie die erste Person, die diesen Beitrag bewertet!

INFORMATIONEN

Weitere Informationen

Plandaten-Import für die Personalkostenplanung Wie Google Cloud Success Factors und SAP Analytics Cloud verbindet

Plandaten-Import für die Personalkostenplanung: Wie Google Cloud Success Factors und SAP Analytics Cloud verbindet

Diese Lösung ermöglicht die Integration von SAP SuccessFactors (SF) und...
Titelbild On-Premise vs. Off-Premise Software Was ist der Unterschied

On-Premise vs. Off-Premise Software: Was ist der Unterschied?

Während der Begriff on-premise existiert, gibt es den Begriff off-premise so nicht. Man spricht entweder vom Outsourcing (Nutzung von...

R vs. PYTHON

R und Python sind beide führende Programmiersprachen in der Datenanalyse...

Projektmanagement optimieren mit KI-gestütztem Dokumenten-Chat und BigQuery

In vielen Branchen sind Effizienz und Präzision entscheidend. Mit KI und BigQuery können Projektdaten einfach verwaltet und Informationen in...
Wiki BigQuery Data Canvas

Ad-Hoc & Explorative Datenanalysen mit BigQuery Data Canvas

BigQuery Data Canvas (BQDC) ist ein von Gemini AI unterstützter Service der Google Cloud Platform (GCP), welcher das Auffinden,...
SAC Forecasting mit Google Cloud Services

SAC & GCP: SAC Forecasting mit Google Cloud Services

BigQuery Data Canvas (BQDC) ist ein von Gemini AI unterstützter Service der Google Cloud Platform (GCP), welcher das Auffinden,...