Home Data Science Wie prognostiziert man hierarchische Zeitreihen?

Wie prognostiziert man hierarchische Zeitreihen?

Wenn es um die Prognose von Zeitreihen geht, heiligt grundsätzlich der Zweck die Mittel, d. h. das akkurateste Modell ist das Modell der Wahl. Dabei sollte das Modell jedoch stets so einfach wie möglich gehalten werden, um das Risiko einer Überanpassung möglichst zu minimieren. Datengetriebene Algorithmen prognostizieren Zeitreihen in der Regel univariat, es wird also jede Beobachtungsreihe separat modelliert.

Das bedeutet, eine Zeitreihe, wie zum Beispiel der Gewinn eines Unternehmens, wird zunächst auf zentrale Charakteristika untersucht und anhand derer modelliert: 

Auf dieser Basis wird die entsprechende Zeitreihe über den gewünschten Horizont vorhergesagt. Die Smart Predict Funktionalität in der SAP Analytics Cloud bietet einen guten Einstieg in die Prognose von Zeitreihen. Für die Umsetzung komplexerer und individualisierter Methoden eignen sich statistische Softwarelösungen wie R oder Python. 

 

Mehr zur Prognose von Zeitreihen allgemein (inkl. Definition, Funktion und Prognosemodellen) finden Sie in diesem Wiki-Artikel.

 Was sind hierarchische Zeitreihen? 

Hierarchische Zeitreihen sind in jedem Unternehmen, zum Beispiel in Form einer Gewinn- und Verlustrechnungs- (GuV) oder einer Bilanzhierarchie, allgegenwärtig. 

Der Einfachheit halber betrachten wir in diesem Artikel eine simple GuV-Hierarchie mit drei Ebenen. Die oberste Hierarchieebene besteht lediglich aus einer Position, dem Unternehmensergebnis. Dieses Ergebnis ist die Summe der beiden Zeitreihen Aufwand und Ertrag, die sich auf der mittleren Ebene befinden. Auf der untersten Ebene sind die sogenannten Basiszeitreihen Personalkosten, Materialkosten, Umsatzerlöse und ausserordentliche Erträge angesiedelt. Dabei bildet der Aufwand die Summe aus Personal– und Materialkosten, der Ertrag die Summe aus Umsatzerlösen und ausserordentlichen Erträgen. Insgesamt betrachten wir also sieben Zeitreihen, wobei die Beobachtungen der oberen beiden Ebenen, also Unternehmensergebnis, Aufwand und Ertrag, lediglich Aggregationen der Basiszeitreihen sind. 

In der Praxis sind Hierarchien in Konzernen wesentlich komplexer, sodass zehn oder mehr Ebenen keine Seltenheit sind. Die drei Ebenen im vorangegangenen Beispiel genügen jedoch, um alle essenziellen Konzepte mit Bezug zur Prognose hierarchischer Zeitreihen zu erläutern. 

 

Methoden zur Prognose hierarchischer Zeitreihen 

Der einfachste Ansatz wäre, für jede der sieben Zeitreihen in der beschriebenen Hierarchie das akkurateste Modell zu wählen und dieses eine Prognose erstellen zu lassen. Allerdings wird bei diesem Vorgehen die Struktur der Hierarchie verletzt. So ist beispielsweise die Prognose des Aufwands für gewöhnlich nicht gleich der Summe der Vorhersagen für die Personalkosten und die Materialkosten. Um diese notwendige Bedingung der Hierarchie zu erfüllen, existieren drei Methoden, die im Folgenden kurz erläutert werden: 

Der wohl intuitivste Ansatz prognostiziert lediglich die Basiszeitreihen – in diesem Fall Personalkosten, Materialkosten, Umsatzerlöse und ausserordentliche Erträge, mittels gängiger Algorithmen. Dann werden die Vorhersagen gemäss der oben beschriebenen Hierarchie auf aggregiert, d. h. die Prognose des Aufwands ist die Summe der Vorhersagen für die Personalkosten und die Materialkosten 

Obwohl diese Methode auf den ersten Blick die naheliegendste Variante ist, hat sie vor allem bei komplexen und vielschichtigen Hierarchien ihre Schwächen. Dies liegt darin begründet, dass die Zeitreihen auf den untersten Ebenen häufig wenig Struktur haben und daher schwer zu prognostizieren sind. Hier kann es also zu erheblichen Prognosefehlern kommen. Werden die Vorhersagen dieser Basiszeitreihen nun über zahlreiche Hierarchieebenen auf aggregiert, ist auch die Gefahr der Aggregierung von Prognosefehlern real. Dies kann unter Umständen zu starken Abweichungen bei den wichtigsten betriebswirtschaftlichen Kennzahlen, die üblicherweise auf den höheren Hierarchieebenen angesiedelt sind, führen. 

Alternativ kann man nur die Zeitreihe auf der obersten Hierarchieebene, im beschriebenen Szenario das Unternehmensergebnis, mittels eines geeigneten Algorithmus vorhersagen. Dies hat den Vorteil, dass dieser Indikator in der Regel eine solide Struktur hat und somit akkurat prognostiziert werden kann. Leider ist nicht intuitiv klar, wie sich diese Prognose auf die unteren Ebenen verteilt. Hier gibt es verschiedene Ansätze, zum Beispiel kann die Vorhersage des Unternehmensergebnisses anhand der historischen Gewichte auf die Prognosen für den Aufwand und den Ertrag verteilt werden und so weiter. Dieses Vorgehen hat zum Nachteil, dass etwaige Trends und Saisonalitäten in den Basiszeitreihen in den Prognosen möglicherweise ignoriert werden.

Dieser Ansatz ist ein Hybrid aus „Bottom-up“ und „Top-down“. Es werden direkt mittels statistischer Verfahren die Positionen einer Ebene prognostiziert, die weder der untersten noch der obersten Ebene entspricht. In unserem Beispiel wären das die Zeitreihen der mittleren Hierarchieebene, der Aufwand und der Ertrag. Die Vorhersagen aller Positionen auf den Ebenen darüber, hier das Unternehmensergebnis, würden mittels Bottom-up ermittelt. Auf der anderen Seite berechnen sich die Prognosen der Zeitreihen auf den darunterliegenden Ebenen, hier Personalkosten, Materialkosten, Umsatzerlöse und ausserordentliche Erträge, gemäss eines Top-down Ansatzes. 

 

Fazit 

Die vorgestellten Ansätze sind lediglich die Grundrisse der zur Verfügung stehenden Methodenpalette. Es gibt zahlreiche Parameter, die angepasst werden können, wie beispielsweise die Disaggregationsmethode innerhalb des Top-down Ansatzes. Anwender sollten zunächst für sich beantworten, was sie mit der Prognose in erster Linie bezwecken wollen. Behandeln sie vielschichtige Hierarchiestrukturen und der Fokus liegt hauptsächlich auf einer Vorschau auf die entscheidenden betriebswirtschaftlichen Kennzahlen? In diesem Fall ist ein Top-down oder ein Middle-out Ansatz, der auf einer oberen Ebene ansetzt, ratsam. Sollen hingegen alle aktuellen Entwicklungen abgebildet werden, um möglichst schnell und flexibel auf diese reagieren zu können? Dann empfiehlt sich eher ein Bottom-up oder ein Middle-out Ansatz, der auf einer tieferen Ebene ansetzt. Insgesamt lässt sich leider keine pauschale Aussage, welche Methode die besten Ergebnisse liefert, treffen. Es gilt, zunächst die obigen Fragen zu beantworten, dann die verschiedenen Möglichkeiten zu testen, sie objektiv zu bewerten und die beste Alternative für das vorliegende Szenario auszuwählen.  

Sie möchten mehr wissen?

Sie möchten tiefer in dieses Thema einsteigen? Dann freuen wir uns, Ihnen die Prognose von hierarchischen Zeitreihen persönlich zu präsentieren – sehr gerne auch kombiniert mit Details zu weiteren Funktionen der SAP Analytics Cloud. Nehmen Sie einfach Kontakt mit uns auf!

Ihre Analytics Ansprechpartnerin
Nadine Matt_2
Nadine Matt
Customer Engagement & Communication Executive

Published by:

Dr. Dominik Bertsche

Professional Analytics Consultant

autor:IN

Wie hat Ihnen der Artikel gefallen?

Wie hilfreich war dieser Beitrag?

Klicken Sie auf einen Stern, um zu bewerten!

Durchschnittliche Bewertung 5 / 5.
Anzahl Bewertungen: 2

Bislang keine Stimmen! Seien Sie die erste Person, die diesen Beitrag bewertet!

INFORMATIONEN

Weitere Informationen

Titelbild Wiki Was ist Artificial Intelligence (AI) (1)

Was ist Artificial Intelligence (AI)?

Artificial Intelligence steht für Künstliche Intelligenz (KI). Und da es keine allgemein anerkannte philosophische Definition von Intelligenz gibt, lassen sich auch unterschiedliche Auffassungen darüber finden, was Künstliche Intelligenz ist…

Titelbild Wiki Was ist Machine Learning (ML)

Was ist Machine Learning (ML)?

Machine Learning ist die Antwort auf eine der Fragestellungen an eine schwache Künstliche Intelligenz. Es handelt sich um ein fundamentales Konzept, um Algorithmen zu studieren, die sich selbst automatisch aufgrund von Erfahrungen (unter Verwendung von Daten) verbessern…

Wiki How to R - Beginners Guide (1)

How to R – Beginner Guide Zeitreihenanalyse

Wir beschränken uns in diesem kleinen Tutorial darauf, die wesentlichen Schritte in der Zeitreihenanalyse kurz in der Programmiersprache R zu skizzieren…

EU Taxonomie Wiki

EU Taxonomie – Implentierung in einem SAP-Analytics-System

Von der KPI Definition bis zum Reporting: Bewerten Sie Ihre Unternehmens-Aktivitäten Umsatz, CapEx und OpEx gemäss den EU Taxonomie Kriterien. Wir begleiten Sie Schritt für-Schritt bei der erfolgreichen Umsetzung der EU Taxonomie Richtlinien…

Wiki SCT

Sustainability Control Tower (SCT)

In einer Zeit, in der nachhaltiges Wirtschaften unabdingbar ist, steht die Überwachung und Erfassung der eigenen Nachhaltigkeitsleistung durch präzise Daten immer mehr im Mittelpunkt. Eine umfassende Nachhaltigkeitslösung, die ein ganzheitliches Reporting ermöglicht, ist der SAP Sustainability Control Tower…

Wiki Was ist R

Was ist R?

R ist eine für statistische Anwendungen entwickelte Programmiersprache, die vor allem im Bereich Data Science einen hohen Verbreitungsgrad geniesst…

Wiki 5 Sustainability KPIs

Die 5 wichtigsten Sustainability KPIs

Wozu benötigt man Kennzahlen im Nachhaltigkeitsbereich? Was sind die 5 wichtigsten Sustainability KPIs? Und warum sind Sustainability KPIs wichtig für Ihr Unternehmen? Diese Fragen werden im nachfolgenden Artikel beantwortet…

GDPR Cookie Consent with Real Cookie Banner