Accueil Science des données Comment prévoir des séries temporelles hiérarchiques ?

Comment prévoir des séries temporelles hiérarchiques ?

Lorsqu'il s'agit de prévoir des séries temporelles, la fin justifie les moyens, c'est-à-dire que le modèle le plus précis est le modèle de choix. Cependant, le modèle doit toujours être aussi simple que possible afin de minimiser le risque de surajustement. Les algorithmes pilotés par les données prévoient généralement les séries temporelles de manière univariée, ce qui signifie que chaque série d'observations est modélisée séparément.

Cela signifie qu'une série chronologique, comme par exemple le bénéfice d'une entreprise, est d'abord analysée en fonction de ses caractéristiques centrales et modélisée sur la base de celles-ci :

Sur cette base, la série chronologique correspondante est prédite sur l'horizon souhaité. La fonctionnalité Smart Predict dans SAP Analytics Cloud offre une bonne introduction à la prévision de séries temporelles. Pour la mise en œuvre de méthodes plus complexes et individualisées, des solutions logicielles statistiques telles que R ou Python sont appropriées.

 

Pour en savoir plus sur la prévision des séries temporelles en général (y compris la définition, la fonction et les modèles de prévision), consultez cet article wiki.

 Que sont les séries chronologiques hiérarchiques ? 

Les séries chronologiques hiérarchiques sont omniprésentes dans chaque entreprise, par exemple sous la forme d'une hiérarchie du compte de résultat ou du bilan.

Pour simplifier, nous considérons dans cet article une simple hiérarchie de compte de résultat à trois niveaux. Le niveau supérieur de la hiérarchie se compose d'un seul poste, le résultat net. Résultat de l'entreprise. Ce résultat est la somme des deux séries temporelles Charges et Produitsqui se trouvent au niveau intermédiaire. Au niveau le plus bas se trouvent les séries temporelles dites de base Frais de personnel, Coûts des matières, Chiffre d'affaires et produits exceptionnels sont placés sous le signe de la rentabilité. Les produits charges la somme de Personnel- et des coûts de matériel, le Produit la somme des Recettes des ventes et les produits exceptionnels. Au total, nous considérons donc sept séries temporelles, les observations des deux niveaux supérieurs, à savoir Résultat de l'entreprise, Charges et produitsLes séries temporelles de base ne sont que des agrégations de séries temporelles de base.

Dans la pratique, les hiérarchies des groupes sont beaucoup plus complexes et il n'est pas rare de trouver dix niveaux ou plus. Les trois niveaux de l'exemple précédent suffisent toutefois à expliquer tous les concepts essentiels liés à la prévision des séries temporelles hiérarchiques.

Méthodes de prévision des séries temporelles hiérarchiques 

L'approche la plus simple consisterait à choisir le modèle le plus précis pour chacune des sept séries temporelles de la hiérarchie décrite et à lui faire établir une prévision. Toutefois, cette approche viole la structure de la hiérarchie. Par exemple, la prévision de la charges n'est généralement pas égale à la somme des prévisions relatives aux frais de personnel et les Coûts des matériaux. Pour satisfaire à cette condition nécessaire de la hiérarchie, il existe trois méthodes qui sont brièvement expliquées ci-dessous :

L'approche la plus intuitive se contente de prévoir les séries temporelles de base - en l'occurrence les coûts de personnel, Coûts des matériaux, Chiffre d'affaires et les produits exceptionnels, à l'aide d'algorithmes courants. Ensuite, les prévisions sont agrégées selon la hiérarchie décrite ci-dessus, c'est-à-dire que la prévision des charges est la somme des prévisions pour les frais de personnel et les Coûts des matériaux.

Bien que cette méthode soit à première vue la variante la plus évidente, elle présente des faiblesses, surtout dans le cas de hiérarchies complexes et à plusieurs niveaux. En effet, les séries temporelles aux niveaux les plus bas ont souvent peu de structure et sont donc difficiles à prévoir. Des erreurs de prévision importantes peuvent donc survenir à ce niveau. Si les prévisions de ces séries temporelles de base sont agrégées sur de nombreux niveaux hiérarchiques, le risque d'agrégation des erreurs de prévision est également réel. Dans certaines circonstances, cela peut entraîner des écarts importants pour les principaux ratios de gestion, qui se situent généralement aux niveaux supérieurs de la hiérarchie.

Une autre solution consiste à n'utiliser que la série chronologique au niveau hiérarchique le plus élevé, dans le scénario décrit, le Résultat de l'entrepriseà l'aide d'un algorithme approprié. Cela présente l'avantage que cet indicateur a généralement une structure solide et peut donc être prévu avec précision. Malheureusement, il n'est pas intuitivement clair comment cette prévision se répartit sur les niveaux inférieurs. Il existe ici différentes approches, par exemple, la prévision du résultat de l'entreprise à l'aide des pondérations historiques sur les prévisions de charges et les revenus sont réparties entre les différents groupes, et ainsi de suite. Cette approche présente l'inconvénient que les tendances et saisonnalités éventuelles dans les séries chronologiques de base peuvent être ignorées dans les prévisions.

Cette approche est un hybride entre le "bottom-up" et le "top-down". Elle consiste à prévoir directement, au moyen de procédures statistiques, les positions d'un niveau qui ne correspond ni au niveau le plus bas ni au niveau le plus haut. Dans notre exemple, il s'agirait des séries temporelles du niveau hiérarchique moyen, de la charges et le Produits. Les prévisions de toutes les positions aux niveaux supérieurs, ici le Résultat de l'entrepriseseraient calculées de manière ascendante. D'autre part, les prévisions des séries chronologiques aux niveaux inférieurs, ici Frais de personnel, Coûts des matériaux, Chiffre d'affaires et les produits exceptionnels, selon une approche descendante.

 

Conclusion 

Les approches présentées ne sont que les grandes lignes de la palette de méthodes disponibles. Il existe de nombreux paramètres qui peuvent être adaptés, comme par exemple la méthode de désagrégation au sein de l'approche descendante. Les utilisateurs devraient d'abord répondre à la question de savoir ce qu'ils veulent faire en premier lieu avec les prévisions. Traitent-ils des structures hiérarchiques à plusieurs niveaux et se concentrent-ils principalement sur une prévision des chiffres clés de l'entreprise ? Dans ce cas, il est conseillé d'adopter une approche top-down ou middle-out, qui intervient à un niveau supérieur. En revanche, tous les développements actuels doivent-ils être représentés afin de pouvoir réagir le plus rapidement et le plus souplement possible à ceux-ci ? Dans ce cas, il est plutôt recommandé d'adopter une approche bottom-up ou middle-out, qui intervient à un niveau inférieur. Dans l'ensemble, il n'est malheureusement pas possible de dire de manière générale quelle méthode donne les meilleurs résultats. Il faut d'abord répondre aux questions ci-dessus, puis tester les différentes possibilités, les évaluer objectivement et choisir la meilleure alternative pour le scénario en question.

Vous souhaitez en savoir plus ?

Vous souhaitez approfondir ce sujet ? Dans ce cas, nous nous ferons un plaisir de vous présenter personnellement la prévision de séries chronologiques hiérarchiques - volontiers combinée avec des détails sur d'autres fonctions de SAP Analytics Cloud. N'hésitez pas à prendre contact avec nous !

Votre interlocuteur pour les thèmes Analytics
Theresa Riesterer - Expert SAP Analytics
Theresa Riesterer
Expert en SAP Analytics

Publié par :

Dr. Dominik Bertsche

Consultant professionnel en analyse

autor:IN

Cet article vous a-t-il plu ?

Cet article vous a-t-il été utile ?

Cliquez sur une étoile pour évaluer !

Note moyenne 5 / 5.
Nombre d'évaluations : 2

Aucun vote pour l'instant ! Soyez la première personne à noter ce post !

SOLUTIONS D'ANALYSE

En savoir plus sur nos solutions d'analyse

INFORMATIONS

Plus d'informations

Wiki Introduction à Google BigQuery

Google BigQuery, le moteur de recherche : Les bases essentielles

Avec BigQuery, Google vend un outil d'entreposage qui doit pouvoir remplacer les systèmes établis. Quels sont les avantages concrets de Google BigQuery, comment...

Wiki Reporting ESG

Reporting ESG : importance, pertinence et solutions SAP

L'ESG est désormais plus qu'une tendance - les entreprises montrent ainsi l'importance que revêt le thème de la durabilité dans leur organisation...

Image de couverture Logiciels sur site et hors site Quelle est la différence ?

Logiciel sur site ou hors site : quelle est la différence ?

Qu'est-ce qu'un logiciel on-premise et off-premise et quelle est la différence ? L'article suivant traite de ce sujet. En outre,...

Wiki : Eugen en interview sur le BW Bridge

Tu dois traverser un pont : Fonctions et vue d'ensemble de SAP BW Bridge

Le BW Bridge est présenté par SAP comme un moyen d'intégrer un système d'un environnement classique sur site dans...

Wiki - The Big 5 - Rapports sur le développement durable

Les "cinq grands" du reporting de durabilité

Qui définit les normes dans le domaine du reporting sur le développement durable ? L'article de connaissance suivant traite de cette question. Il présente cinq...

Wiki 5 indicateurs clés de performance (KPI) en matière de développement durable

Les 5 KPI de durabilité les plus importants

Quels sont les 5 KPI de durabilité les plus importants ? Et pourquoi les Sustainability KPI sont-ils importants pour votre entreprise ? Table des matières 1. A quoi servent les...

Wiki : Pourquoi a-t-on besoin d'un dwh ?

Pourquoi avoir besoin d'un entrepôt de données : définition, architecture et avantages

Qu'est-ce qu'un entrepôt de données (chapitre 1), comment est-il structuré (chapitre 2) et pourquoi ai-je besoin, en tant qu'organisation, d'un...