Accueil Science des données Comment prévoir des séries temporelles hiérarchiques ?

Comment prévoir des séries temporelles hiérarchiques ?

Lorsqu'il s'agit de prévoir des séries temporelles, la fin justifie les moyens, c'est-à-dire que le modèle le plus précis est le modèle de choix. Cependant, le modèle doit toujours être aussi simple que possible afin de minimiser le risque de surajustement. Les algorithmes pilotés par les données prévoient généralement les séries temporelles de manière univariée, ce qui signifie que chaque série d'observations est modélisée séparément.

Cela signifie qu'une série chronologique, comme par exemple le bénéfice d'une entreprise, est d'abord analysée en fonction de ses caractéristiques centrales et modélisée sur la base de celles-ci :

Sur cette base, la série chronologique correspondante est prédite sur l'horizon souhaité. La fonctionnalité Smart Predict dans SAP Analytics Cloud offre une bonne introduction à la prévision de séries temporelles. Pour la mise en œuvre de méthodes plus complexes et individualisées, des solutions logicielles statistiques telles que R ou Python sont appropriées.

 

Pour en savoir plus sur la prévision des séries temporelles en général (y compris la définition, la fonction et les modèles de prévision), consultez cet article wiki.

 Que sont les séries chronologiques hiérarchiques ? 

Les séries chronologiques hiérarchiques sont omniprésentes dans chaque entreprise, par exemple sous la forme d'une hiérarchie du compte de résultat ou du bilan.

Pour simplifier, nous considérons dans cet article une simple hiérarchie de compte de résultat à trois niveaux. Le niveau supérieur de la hiérarchie se compose d'un seul poste, le résultat net. Résultat de l'entreprise. Ce résultat est la somme des deux séries temporelles Charges et Produitsqui se trouvent au niveau intermédiaire. Au niveau le plus bas se trouvent les séries temporelles dites de base Frais de personnel, Coûts des matières, Chiffre d'affaires et produits exceptionnels sont placés sous le signe de la rentabilité. Les produits charges la somme de Personnel- et des coûts de matériel, le Produit la somme des Recettes des ventes et les produits exceptionnels. Au total, nous considérons donc sept séries temporelles, les observations des deux niveaux supérieurs, à savoir Résultat de l'entreprise, Charges et produitsLes séries temporelles de base ne sont que des agrégations de séries temporelles de base.

Dans la pratique, les hiérarchies des groupes sont beaucoup plus complexes et il n'est pas rare de trouver dix niveaux ou plus. Les trois niveaux de l'exemple précédent suffisent toutefois à expliquer tous les concepts essentiels liés à la prévision des séries temporelles hiérarchiques.

Méthodes de prévision des séries temporelles hiérarchiques 

L'approche la plus simple consisterait à choisir le modèle le plus précis pour chacune des sept séries temporelles de la hiérarchie décrite et à lui faire établir une prévision. Toutefois, cette approche viole la structure de la hiérarchie. Par exemple, la prévision de la charges n'est généralement pas égale à la somme des prévisions relatives aux frais de personnel et les Coûts des matériaux. Pour satisfaire à cette condition nécessaire de la hiérarchie, il existe trois méthodes qui sont brièvement expliquées ci-dessous :

L'approche la plus intuitive se contente de prévoir les séries temporelles de base - en l'occurrence les coûts de personnel, Coûts des matériaux, Chiffre d'affaires et les produits exceptionnels, à l'aide d'algorithmes courants. Ensuite, les prévisions sont agrégées selon la hiérarchie décrite ci-dessus, c'est-à-dire que la prévision des charges est la somme des prévisions pour les frais de personnel et les Coûts des matériaux.

Bien que cette méthode soit à première vue la variante la plus évidente, elle présente des faiblesses, surtout dans le cas de hiérarchies complexes et à plusieurs niveaux. En effet, les séries temporelles aux niveaux les plus bas ont souvent peu de structure et sont donc difficiles à prévoir. Des erreurs de prévision importantes peuvent donc survenir à ce niveau. Si les prévisions de ces séries temporelles de base sont agrégées sur de nombreux niveaux hiérarchiques, le risque d'agrégation des erreurs de prévision est également réel. Dans certaines circonstances, cela peut entraîner des écarts importants pour les principaux ratios de gestion, qui se situent généralement aux niveaux supérieurs de la hiérarchie.

Une autre solution consiste à n'utiliser que la série chronologique au niveau hiérarchique le plus élevé, dans le scénario décrit, le Résultat de l'entrepriseà l'aide d'un algorithme approprié. Cela présente l'avantage que cet indicateur a généralement une structure solide et peut donc être prévu avec précision. Malheureusement, il n'est pas intuitivement clair comment cette prévision se répartit sur les niveaux inférieurs. Il existe ici différentes approches, par exemple, la prévision du résultat de l'entreprise à l'aide des pondérations historiques sur les prévisions de charges et les revenus sont réparties entre les différents groupes, et ainsi de suite. Cette approche présente l'inconvénient que les tendances et saisonnalités éventuelles dans les séries chronologiques de base peuvent être ignorées dans les prévisions.

Cette approche est un hybride entre le "bottom-up" et le "top-down". Elle consiste à prévoir directement, au moyen de procédures statistiques, les positions d'un niveau qui ne correspond ni au niveau le plus bas ni au niveau le plus haut. Dans notre exemple, il s'agirait des séries temporelles du niveau hiérarchique moyen, de la charges et le Produits. Les prévisions de toutes les positions aux niveaux supérieurs, ici le Résultat de l'entrepriseseraient calculées de manière ascendante. D'autre part, les prévisions des séries chronologiques aux niveaux inférieurs, ici Frais de personnel, Coûts des matériaux, Chiffre d'affaires et les produits exceptionnels, selon une approche descendante.

 

Conclusion 

Les approches présentées ne sont que les grandes lignes de la palette de méthodes disponibles. Il existe de nombreux paramètres qui peuvent être adaptés, comme par exemple la méthode de désagrégation au sein de l'approche descendante. Les utilisateurs devraient d'abord répondre à la question de savoir ce qu'ils veulent faire en premier lieu avec les prévisions. Traitent-ils des structures hiérarchiques à plusieurs niveaux et se concentrent-ils principalement sur une prévision des chiffres clés de l'entreprise ? Dans ce cas, il est conseillé d'adopter une approche top-down ou middle-out, qui intervient à un niveau supérieur. En revanche, tous les développements actuels doivent-ils être représentés afin de pouvoir réagir le plus rapidement et le plus souplement possible à ceux-ci ? Dans ce cas, il est plutôt recommandé d'adopter une approche bottom-up ou middle-out, qui intervient à un niveau inférieur. Dans l'ensemble, il n'est malheureusement pas possible de dire de manière générale quelle méthode donne les meilleurs résultats. Il faut d'abord répondre aux questions ci-dessus, puis tester les différentes possibilités, les évaluer objectivement et choisir la meilleure alternative pour le scénario en question.

Vous souhaitez en savoir plus ?

Vous souhaitez approfondir ce sujet ? Dans ce cas, nous nous ferons un plaisir de vous présenter personnellement la prévision de séries chronologiques hiérarchiques - volontiers combinée avec des détails sur d'autres fonctions de SAP Analytics Cloud. N'hésitez pas à prendre contact avec nous !

Votre contact Analytics
Nadine Matt_2
Nadine Matt
Customer Engagement & Communication Executive

Publié par :

Dr. Dominik Bertsche

Consultant professionnel en analyse

autor:IN

Cet article vous a-t-il plu ?

Cet article vous a-t-il été utile ?

Cliquez sur une étoile pour évaluer !

Note moyenne 5 / 5.
Nombre d'évaluations : 2

Aucun vote pour l'instant ! Soyez la première personne à noter ce post !

INFORMATIONS

Plus d'informations

Wiki How to R - Guide du débutant (1)

How to R - Guide du débutant Analyse des séries temporelles

Nous nous limiterons dans ce petit tutoriel à esquisser brièvement les étapes essentielles de l'analyse des séries temporelles dans le langage de programmation R...

Taxonomie de l'UE Wiki

Taxonomie de l'UE - Implémentation dans un système SAP Analytics

De la définition des KPI au reporting : évaluez les activités de votre entreprise - chiffre d'affaires, CapEx et OpEx - selon les critères de la taxonomie européenne. Nous vous accompagnons pas à pas dans la mise en œuvre réussie des directives de la taxonomie européenne...

Wiki SCT

Tour de contrôle du développement durable (SCT)

À une époque où la gestion durable est indispensable, le suivi et l'enregistrement de ses propres performances en matière de durabilité grâce à des données précises sont de plus en plus importants. La SAP Sustainability Control Tower est une solution de durabilité complète qui permet un reporting global...

Wiki Qu'est-ce que R

Qu'est-ce que R ?

R est un langage de programmation développé pour des applications statistiques, qui jouit d'une grande diffusion, notamment dans le domaine de la science des données...

Wiki 5 indicateurs clés de performance (KPI) en matière de développement durable

Les 5 KPI de durabilité les plus importants

Pourquoi a-t-on besoin d'indicateurs dans le domaine du développement durable ? Quels sont les 5 indicateurs clés de performance (KPI) de durabilité les plus importants ? Et pourquoi les Sustainability KPI sont-ils importants pour votre entreprise ? Vous trouverez les réponses à ces questions dans l'article suivant...

Wiki Datasphere contre BW4HANA

Comparaison : SAP Datasphere vs. SAP BW/4HANA

SAP propose différentes options de data warehousing avec des solutions telles que SAP BW/4HANA et SAP Datasphere. Alors que BW/4HANA est spécialisé dans les données d'entreprise structurées et l'analytique, Datasphere se concentre sur l'intégration complète des données à travers les plates-formes...

Wiki Services de cloud computing gérés

Services de cloud computing gérés

Les services de cloud computing gérés permettent aux entreprises de profiter des avantages de la technologie de cloud computing sans avoir à se préoccuper de la complexité de la gestion du cloud...

Consentement au cookie GDPR avec bannière Real Cookie