Comment prévoir des séries temporelles hiérarchiques ?
- Analyse avancée, science des données
- analyse de données, prévision, pronostic, séries chronologiques
- 4 min de lecture
Dr. Dominik Bertsche
Lorsqu'il s'agit de prévoir des séries temporelles, la fin justifie les moyens, c'est-à-dire que le modèle le plus précis est le modèle de choix. Cependant, le modèle doit toujours être aussi simple que possible afin de minimiser le risque de surajustement. Les algorithmes pilotés par les données prévoient généralement les séries temporelles de manière univariée, ce qui signifie que chaque série d'observations est modélisée séparément.
Cela signifie qu'une série chronologique, comme par exemple le bénéfice d'une entreprise, est d'abord analysée en fonction de ses caractéristiques centrales et modélisée sur la base de celles-ci :
- Tendance
- Effets saisonniers
- Autres dynamiques comme l'autocorrélation
Sur cette base, la série chronologique correspondante est prédite sur l'horizon souhaité. La fonctionnalité Smart Predict dans SAP Analytics Cloud offre une bonne introduction à la prévision de séries temporelles. Pour la mise en œuvre de méthodes plus complexes et individualisées, des solutions logicielles statistiques telles que R ou Python sont appropriées.
Pour en savoir plus sur la prévision des séries temporelles en général (y compris la définition, la fonction et les modèles de prévision), consultez cet article wiki.
Que sont les séries chronologiques hiérarchiques ?
Les séries chronologiques hiérarchiques sont omniprésentes dans chaque entreprise, par exemple sous la forme d'une hiérarchie du compte de résultat ou du bilan.
Pour simplifier, nous considérons dans cet article une simple hiérarchie de compte de résultat à trois niveaux. Le niveau supérieur de la hiérarchie se compose d'un seul poste, le résultat net. Résultat de l'entreprise. Ce résultat est la somme des deux séries temporelles Charges et Produitsqui se trouvent au niveau intermédiaire. Au niveau le plus bas se trouvent les séries temporelles dites de base Frais de personnel, Coûts des matières, Chiffre d'affaires et produits exceptionnels sont placés sous le signe de la rentabilité. Les produits charges la somme de Personnel- et des coûts de matériel, le Produit la somme des Recettes des ventes et les produits exceptionnels. Au total, nous considérons donc sept séries temporelles, les observations des deux niveaux supérieurs, à savoir Résultat de l'entreprise, Charges et produitsLes séries temporelles de base ne sont que des agrégations de séries temporelles de base.
Dans la pratique, les hiérarchies des groupes sont beaucoup plus complexes et il n'est pas rare de trouver dix niveaux ou plus. Les trois niveaux de l'exemple précédent suffisent toutefois à expliquer tous les concepts essentiels liés à la prévision des séries temporelles hiérarchiques.
Méthodes de prévision des séries temporelles hiérarchiques
L'approche la plus simple consisterait à choisir le modèle le plus précis pour chacune des sept séries temporelles de la hiérarchie décrite et à lui faire établir une prévision. Toutefois, cette approche viole la structure de la hiérarchie. Par exemple, la prévision de la charges n'est généralement pas égale à la somme des prévisions relatives aux frais de personnel et les Coûts des matériaux. Pour satisfaire à cette condition nécessaire de la hiérarchie, il existe trois méthodes qui sont brièvement expliquées ci-dessous :
L'approche la plus intuitive se contente de prévoir les séries temporelles de base - en l'occurrence les coûts de personnel, Coûts des matériaux, Chiffre d'affaires et les produits exceptionnels, à l'aide d'algorithmes courants. Ensuite, les prévisions sont agrégées selon la hiérarchie décrite ci-dessus, c'est-à-dire que la prévision des charges est la somme des prévisions pour les frais de personnel et les Coûts des matériaux.
Bien que cette méthode soit à première vue la variante la plus évidente, elle présente des faiblesses, surtout dans le cas de hiérarchies complexes et à plusieurs niveaux. En effet, les séries temporelles aux niveaux les plus bas ont souvent peu de structure et sont donc difficiles à prévoir. Des erreurs de prévision importantes peuvent donc survenir à ce niveau. Si les prévisions de ces séries temporelles de base sont agrégées sur de nombreux niveaux hiérarchiques, le risque d'agrégation des erreurs de prévision est également réel. Dans certaines circonstances, cela peut entraîner des écarts importants pour les principaux ratios de gestion, qui se situent généralement aux niveaux supérieurs de la hiérarchie.
Une autre solution consiste à n'utiliser que la série chronologique au niveau hiérarchique le plus élevé, dans le scénario décrit, le Résultat de l'entrepriseà l'aide d'un algorithme approprié. Cela présente l'avantage que cet indicateur a généralement une structure solide et peut donc être prévu avec précision. Malheureusement, il n'est pas intuitivement clair comment cette prévision se répartit sur les niveaux inférieurs. Il existe ici différentes approches, par exemple, la prévision du résultat de l'entreprise à l'aide des pondérations historiques sur les prévisions de charges et les revenus sont réparties entre les différents groupes, et ainsi de suite. Cette approche présente l'inconvénient que les tendances et saisonnalités éventuelles dans les séries chronologiques de base peuvent être ignorées dans les prévisions.
Cette approche est un hybride entre le "bottom-up" et le "top-down". Elle consiste à prévoir directement, au moyen de procédures statistiques, les positions d'un niveau qui ne correspond ni au niveau le plus bas ni au niveau le plus haut. Dans notre exemple, il s'agirait des séries temporelles du niveau hiérarchique moyen, de la charges et le Produits. Les prévisions de toutes les positions aux niveaux supérieurs, ici le Résultat de l'entrepriseseraient calculées de manière ascendante. D'autre part, les prévisions des séries chronologiques aux niveaux inférieurs, ici Frais de personnel, Coûts des matériaux, Chiffre d'affaires et les produits exceptionnels, selon une approche descendante.
Conclusion
Les approches présentées ne sont que les grandes lignes de la palette de méthodes disponibles. Il existe de nombreux paramètres qui peuvent être adaptés, comme par exemple la méthode de désagrégation au sein de l'approche descendante. Les utilisateurs devraient d'abord répondre à la question de savoir ce qu'ils veulent faire en premier lieu avec les prévisions. Traitent-ils des structures hiérarchiques à plusieurs niveaux et se concentrent-ils principalement sur une prévision des chiffres clés de l'entreprise ? Dans ce cas, il est conseillé d'adopter une approche top-down ou middle-out, qui intervient à un niveau supérieur. En revanche, tous les développements actuels doivent-ils être représentés afin de pouvoir réagir le plus rapidement et le plus souplement possible à ceux-ci ? Dans ce cas, il est plutôt recommandé d'adopter une approche bottom-up ou middle-out, qui intervient à un niveau inférieur. Dans l'ensemble, il n'est malheureusement pas possible de dire de manière générale quelle méthode donne les meilleurs résultats. Il faut d'abord répondre aux questions ci-dessus, puis tester les différentes possibilités, les évaluer objectivement et choisir la meilleure alternative pour le scénario en question.
Vous souhaitez approfondir ce sujet ? Dans ce cas, nous nous ferons un plaisir de vous présenter personnellement la prévision de séries chronologiques hiérarchiques - volontiers combinée avec des détails sur d'autres fonctions de SAP Analytics Cloud. N'hésitez pas à prendre contact avec nous !
Publié par :
Dr. Dominik Bertsche
Consultant professionnel en analyse
Dr. Dominik Bertsche
Cet article vous a-t-il plu ?
Cet article vous a-t-il été utile ?
Cliquez sur une étoile pour évaluer !
Note moyenne 5 / 5.
Nombre d'évaluations : 2
Aucun vote pour l'instant ! Soyez la première personne à noter ce post !