Séries temporelles : Daniel peux-tu nous en parler ?

-
3
 m de lecture
-
matrice de confusion

Nouveau rendez-vous avec Daniel, le support technique des formations DataScientest.  L’expert en data science qui accompagne les apprenants tout au long de leurs formations. Aujourd’hui, il nous parle des séries temporelles. Les séries temporelles constituent l’un des objets d’études les plus répandus de la science des données. Dans cet article, vous découvrirez les composantes principales d’une série temporelle.

Qu’est-ce qu’une série temporelle?

Les séries temporelles recouvrent un large éventail de phénomènes de la vie réelle et se retrouvent dans de nombreux domaines.

Une série temporelle, cela peut être aussi bien l’évolution de la population ou du PIB d’un pays, qu’un électrocardiogramme ou le dernier son de Dua Lipa.

Mathématiquement une série temporelle c’est une série de données indexée par le temps.

L’analyse et la prédiction de ces séries sont donc d’un intérêt primordial pour certaines industries ou secteurs d’activités car concrètement prédire une série temporelle c’est prédire le futur.

La population française et sa prédiction par l’Institut national des sciences démographiques

Comment se décompose une série temporelle ?

Traditionnellement, une série temporelle est décomposée selon trois éléments :

  • Une tendance (Tt)
  • Une saisonnalité (St)
  • Un résidu ou erreur (εt)

Mathématiquement, on peut donc traduire une série temporelle par  Xt = Tt  + St + εt

Avec T la tendance, S la saisonnalité,  ε le résidu et t l’indexation temporelle.

La tendance

La tendance correspond à un comportement croissant ou décroissant d’une série au cours du temps.  Elle reflète souvent un phénomène de croissance ou décroissance sur le long terme.

La tendance d’une série temporelle peut prendre différentes formes :

  • Linéaire   Tt = α + βt
  • Quadratique Tt = α + βt + γt²
  • Exponentielle Tt = α + βexp(t)

….

La saisonnalité

La saisonnalité reflète la présence d’un phénomène périodique qui se répète au long de la série temporelle.

Ainsi, si la composante saisonnière se répète selon période k. On aura St+k = St

De nombreuse données présentent des saisonnalités, en particulier les données météorologiques (évolution de la température au cours du temps)

Certaines séries temporelles présentent à la fois une tendance et une saisonnalité, c’est le cas du trafic aérien mondial. On observe à la fois une croissance du trafic aérien tout en remarquant une différence forte entre le trafic hivernal et estival.

Source: DataScientest

Le résidu

Le résidu du modèle correspond à la partie de la série temporelle que la décomposition ne permet pas d’expliquer. On ne peut pas décomposer intégralement une série temporelle uniquement selon une tendance et une saisonnalité.

Idéalement le résidu du modèle est stationnaire, c’est-à-dire que le processus restant n’évolue pas avec le temps (moyenne et variance constante) . Si le résidu de notre série temporelle n’est pas stationnaire, cela signifie que certaines composantes temporelles ne sont pas expliquées dans le modèle.

Une fois, la tendance et la saisonnalité de la série temporelle expliquées, on peut donc chercher à expliquer le résidu de la décomposition avec des processus d’auto-régression ou de moyennes mobiles qui ont donné naissance au fameux modèle ARMA

Le graal de la modélisation des séries temporelles est d’obtenir un résidu de type bruit blanc, c’est-à-dire un résidu qui ne contient plus aucune information temporelle. En pratique, c’est donc un signal stationnaire aléatoire et décorrélé.

Pour aller plus loin

– En plus de la saisonnalité, on définit quelquefois un cycle qui peut être considéré comme une saisonnalité de période plus longue, on peut alors définir plusieurs cycles différents.

– La présence d’une saisonnalité avérée entre deux dates peut rendre la comparaison entre ces dates difficiles. Selon les problématiques on peut donc chercher à corriger les variations saisonnières des séries temporelles. C’est le cas par exemple du taux de chômage ou du taux de croissance publiés par l’INSEE.

– La décomposition Xt = Tt  + St + εt est dite additive, on peut aussi modéliser une série temporelle selon une décomposition multiplicative  Xt = Tt (1 + St )(1 + εt )

Conclusion

Dans cet article vous venez de découvrir des notions fondamentales sur les séries temporelles : tendance, saisonnalité, résidu, bruit blanc et stationnarité.

Cependant par-delà les séries temporelles, la science des données recouvre de nombreux autres problèmes (computer vision, natural language processing, data vizualisation, …)  que nous vous invitons à découvrir en suivant une de nos formations Data Scientist ou bien Data Engineer.

Facebook
Twitter
LinkedIn

DataScientest News

Inscrivez-vous à notre Newsletter pour recevoir nos guides, tutoriels, et les dernières actualités data directement dans votre boîte mail.

Vous souhaitez être alerté des nouveaux contenus en data science et intelligence artificielle ?

Laissez-nous votre e-mail, pour que nous puissions vous envoyer vos nouveaux articles au moment de leur publication !

Newsletter icone
icon newsletter

DataNews

Vous souhaitez recevoir notre
newsletter Data hebdomadaire ?