foot data

Data x Foot : Jamais deux sans trois

2 min

Episode 3: L'honnête Lyonnais

Ces derniers jours deux articles traitant de football vous ont été proposés pour prédire l’issue de notre bien aimée ligue 1. 
J’aurais adoré donner raison au premier et son classement football manager plaçant en toute logique Lyon en seconde place. OL que dirige entre autres le génial, le charismatique JMA, son complice de toujours Juninho le maestro des coups francs et mené par son génial hollandais volant Memphis Depay (certes blessé).  
Jean Michel Aulas & Juninho
Concernant le deuxième il a été fait par un supporter rennais notoire tout heureux de nous rappeler sa victoire en coupe de France tentant de nous faire oublier l’éternel club de la loose. Autant dire que son modèle est biaisé d’avance. 
En réponse à ces deux articles je tiens ici à vous proposer un modèle tenant compte des résultats passés.
L’idée est simple: regarder la moyenne des points pris sur les deux dernières saisons entre la 28ième et la dernière journée de Ligue 1.
Regardons le résultat :
Foot data
Comme à son habitude Lyon réalise un dernier sprint de feu pour sauver sa saison, accrocher la ligue Europa. On peut imaginer  les buts de Maxwel Cornet le supersub et la maîtrise impeccable au milieu de notre nouveau Bruno G.
Rennes grâce à sa bonne moitié de saison se maintient tant bien que mal à sa 3ème place menacé par Lille. (On a sûrement un heureux chez nous Paul datascientist, ce fameux supporter rennais)
On se souvient quand même de la spécialité rennaise : craquer dans la dernière ligne droite.
Cela présage plein de bonnes choses pour les barrages. Enfin et c’est là, hélas, que mon modèle pêche un peu : le maintien surprise de l’ASSE porté par ses résultats de la saison dernière. Vu la série et l’ambiance sur lesquelles restent le club la fin de saison et le maintien s’annonçait très compliqué.
Enfin le modèle est perfectible et n’est pas à l’abri d’un scénario à la toulousaine et un maintien miraculeux. Il faudrait quand même espérer 10 victoires de suite et une chute des clubs en bas de tableau.
Car c’est bien la faiblesse de ce modèle, il se contente de reproduire en moyenne les performances des équipes sur les deux années passées.
Il ne tient pas compte de la dynamique des équipes avant interruption.
L’ASSE en est un exemple: sa remontée spectaculaire elle la doit à la saison dernière où elle termine 4ème avec un redressement en dernière partie. Cependant en regardant la dynamique actuelle on a du mal à imaginer une équipe de Saint-Etienne capable d’engranger en moyenne 2.5 points par journée.
Il faut tenir compte des moyennes de points passées des équipes engagées à titre d’expérience mais pas exclusivement comme nous le faisons dans ce modèle.
Il gagnerait à être enrichi d’informations sur la première partie de saison pour tenir compte de la dynamique.