Distribution de Poisson, sans "s"

Prenons les 1900 matchs des 5 dernières saisons de Ligue 1 (20112012 - 20152016) et regardons le nombre de buts par match :

disbutl1

Ok chouette.

Retenez bien la forme de ce graph, qui représente une distribution. Par exemple, sur les 5 dernières saisons nous nous sommes tapé nous avons assisté à 159 matchs avec 0 buts et seulement 3 matchs avec 9 buts (Lille-Bordeaux 20112012 : 4-5, Guingamp-Nice 20142015 : 2-7, Troyes-Paris 20152016: 0-9).

Maintenant, utilisons la moyenne de buts par match (environ 2.5 ) et le nombre total de matchs joués pour demander à l’ordinateur de générer aléatoirement 1900 chiffres selon une distribution de Poisson :

poiss

O miracle, On retrouve la même forme ! Et à partir de données créées de toutes pièces par l’ordinateur en plus !

En superposant les deux courbes :

compar

Pas trop mal.

« -Hey, mais on pourrait pas tenter de prédire les matchs avec ça ?

-T’as tout compris ;-) »

 

Notes methodo

(i) Afin de déterminer la probabilité d’avoir 3 buts dans un match sachant qu’il y en a 2.5 en moyenne, il suffit d’utiliser la formule suivante :

Capture

ce qui donne comme résultat :

IMG_0174

Vous pouvez ensuite utiliser un paramètre qui vous paraît plus juste pour affiner vos prédictions.

(ii) En creusant un peu le sujet, vous verrez peut-être  que la distribution du nombre de buts ne suit pas tout à fait la loi de poisson. Celle-ci suppose en effet que chaque événement soit indépendant du précédent, ce qui n’est pas forcément le cas en football puisque les stratégies d’équipe évoluent en fonction du score.

(iii) Pour ceux qui voudraient approfondir ces techniques, je vous recommande chaudement ces deux pages web :

http://pena.lt/y/tag/poisson.html
http://thepowerofgoals.blogspot.co.uk/2016/02/how-to-frame-individual-match-outcome.html?m=1