A la recherche du latéral de demain

L’OM avait besoin de recruter des latéraux, d’une part parce que ce secteur de jeu était faiblement doté en nombre et en qualité et d’autre part pour des raisons footballistiques de contribution au jeu offensif. L’arrivée récente d’Amavi vient combler un manque au sein de l’effectif mais ce n’est pas pour autant qu’il faut s’arrêter en si bon chemin. A droite le valeureux Sakaï est bien esseulé et la solution Bouna Sarr n’est pas forcément la plus rassurante à moyen terme.

Afin de me faire une idée plus précise de ce qu’on est en mesure d’attendre d’un latéral offensif, j’ai entrepris une exploration de ce secteur de jeu si particulier mais indispensable à toute équipe voulant jouer les premiers rôles. Comme d’habitude, ce qui est présenté ici n’a pas vocation à faire référence au sein d’un club professionnel. Il s’agit, encore une fois, de regarder en amateur ce qu’on peut faire en utilisant les données publiques et des méthodes statistiques. De plus cela ne se substituerait en rien à un travail d’observation in situ par la suite.

1.Les données

J’ai utilisé les données de la saison 2016/2017 ou équivalent pour les championnats suivants :

  • Premier League
  • Serie A
  • Liga
  • Bundesliga
  • Ligue 1
  • Liga NOS (POR)
  • Eredivisie
  • Brasileirao
  • Primera Division (ARG)
  • Championship (ANG)

Avec des joueurs ayant joué au moins 900 minutes comme titulaire à un poste de latéral droit ou gauche, ce qui donne 490 joueurs au total.

2.La méthode

Sélection de joueurs sur base de leur performance dans trois domaines : les centres et passes clés, les dribbles, les actions défensives. Sélection effectuée en comparaison à leurs pairs et en estimant leur performance individuelle relativement à l’échantillon étudié.

Les centres et les passes clés

distr_s_cr

Sakaï et Evra n’étant pas véritablement reconnus pour leur volume et qualité de centre, ce qui est fâcheux pour des latéraux, j’en ai donc fait le point de départ de mon analyse.

Problème, si on se contente de classer les joueurs par pourcentage de centres réussis on se retrouve avec des joueurs ayant tenté peu de centres et les ayant réussis. Pour avoir une vision plus fidèle de la réalité, j’utilise donc une méthode appelée bayésienne empirique (cf. annexe pour plus de détail) qui permet d’obtenir un pourcentage de centres réussis plus représentatif du niveau réel du joueur.

Selon cette méthode et à titre illustratif, les 30 centreurs les plus adroits de la saison passée étaient :

top_30_crp

Un mélange d’illustres inconnus et de stars déjà bien établies. Comment lire ce schéma ? Tout d’abord la ligne rouge représente la moyenne estimée de l’échantillon. Les barres horizontales donnent l’intervalle crédible, c’est-à-dire l’intervalle au sein duquel on pense que se situe la vraie moyenne du joueur. Enfin le point représente la moyenne estimée du joueur. Plus l’intervalle est étroit plus le niveau de crédibilité de la moyenne estimée est élevé. A noter qu’aucun joueur n’est à 100% au-delà de la moyenne estimée. Autre point, aucun joueur ne situe au-delà des 28% contrairement à ce qu’indique la distribution initiale ci-dessus où certains joueurs atteignent les 40%. C’est l’effet de réduction de la méthode Bayésienne.

Premier filtre : dans la mesure où l’on cherche à construire un effectif pour le moyen terme je ne garde que les joueurs de 25 ans ou moins. De plus, je garde ceux dont notre niveau de certitude sur : « une qualité de centre supérieure à la moyenne estimée » est au moins de 50%. Enfin et cela a son importance, parmi cet échantillon je garde les 50% les plus prolifiques en termes de passes clés estimées.

distr_opkp

Pourquoi passes clés et pas centres réussis ? La corrélation est forte mais il y a toujours des latéraux qui délivrent des passes clés sans centrer. Je préfère partir sur cette base puisque ce qui importe c’est la contribution aux tirs de manière générale. Qui plus est, la frontière est parfois ténue entre passes et centre et il est possible que des erreurs humaines puissent s’immiscer dans l’enregistrement des actions par OPTA.

Pourquoi ne pas avoir fait le filtre directement ? Parce que le modèle donne de meilleurs résultats quand la taille de l’échantillon est large.

On arrive à une première shortlist de 51 jeunes joueurs.

Les dribbles

distr_drib

Autre domaine important pour les latéraux et qui faisait jusque-là défaut aux nôtres : les dribbles. En plus de permettre l’élimination d’un adversaire direct et donc une progression sur le terrain, ils sont également le reflet de la qualité technique du joueur.

Même méthode que pour les centres, l’idée étant toujours de faire une shortlist « intelligente », sur la base des performances de l’ensemble des joueurs et des performances individuelles.

Étape intermédiaire en visuel :top_30_dr

En repartant de mon échantillon initial de 490 joueurs et en appliquant le même type de filtre que décrit ci-dessus, j’obtiens une nouvelle shortlist de 62 joueurs de 25 ans ou moins, dont la qualité et le volume de dribbles sont estimés au-dessus de la moyenne estimée (sic).

Les actions défensives

Par action défensives j’entends les tacles au sens de récupérer le ballon dans les pieds de l’adversaire et donc pas forcément glissés, les interceptions et les contres (tirs, passes et centres).

distr_da

Soyons clairs, évaluer un défenseur via son volume d’actions défensives n’est pas la méthode la plus adaptée. En effet, un joueur évoluant dans une équipe ayant la possession aura tout simplement moins d’opportunités de se mettre en valeur défensivement. Le schéma ci-dessous illustre assez bien, sans que la corrélation soit toutefois marquée, que les latéraux qui touchent beaucoup de ballons ont légèrement tendance à faire moins d’actions défensives.

pas_actd

Des méthodes bien plus efficaces existent pour évaluer l’impact d’un défenseur (cf. PATCH), mais je ne peux les utiliser ici car je n’ai pas les données de détail.

Malgré cela, dans la mesure où nous cherchons des joueurs moins établis et donc qui évoluent peut-être dans des clubs moins huppés, regarder le volume des actions défensives est moins problématique. Par ailleurs, le fait d’avoir déjà fait un premier tri des latéraux les plus offensifs nous permet d’avoir davantage de confort sur les caractéristiques des joueurs restants.

Toujours à partir de mon échantillon initial de 490 joueurs, ma shortlist de latéraux de 25 ans ou moins, ayant une activité défensive estimée au-dessus de la moyenne estimée (re-sic !),  est constituée de 106 joueurs.

3.La shortlist

En combinant mes trois shortlists, les 10 joueurs suivants sont les seuls rescapés :

test3

Voir Emerson tout en haut a tendance à me rassurer. Quant aux autres, Sabaly mis à part, difficile de se faire une idée autrement que via des vidéos Youtube… quand il y en a. Cela étant, il s’agit de joueurs qui dominent leurs pairs dans tous les domaines étudiés, avec un degré variable de certitude. Ce degré de certitude est ici illustré par le PIP : Posterior Inclusion Probability.

Est-ce que pour autant je mettrais 10M sur un de ces joueurs les yeux fermés ? Bien sûr que non. En revanche, je n’hésiterais pas à aller regarder ce qu’ils donnent dans la vraie vie. Les bureaux climatisés c’est bien, mais les terrains un soir d’hiver ça reste irremplaçable.

4.Limites et discussion

La taille de l’échantillon est faible, un historique de plusieurs années donnerait sûrement des résultats différents, à la fois concernant la distribution initiale et les performances individuelles des joueurs.

Tous les centres ne se valent pas. Pour évaluer avec plus de précision la qualité de centre, il faudrait les coordonnées de chaque centre tenté et construire un modèle d’Expected Cross mais je n’ai pas les données.

Le choix des métriques est relativement subjectif et ne doit pas empêcher d’aller regarder d’autres indicateurs comme le nombre de fautes ou les duels aériens voire des indicateurs plus sophistiqués.

L’échantillon étant relativement limité, j’ai dû amalgamer latéraux droits et gauches pour obtenir un niveau de confiance satisfaisant. Dans l’idéal, il faudrait s’assurer que les 2 populations ont des distributions identiques.

Dans le même ordre d’idée, les championnats ont aussi leurs disparités cf. ci-dessous. En toute rigueur, il faudrait en tenir compte.

leagues5.Annexe

J’ai utilisé la méthode empirique telle que présentée dans cet ouvrage et cet article.

 

 

 

 

Une réflexion au sujet de « A la recherche du latéral de demain »

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s