Euro 2016 : comment choisir où tirer un penalty ?

baby-foot d'extérieur credits frederic Bisson via Flickr ((CC BY 2.0)

La vie est un grand jeu permanent ! Parfois coopératif, parfois non-coopératif, parfois à somme nulle, parfois non…

Par Thomas Renault.

baby-foot d'extérieur credits frederic Bisson via Flickr ((CC BY 2.0)
baby-foot d’extérieur credits frederic Bisson via Flickr ((CC BY 2.0)

Il y a quelques temps, le génie John Nash, prix Nobel d’économie 1994, a perdu la vie avec sa femme Alicia dans un accident de voiture. Si vous ne connaissez pas la vie de John Nash, je ne peux que vous conseiller de regarder au plus vite le film A Beautiful Mind (« Un homme d’exception » en français), oscar du meilleur film en 2002. John Nash était un mathématicien bien plus qu’un économiste, mais ses travaux autour de la théorie des jeux ont inspiré des générations d’économistes, et le célèbre équilibre de Nash a été appliqué à une grande variété de cas. Dans cet article, nous allons nous intéresser à l’équilibre de Nash en stratégies mixtes, en l’appliquant au cas du football et en nous basant sur deux études académiques « Testing Mixed-Strategy Equilibria When Players Are. Heterogeneous: The Case of Penalty Kicks in Soccer » (Chiappori, Levitt & Groseclose, AER, 2002) et « Professionals Play Minimax » (Palacios-Huerta, RES, 2003)

Dans la vie, vous êtes en permanence confronté à ce qu’un économiste appelle un jeu, c’est-à-dire à une situation où votre gain final, ou perte finale, va dépendre de votre action, de votre choix, mais aussi des actions des autres joueurs. Par exemple, si vous êtes dans un bar et que vous apercevez une jolie fille / un beau garçon, vous êtes alors face à un jeu : vous pouvez vous lever pour aller lui parler ou bien rester assis sur votre chaise et ne rien faire. Mais le payoff final (gain ou perte) de ce jeu non-coopératif dépendra bien évidemment de la réaction de la personne en face : une baffe et vous avez perdu, un sourire et c’est gagné. Avant de choisir votre action, vous allez donc essayer d’anticiper la décision de l’agent en face de vous (probabilité de prendre une baffe / probabilité de sourire… oui en économie, une jolie fille devient un simple agent, manque de glamour total !) afin de déterminer votre stratégie optimale, qui dépendra aussi de votre estimation du « bonheur » apporté en cas de succès et du « malheur » en cas d’échec (via une matrice de gain).

Et c’est la même chose avec une entreprise qui va choisir de modifier son prix, mais dont le payoff terminal dépendra de la stratégie de ses concurrents. Si son principal concurrent baisse ses prix en même temps, aucune entreprise ne gagnera de part de marché et le résultat final risque d’être une perte de profit pour tous. Par contre, si l’entreprise est la seule à baisser son prix, cette stratégie peut être gagnante via la hausse des ventes et une potentielle hausse de ses bénéfices (en fonction de l’élasticité-prix et de la fonction de coût).

Un type particulier de jeu est le jeu à somme nulle : dans ce type de jeu, vous gagnez uniquement ce qu’une autre personne perd. Si vous pariez avec un ami 5 euros à pile ou face, il y aura un seul vainqueur et le gain d’une personne sera équivalent à la perte de l’autre. Le cas des penaltys au football est un cas particulièrement intéressant de jeu à somme nulle. Dans ce jeu, deux agents (un gardien et un tireur) s’affrontent. L’objectif du tireur est de maximiser sa probabilité de marquer et l’objectif du gardien est de minimiser cette même probabilité. En simplifiant fortement le jeu, supposons que le tireur puisse tirer soit à droite soit à gauche, et que le gardien ait la possibilité de sauter soit à droite soit à gauche. De plus, on suppose que le gardien arrête le penalty dans 100% des cas s’il plonge du bon côté. Il est alors possible de représenter ce jeu sous la forme d’une matrice de gain:

matrice-penalty

Si le tireur tire à gauche du but et que le gardien saute à gauche du but (= sur sa droite), alors le gardien arrête le penalty et son gain est de +1 (bonheur) et la perte pour le tireur est de -1 (tristesse). Idem bien évidemment pour droite/droite. À l’inverse, si le tireur tire d’un côté et que le gardien plonge de l’autre, alors le gain est de +1 pour le tireur (bonheur) et de -1 pour le gardien (tristesse).

Si vous avez un peu joué au foot dans votre vie, il est assez clair que chaque tireur est plus précis d’un côté que d’un autre. Si l’on suppose que le gardien adopte un comportement totalement aléatoire en sautant avec un probabilité de 50% à droite et de 50% à gauche, alors pour maximiser ses gains, un tireur devrait alors toujours tirer vers son côté naturel (probabilité de tirer à côté ou au dessus plus faible). Mais en réalité, le choix d’un gardien n’est absolument pas aléatoire, et chaque gardien ajuste son comportement en fonction des préférences du tireur et de l’historique des penaltys tirés par ce joueur. Dans ce cas, vous devez alors utiliser une stratégie mixte, en alternant votre manière de tirer les penaltys pour maximiser votre probabilité de marquer (selon une loi de probabilité donnée).

Pour pouvoir faire quelque chose d’intéressant de la matrice précédente, il est nécessaire donc d’introduire des probabilités un peu partout : (1) quelle est la probabilité qu’un tireur droitier tire à droite, et quelle est la probabilité qu’il tire à gauche, (2) quelle est la probabilité qu’un gardien arrête le penalty en plongeant du bon côté, (3) quelle est la probabilité qu’un tireur frappe hors du cadre, (4) quelle est la probabilité que le tir ne soit ni à droite ni à gauche, mais au milieu… La matrice de gain peut alors s’écrire sous cette forme (extrait de l’article de Chiappori & al.). Nous avons alors deux agents, « G » le Goalkeeper (gardien) et « K » le Kicker (tireur) qui ont chacun trois choix : Left (L), Center (C) ou Right (R). Selon le choix de chaque agent, une probabilité de réussir le penalty est indiquée dans la matrice, avec différentes hypothèses sur les probabilités. Par exemple, on suppose que PL, la probabilité de marquer en tirant sur son côté naturel bien que le gardien saute du bon côté, est supérieure à PR, la probabilité de marquer en frappant sur son mauvais côté lorsque le gardien fait le bon choix. On suppose aussi par exemple que si le tireur choisit le centre et que le gardien reste aussi au centre, la probabilité de marquer est nulle (le penalty est toujours arrêté – croisement C/C dans la matrice ci-dessous).

 

penalty-matrix-chiappori

 

Mais cette belle théorie est-elle applicable à la réalité ? Pour répondre à cette question, Chiappori & al. ont analysé 459 penaltys en Ligue 1 (France) et dans le Calcio (Italie), tandis que Palacios-Huerta a considéré un échantillon plus large de 1417 penaltys tirés entre 1995 et 2000. Les deux études ont alors montré que les résultats empiriques étaient très proches des résultats théoriques et que les penaltys tirés n’étaient pas sériellement corrélés, conditionnellement à la probabilité générale de choisir un côté. Pour le dire autrement, les footballeurs sont loin d’être stupides et adoptent une bonne stratégie lorsqu’ils tirent les penaltys. Les résultats sont un peu complexes, mais si le sujet vous intéresse, les liens vers les deux articles sont disponibles dans l’introduction (et voir aussi « Professionals Do Not Play Minimax: Evidence from Major League Baseball and the National Football League » dans le cas du Baseball et Football Américain ou « Minimax Play at Wimbledon » pour Wimbledon… avec des résultats parfois contradictoires).

 

– « Conditional on the overall probability of choosing left, right, or center, the actual strategy played on the previous penalty kick should not predict the strategy played this time. » Chiappori & al.

 

– « Hence, spacing strategies out over time or taking them in rapid succession does not appear to make any differences for these professional players to generate sequences with no serial correlation in this natural play. » Palacios-Huerta

 

Sans trop entrer dans les détails techniques, il est important de comprendre que pour les jeux non-coopératifs à somme nulle (comme pierre-feuille-ciseau), il est nécessaire que vos actions soient imprévisibles (conditionnellement à une loi de probabilité) pour éviter de perdre contre un individu plus « intelligent » que vous. Par exemple à pierre-feuille-ciseau, si vous faites trop souvent « pierre » (c’est à dire plus de 33,33% du temps) alors à la longue vous perdrez contre un agent maximisateur qui aura compris votre jeu. Au football, c’est la même chose ! Vous pouvez par exemple en parler à Jérôme Boateng, qui doit encore se souvenir de son duel face à Lionel Messi (un très bon exemple de jeu non-coopératif en stratégies mixtes). Boateng anticipe clairement le drible « classique » (ou naturel) de Messi, en se basant sur un historique des matchs précédents (probabilité que Messi parte sur son pied gauche très forte / probabilité que Messi parte sur son pied droit très faible / probabilité de le stopper en anticipant le départ pied droit très forte / probabilité de le stopper en anticipant le drible naturel plus faible car drible plus précis). Et là c’est le drame…

Conclusion : la vie est un grand jeu permanent ! Parfois coopératif, parfois non-coopératif, parfois à somme nulle, parfois non… La grande majorité des choix que vous faites peut se placer dans le cadre d’un jeu, et la théorie des jeux peut très souvent apporter une réponse ou une explication permettant d’expliquer les choix des agents. L’important dans un jeu est de bien définir les probabilités et la matrice des gains, pour éviter de perdre contre un agent maximisateur (= un agent jouant au même jeu que vous, mais mieux). Sur ce, il est temps de regarder A Beautiful Mind (cet article s’est un peu éloigné des travaux de Nash, mais le concept général est à peu près là) !

Sur le web