Intéressant

Le dilemme des prisonniers

Le dilemme des prisonniers



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

01de 04

Le dilemme des prisonniers

Le dilemme des prisonniers est un exemple très populaire de jeu d’interaction stratégique à deux personnes, et c’est un exemple d’introduction courant dans de nombreux manuels de théorie des jeux. La logique du jeu est simple:

  • Les deux joueurs ont été accusés d'un crime et ont été placés dans des pièces séparées afin de ne pas pouvoir communiquer entre eux. (En d'autres termes, ils ne peuvent pas s'entendre ou s'engager à coopérer.)
  • Il est demandé à chaque joueur indépendamment s'il va avouer le crime ou s'il reste silencieux.
  • Parce que chacun des deux joueurs a deux options possibles (stratégies), il y a quatre résultats possibles pour le match.
  • Si les deux joueurs confessent, ils sont chacun envoyés en prison, mais pendant moins d'années que si l'un des joueurs était mis à l'écart par l'autre.
  • Si un joueur avoue et que l'autre reste silencieux, le joueur silencieux est sévèrement puni, tandis que le joueur qui a avoué est libéré.
  • Si les deux joueurs restent silencieux, ils reçoivent chacun une punition moins sévère que s'ils l'avouent tous les deux.

Dans le jeu lui-même, les punitions (et les récompenses, le cas échéant) sont représentées par des numéros d'utilité. Les nombres positifs représentent de bons résultats, les nombres négatifs, de mauvais, et un résultat est meilleur qu'un autre si le nombre associé est supérieur. (Attention toutefois à la manière dont cela fonctionne pour les nombres négatifs, car -5, par exemple, est supérieur à -20!)

Dans le tableau ci-dessus, le premier chiffre de chaque case indique le résultat pour le joueur 1 et le second chiffre représente le résultat pour le joueur 2. Ces chiffres ne représentent qu'un des nombreux ensembles de chiffres correspondant au dilemme posé par le prisonnier.

02 sur 04

Analyser les options des joueurs

Une fois qu'un jeu est défini, la prochaine étape de l'analyse du jeu consiste à évaluer les stratégies des joueurs et à essayer de comprendre leur comportement. Les économistes émettent quelques hypothèses lorsqu’ils analysent les jeux: d’abord, ils supposent que les deux joueurs sont conscients des gains à la fois pour eux-mêmes et pour l’autre joueur, et, deuxièmement, ils supposent que les deux joueurs cherchent à maximiser rationnellement Jeu.

Une approche initiale simple consiste à rechercher ce que l’on appelle stratégies dominantes- les meilleures stratégies, quelle que soit la stratégie choisie par l’autre joueur. Dans l'exemple ci-dessus, choisir d'avouer est une stratégie dominante pour les deux joueurs:

  • Confesser est meilleur pour le joueur 1 si le joueur 2 choisit de confesser puisque -6 est meilleur que -10.
  • Confesser est préférable pour le joueur 1 si le joueur 2 choisit de rester silencieux, car 0 est meilleur que -1.
  • Confesser est meilleur pour le joueur 2 si le joueur 1 choisit de confesser puisque -6 est meilleur que -10.
  • Confesser est préférable pour le joueur 2 si le joueur 1 choisit de rester silencieux, car 0 est meilleur que -1.

Étant donné que confesser est préférable pour les deux joueurs, il n’est pas surprenant que le résultat, lorsque les deux joueurs confessent, est un résultat d’équilibre du match. Cela dit, il est important d’être un peu plus précis avec notre définition.

03 sur 04

Équilibre de Nash

Le concept de Équilibre de Nash a été codifié par le mathématicien et théoricien du jeu John Nash. En termes simples, un équilibre de Nash est un ensemble de stratégies de meilleure réponse. Pour un jeu à deux joueurs, un équilibre de Nash est un résultat dans lequel la stratégie du joueur 2 est la meilleure réponse à la stratégie du joueur 1 et la stratégie du joueur 1 est la meilleure réponse à la stratégie du joueur 2.

La recherche de l'équilibre de Nash via ce principe peut être illustrée dans le tableau des résultats. Dans cet exemple, les meilleures réponses du joueur 2 au joueur 1 sont entourées en vert. Si le joueur 1 avoue, la meilleure réponse du joueur 2 est de confesser, car -6 est meilleur que -10. Si le joueur 1 ne confesse pas, la meilleure réponse du joueur 2 est de confesser, car 0 est meilleur que -1. (Notez que ce raisonnement est très similaire au raisonnement utilisé pour identifier les stratégies dominantes.)

Les meilleures réponses du joueur 1 sont entourées en bleu. Si le joueur 2 avoue, la meilleure réponse du joueur 1 est d'avouer, car -6 est meilleur que -10. Si le joueur 2 ne confesse pas, la meilleure réponse du joueur 1 est de confesser, puisque 0 est meilleur que -1.

L'équilibre de Nash est le résultat où il y a à la fois un cercle vert et un cercle bleu puisqu'il représente un ensemble de meilleures stratégies de réponse pour les deux joueurs. En général, il est possible d'avoir plusieurs équilibres de Nash ou aucun équilibre (du moins dans les stratégies pures décrites ici).

04 sur 04

Efficacité de l'équilibre de Nash

Vous avez peut-être remarqué que l'équilibre de Nash dans cet exemple semble sous-optimal (en ce sens qu'il n'est pas optimal de Pareto) puisqu'il est possible que les deux joueurs obtiennent -1 plutôt que -6. C’est un résultat naturel de l’interaction présente dans le jeu. En théorie, ne pas confesser serait une stratégie optimale pour le groupe collectivement, mais des mesures incitatives individuelles empêchent ce résultat d’être atteint. Par exemple, si le joueur 1 pensait que le joueur 2 resterait silencieux, il serait incité à le critiquer plutôt que de rester silencieux, et inversement.

Pour cette raison, l’équilibre de Nash peut également être considéré comme un résultat dans lequel aucun joueur n’est incité à dévier unilatéralement (c’est-à-dire par lui-même) de la stratégie qui a conduit à ce résultat. Dans l'exemple ci-dessus, une fois que les joueurs ont choisi d'avouer, aucun joueur ne peut faire mieux en changeant d'avis tout seul.


Voir la vidéo: Le dilemme du prisonnier - will aime (Août 2022).