Jeu sous forme normaleEn théorie des jeux, un jeu sous forme normale est la spécification de l'espace des stratégies et des fonctions de paiement de chaque joueur à toutes les étapes possibles du jeu. Il s'agit de la description d'un jeu sous forme de matrice. Définition mathématiqueDéfinitions préliminairesLa forme normale est employée pour décrire des jeux à nombre de coups, de joueurs et de stratégies finis.
Jeu sous forme normaleAvec les définitions du paragraphe précédent, la forme normale d'un jeu est alors la donnée du -uplet ou encore Jeux infinisLes définitions données ci-dessus sont également valables pour les jeux comportant un nombre infini de joueur ou de stratégies possibles. Toutefois, leur étude demande des outils d'analyse fonctionnelle qui ne sont pas requis en théorie des jeux finis. Stratégies mixtes en forme normaleAvec le profil de stratégies mixtesIl est possible d'intégrer la possibilité de stratégies mixtes dans un jeu en forme normale. On suppose alors que chaque joueur associe une probabilité à chaque élément de : Un profil de stratégies mixtes est alors la donnée des . Avec la fonction de paiementsL'espace des profils de stratégies est alors un espace probabilisé tel que :
La fonction de paiements est alors une variable aléatoire sur . On en considère alors l'espérance selon . Matrice des gainsDéfinitionQuand il n'y a que deux joueurs et un nombre suffisamment restreint de stratégies, il est possible de donner la forme normale d'un jeu sous la forme d'un tableau à m lignes et n colonnes, où m et n sont le nombre de stratégies à la disposition du joueur, représentées respectivement en ligne et en colonne. Les cases du tableau sont alors remplies avec un doublet donnant les paiements pour chaque joueur si le résultat du jeu est la paire de stratégies correspondant à la ligne et à la colonne de la case considérée. ExempleConsidérons le jeu connu sous le nom de dilemme du prisonnier. Les deux joueurs sont deux criminels, entendus en même temps, séparément l'un de l'autre et sans possibilité de communiquer à propos d'un crime commis en commun. Chaque prisonnier peut soit nier le crime (C, pour coopérer), soit plaider coupable et servir de témoin à charge contre son complice (D, pour dévier). Le résultat de chaque stratégie en nombre d'années de prison (les paiements sont donc négatifs) est comme suit :
Le premier prisonnier (Ligne) peut donc choisir de coopérer ou de dévier. De même, le deuxième prisonnier (Colonne) peut choisir entre coopérer et dévier. Si les deux coopèrent, ils écopent d'un an de prison chacun. S'ils dévient tous les deux, ils écopent de dix ans chacun. Si Ligne coopère et que Colonne dévie, Colonne est libéré, et Ligne prend vingt ans de prison. Inversement, si Ligne dévie et Colonne coopère, Ligne est libre et Colonne en prend pour vingt ans. |