- Ce notebook Jupyter est une correction non officielle d'un texte de modélisation pour l'option informatique de l'agrégation externe de mathématiques.
- Il s'agit du texte public2012-D3.
- Cette tentative de correction partielle a été rédigée par Lilian Besson (sur GitHub ?, sur Bitbucket ?), et est open-source.
Feedbacks?¶
- Vous avez trouvé un bug ? → Signalez-le moi svp !, merci d'avance.
- Vous avez une question ? → Posez la svp !
Attention : ce document ne prétend pas être LA correction du texte, mais un exemple de solution.
import numpy as np
import numpy.random as random
import matplotlib.pyplot as plt
On va d'abord écrire une fonction toute simple qui affiche une configuration, en mode texte. Si on a le temps, on en fera une qui affiche joliment dans une fenêtre graphique (avec matplotlib).
def print_nim(configuration):
""" Affiche une configuration, donnée sous forme d'une liste d'entiers. """
for i, nb in enumerate(configuration):
print(i, ':', '!' * nb)
On peut définir et afficher deux exemples de configuration d'un jeu de Nim, venant de la figure 1.
a = [1, 3, 5]
print_nim(a)
0 : ! 1 : !!! 2 : !!!!!
b = [1, 3, 2]
print_nim(b)
0 : ! 1 : !!! 2 : !!
Elle est donnée par le corollaire 1. en page 6/7 du texte.
On a besoin du xor ("ou exclusif", cf cette page), obtenu en Python avec l'opérateur ^
:
Petit rappel sur cette fonction xor :
from itertools import product
for b1, b2 in product([False, True], repeat=2):
print("{!s:>5} XOR {!s:>5} = {!s:>5} ^ {!s:>5} = {!s:>5}".format(b1, b2, b1, b2, b1 ^ b2))
# Ce morceau de code est un peu fancy mais concis et joli, cf. https://pyformat.info/#string_pad_align
False XOR False = False ^ False = False False XOR True = False ^ True = True True XOR False = True ^ False = True True XOR True = True ^ True = False
D'apres le corollaire 1., il suffit d'appliquer un xor à chaque valeur du tableau pour calculer $\gamma$ :
def gamma(configuration):
""" Fonction gamma de Sprague-Grundy pour le jeu de Nim. """
resultat = 0
for nb in configuration:
resultat = (resultat ^ nb) % 2 # On reste binaire
return resultat
print("Gamma(a) =", gamma(a))
print("Gamma(b) =", gamma(b))
Gamma(a) = 1 Gamma(b) = 0
On suit l'algorithme proposé par le texte, qui utilise la fonction $\gamma$ sur la configuration pour savoir s'il y a une stratégie ou non (d'après la proposition 5.), et ensuite si elle existe on doit trouver un coup qui ammene $\gamma$ à 0.
On a d'abord besoin d'une exception pour signaler s'il n'y a pas de stratégie gagnante, et du calcul du nombre minimal d'allumette à enlever.
class PasDeStratGagnante(Exception):
""" Exception renvoyée s'il n'y a pas de stratégie gagnante. """
pass
def tronquer(n):
""" Calcule le nombre minimum d'allumette à enlever."""
return 2 ** int(np.floor(np.log2(n)))
tronquer(5) # = 4
4
tronquer(13) # = 8
8
def optimal(configuration, joueur=0):
""" Essaie de trouver un coup à jouer pour le joueur 0 ou 1, et renvoit la configuration modifiée."""
g = gamma(configuration)
if g == 0:
print("Il n'y a pas de stratégie gagnante !")
raise PasDeStratGagnante # On quitte
print("Il y a une stratégie gagnante... Trouvons la !")
# On chercher le coup à jouer : la ligne la plus longue...
position_max = 0 # est d'indice position_max
nb_max = configuration[0] # et a nb_max allumette(s)
for j, nb in enumerate(configuration):
if nb > nb_max:
position_max = j
nb_max = nb
a_enlever = tronquer(nb_max)
# On applique ce coup
print("Le joueur courant", joueur, "a choisis de retirer", a_enlever, "allumettes à la rangée numéro", position_max)
nouvelle_configuration = configuration[:]
nouvelle_configuration[position_max] -= a_enlever
return nouvelle_configuration
On peut tester cette fonction sur nos deux configuration a et b :
print_nim(a)
print_nim(optimal(a, joueur=0)) # Ça joue
0 : ! 1 : !!! 2 : !!!!! Il y a une stratégie gagnante... Trouvons la ! Le joueur courant 0 a choisis de retirer 4 allumettes à la rangée numéro 2 0 : ! 1 : !!! 2 : !
print_nim(b)
print_nim(optimal(b, joueur=0)) # Pas de stratégie gagnante ici !
0 : ! 1 : !!! 2 : !! Il n'y a pas de stratégie gagnante !
--------------------------------------------------------------------------- PasDeStratGagnante Traceback (most recent call last) <ipython-input-170-47da47747e0e> in <module>() 1 print_nim(b) ----> 2 print_nim(optimal(b, joueur=0)) # Pas de stratégie gagnante ici ! <ipython-input-168-adbbbeeb8e44> in optimal(configuration, joueur) 4 if g == 0: 5 print("Il n'y a pas de stratégie gagnante !") ----> 6 raise PasDeStratGagnante 7 print("Il y a une stratégie gagnante... Trouvons la !") 8 # On chercher le coup à jouer : la ligne la plus longue... PasDeStratGagnante:
Dans le but de comparer cette fonction qui implémente une stratégie optimale, on implémente aussi une stratégie complétement aléatoire ("Dummy player").
def stupide(configuration, joueur=0):
""" Choisit un coup aléatoire (uniforme) pour le joueur 0 ou 1, et renvoit la configuration modifiée."""
# On choisit le coup à jouer : ligne random, nb d'allumette(s) random...
lignes_non_vides = [i for i, c in enumerate(configuration) if c > 0]
position_random = random.choice(lignes_non_vides)
print("Le joueur", joueur, "aléatoire uniforme a choisis de regarder la ligne", position_random)
total = configuration[position_random]
a_enlever = random.randint(1, 1 + total)
print("Le joueur", joueur, "aléatoire uniforme a choisis de retirer", a_enlever, "allumettes parmi les", total, "disponibles")
# On applique ce coup
nouvelle_configuration = configuration[:]
nouvelle_configuration[position_random] -= a_enlever
return nouvelle_configuration
On peut ainsi faire un exemple de début de partie entre deux joueurs "stupides" :
random.seed(0) # Assure la reproductibilité des résultats.
a0 = a # Debut du jeu
print_nim(a0)
a1 = stupide(a0, joueur=0)
print_nim(a1)
a2 = stupide(a1, joueur=1)
print_nim(a2)
a3 = stupide(a2, joueur=0)
print_nim(a3)
# ... etc
0 : ! 1 : !!! 2 : !!!!! Le joueur 0 aléatoire uniforme a choisis de regarder la ligne 0 Le joueur 0 aléatoire uniforme a choisis de retirer 1 allumettes parmi les 1 disponibles 0 : 1 : !!! 2 : !!!!! Le joueur 1 aléatoire uniforme a choisis de regarder la ligne 2 Le joueur 1 aléatoire uniforme a choisis de retirer 1 allumettes parmi les 5 disponibles 0 : 1 : !!! 2 : !!!! Le joueur 0 aléatoire uniforme a choisis de regarder la ligne 2 Le joueur 0 aléatoire uniforme a choisis de retirer 4 allumettes parmi les 4 disponibles 0 : 1 : !!! 2 :
On peut aussi faire le meme exemple de début de partie entre un joueur "optimal" et un joueur "stupide" :
random.seed(0) # Assure la reproductibilité des résultats.
a0 = a # Debut du jeu
print_nim(a0)
a1 = optimal(a0, joueur=0)
print_nim(a1)
a2 = stupide(a1, joueur=1)
print_nim(a2)
# ... etc
0 : ! 1 : !!! 2 : !!!!! Il y a une stratégie gagnante... Trouvons la ! Le joueur courant 0 a choisis de retirer 4 allumettes à la rangée numéro 2 0 : ! 1 : !!! 2 : ! Le joueur 1 aléatoire uniforme a choisis de regarder la ligne 0 Le joueur 1 aléatoire uniforme a choisis de retirer 1 allumettes parmi les 1 disponibles 0 : 1 : !!! 2 : !
Maintenant qu'on dispose d'un joueur stupide et d'un joueur optimal, on peut rapidement coder une petite fonction qui les fera s'affronter (même si c'est un peu cruel envers le pauvre joueur "stupide" purement aléatoire !).
class Perdu(Exception):
""" Représente le joueur numero i qui a perdu."""
def __init__(self, numero):
self.numero = numero
def __str__(self):
return "Le joueur {} a perdu !".format(self.numero)
La fonction simule
va jouer la partie, en partant de la configuration donnée, en commençant par le joueur numero
et pour un certain nombre de coups joués (nb_coups
).
Si on ne donne pas ce nombre de coups, le nombre total d'allumette est utilisé (sachant qu'une partie se termine souvent par une exception PasDeStratGagnante
lorsque le joueur optimal ne peut plus gagner).
def simule(configuration, numero=0, nb_coups=None):
""" Simule le jeu de Nim, alternant un joeur malin et un joueur stupide. """
config = configuration[:] # On ne change pas la liste donnee en argument !
# Si on n'a pas donne le nb de coups max, on calcule une borne :
if nb_coups is None:
nb_coups = sum(configuration)
print("Début de la simulation pour maximum", nb_coups, "coups.")
# On lance la simulation
for coup in range(1, 1 + nb_coups):
print("\n# Tour numéro", coup)
print_nim(config)
# On perd si on ne peut plus enlever d'allumettes
if sum(config) == 0:
raise Perdu(numero)
else:
if numero == 0: # Joueur malin
config = optimal(config, joueur=numero)
else: # Joueur stupide
config = stupide(config, joueur=numero)
# Joueur suivant
numero = int(not numero) # 0 -> 1, 1 -> 0
# A la fin, la configuration finale est renvoyée.
return config
On peut finalement implementer une jolie fonction qui simule en partant du joueur 0
(comme le vrai jeu de Nim) et interprète l'exception renvoyée pour afficher l'issue du jeu :
def nim(configuration):
try:
simule(configuration)
except PasDeStratGagnante:
print("==> Blocage car le joueur 0 n'a pas pu trouver de coup gagnant, il déclare forfait (le pleutre !).")
except Perdu as e:
print("==> Le joueur", e.numero, "a perdu.")
nim(a)
Début de la simulation pour maximum 9 coups. # Tour numéro 1 0 : ! 1 : !!! 2 : !!!!! Il y a une stratégie gagnante... Trouvons la ! Le joueur courant 0 choisis de retirer 4 allumettes à la rangée numéro 2 # Tour numéro 2 0 : ! 1 : !!! 2 : ! Le joueur 1 aléatoire uniforme a choisis de regarder la ligne 1 Le joueur 1 aléatoire uniforme a choisis de retirer 2 allumettes parmi les 3 disponibles # Tour numéro 3 0 : ! 1 : ! 2 : ! Il y a une stratégie gagnante... Trouvons la ! Le joueur courant 0 choisis de retirer 1 allumettes à la rangée numéro 0 # Tour numéro 4 0 : 1 : ! 2 : ! Le joueur 1 aléatoire uniforme a choisis de regarder la ligne 2 Le joueur 1 aléatoire uniforme a choisis de retirer 1 allumettes parmi les 1 disponibles # Tour numéro 5 0 : 1 : ! 2 : Il y a une stratégie gagnante... Trouvons la ! Le joueur courant 0 choisis de retirer 1 allumettes à la rangée numéro 1 # Tour numéro 6 0 : 1 : 2 : ==> Le joueur 1 a perdu.
nim(b)
Début de la simulation pour maximum 6 coups. # Tour numéro 1 0 : ! 1 : !!! 2 : !! Il n'y a pas de stratégie gagnante ! ==> Blocage car le joueur 0 n'a pas pu trouver de coup gagnant, il déclare forfait (le pleutre !).
On peut écrire une fonction qui génére une configuration aléatoire, et ensuite lancer notre simulation nim()
dessus, pour voir ce que ça donne sur une configuration plus grande.
def config_aleatoire(nb_ligne, nb_max_allumette):
""" Configuration aléatoire, chaque ligne est uniformément tirée dans [1, nb_max_allumette] (bornes incluses)."""
return list(random.randint(1, 1 + nb_max_allumette, nb_ligne))
c = config_aleatoire(4, 4)
print("Configuration random c :")
print_nim(c)
nim(c)
Configuration random c : 0 : !!!! 1 : ! 2 : !! 3 : !!!! Début de la simulation pour maximum 11 coups. # Tour numéro 1 0 : !!!! 1 : ! 2 : !! 3 : !!!! Il y a une stratégie gagnante... Trouvons la ! Le joueur courant 0 a choisis de retirer 4 allumettes à la rangée numéro 0 # Tour numéro 2 0 : 1 : ! 2 : !! 3 : !!!! Le joueur 1 aléatoire uniforme a choisis de regarder la ligne 2 Le joueur 1 aléatoire uniforme a choisis de retirer 2 allumettes parmi les 2 disponibles # Tour numéro 3 0 : 1 : ! 2 : 3 : !!!! Il y a une stratégie gagnante... Trouvons la ! Le joueur courant 0 a choisis de retirer 4 allumettes à la rangée numéro 3 # Tour numéro 4 0 : 1 : ! 2 : 3 : Le joueur 1 aléatoire uniforme a choisis de regarder la ligne 1 Le joueur 1 aléatoire uniforme a choisis de retirer 1 allumettes parmi les 1 disponibles # Tour numéro 5 0 : 1 : 2 : 3 : ==> Le joueur 0 a perdu.
Oui, c'est la honte, le joueur 0 (qui utilise une stratégie optimale) vient de perdre en 5 coups face à un joueur aléatoire...
C'est tout ce que j'avais eu le temps d'implémenter durant les 4h de préparation (c'est un des textes que j'avais préparé en juin 2014, dans les "vraies" conditions en oraux blanc, à l'ENS Cachan, et le code initial était en OCaml mais je n'ai rien changé à part la conversion en Python3).
Quelques remarques :
optimal()
(cf. plus haut).Les 40 minutes de passage au tableau ne doivent PAS être uniquement consacrée à la présentation de vos expériences sur l'ordinateur !
Il faut aussi :
C'est tout pour aujourd'hui les amis ! Allez voir d'autres notebooks si vous voulez.