Algorithme de la boulangerie

L'algorithme de la boulangerie (Lamport's bakery algorithm en anglais) est un algorithme d'exclusion mutuelle inventé par Leslie Lamport[1], dans le cadre général de machines multi-processeurs à mémoire partagée ne fournissant aucune opération atomique.

Dans sa forme originelle, il utilise de l'attente active avant l'entrée en section critique.

Utilité

L'algorithme de la boulangerie peut être utilisé afin de réaliser une exclusion mutuelle sur toute machine multi-processeur, y compris celles qui ne fournissent pas d'opérations atomiques, ou qui en fournissent de simples ne permettant de réaliser qu'une seule opération mémoire (lecture ou écriture) à la fois.

Cependant, toutes les architectures modernes proposent des opérations atomiques combinant à la fois la lecture et l'écriture en une seule opération (comme Test And Set, Fetch And Add ou Compare And Swap). Ces dernières autorisent des implémentations de l'exclusion mutuelle plus efficaces.

L'algorithme de la boulangerie présente donc aujourd'hui principalement un intérêt théorique et pédagogique (lire la section Historique et propriétés pour plus de détails).

Intuition

L'algorithme reprend l'intuition de la gestion d'une file d'attente dans un petit commerce (boulangerie) ou une administration (préfecture). Des numéros d'ordre croissants sont attribués (implicitement ou par des tickets) aux clients / usagers au fur et à mesure qu'ils se présentent, et ces derniers sont servis dans l'ordre des numéros.

Les différents fils d'exécution (ou processus) souhaitant entrer en section critique sont donc les analogues des clients / usagers. L'algorithme comporte schématiquement 3 phases:

  1. Attribution d'un numéro d'ordre (ticket).
  2. Attente de son tour avant l'entrée en section critique.
  3. Sortie de la section critique.

L'analogie ne peut cependant être poursuivie car, contrairement à ce qui se passe dans la vie courante, plusieurs fils d'exécution peuvent occasionnellement obtenir le même numéro d'ordre lors de la première phase, ce qui nécessite un arbitrage ultérieur.

L'algorithme

L'algorithme garantit l'exclusion mutuelle de N fils d'exécution, N étant fixé à l'avance.

Les fils doivent posséder des identifiants (habituellement, un entier) comparables (c'est-à-dire éléments d'un ensemble munis d'une relation d'ordre, supposée totale).

L'algorithme requiert également une zone de mémoire partagée servant à stocker deux tableaux comportant N éléments:

  • Le premier est un tableau de booléens, appelé CHOIX.
  • Le second est un tableau d'entiers naturels, appelé COMPTEUR.

La valeur particulière 0 indique, dans ce dernier tableau, qu'un fil ne souhaite pas entrer en section critique. Les autres valeurs représentent des numéros de ticket potentiels.

Il n'est pas nécessaire que les opérations de lecture et d'écriture sur les tableaux partagés soient réalisées de manière atomique. Pour faciliter la compréhension, le lecteur peut dans un premier temps supposer que ces opérations sont atomiques, puis se référer à la section Historique et propriétés pour obtenir des précisions sur la validité de ce point.

L'algorithme ne présuppose rien sur la vitesse d'exécution relative des différents fils. Il garantit qu'un seul fil exécute la section critique à la fois. Il n'introduit pas d'interblocage ou de famine.

Initialisation

Avant toute utilisation de l'algorithme, les tableaux partagés doivent être initialisés comme suit.

 Initialiser toutes les cases de COMPTEUR à 0.
 Initialiser toutes les cases de CHOIX à 0 (ou FAUX).

Entrée en section critique

Le code suivant est exécuté par un fil souhaitant entrer en section critique. ID désigne son identifiant.

Première phase

Cette portion de code vise à l'attribution d'un ticket. Le principe en est de regarder tous les numéros déjà attribués et de s'en attribuer un nouveau plus grand que les autres.

 ' Début de la phase d'attribution d'un ticket
 CHOIX[ID] = 1
 
 MAX = 0
 ' Calcul de la valeur maximale des tickets des autres threads
 POUR J = 0 À N - 1 FAIRE
   CJ = COMPTEUR[J]
   SI MAX < CJ ALORS
     MAX = CJ
   FIN SI
 FIN POUR J
 ' Attribution du nouveau ticket
 COMPTEUR [ID] = MAX + 1
 
 ' Fin de la phase d'attribution du ticket
 CHOIX[ID] = 0

Cependant, il est possible que plusieurs fils d'exécution exécutent le code de cette phase de manière concurrente. Ils peuvent alors réaliser le même calcul du maximum et s'attribuer le même ticket. Ce cas est pris en compte lors de la phase suivante. En toute généralité, si on ne suppose pas que les lectures et écritures sont atomiques, il est même possible que des fils exécutant de manière concurrente la première phase obtiennent des valeurs de ticket différentes. Ces valeurs sont cependant nécessairement plus grandes que celles des tickets d'autres fils ayant atteint la deuxième phase avant que ne commence l'attribution des tickets pour les premiers.

Deuxième phase

Cette phase correspond, dans l'analogie développée plus haut, à l'attente de son tour. Le principe est d'examiner tous les autres fils d'exécution et de tester s'ils ont un numéro de ticket inférieur, auquel cas ils doivent passer dans la section critique en premier.

 ' Boucle sur tous les fils d'exécution
 POUR J = 0 À N - 1 FAIRE
   ' On attend que le fil considéré (J) ait fini de s'attribuer un ticket.
   TANT QUE CHOIX[J] == 1 FAIRE ' (1)
     RIEN
   FIN TANT QUE
   ' On attend que le fil courant (ID) devienne plus prioritaire que le fil considéré (J).
   TANT QUE COMPTEUR[J] > 0 ET ' (2)
     (COMPTEUR[J] < COMPTEUR[ID] OU ' (3)
     (COMPTEUR[J] == COMPTEUR[ID] ET J < ID)) ' (4)
   FAIRE
     RIEN
   FIN TANT QUE
 FIN POUR J

La comparaison des tickets a lieu à la ligne indiquée par (3). Comme expliqué précédemment, il est possible que deux fils d'exécution s'attribuent le même ticket. Dans ce cas, le plus prioritaire est celui qui possède l'identifiant le plus petit (voir la ligne (4)). La priorité est donc évaluée selon l'ordre lexicographique sur les couples (COMPTEUR[J], J). Seuls les fils souhaitant réellement entrer en section critique sont pris en compte (voir la ligne (2)).

Un point essentiel au bon fonctionnement de l'algorithme, et vraisemblablement l'un des plus difficiles à comprendre, est l'utilisation du tableau CHOIX, afin d'éviter de prendre en compte par erreur une ancienne valeur de ticket pour les autres fils (ligne (1)). Supposons que 2 fils J et ID, avec J < ID, exécutent la boucle de la première phase de manière concurrente et qu'ils se voient attribuer le même numéro de ticket. Pour simplifier, nous considèrerons que tous les autres fils sont hors de la section critique et ne cherchent pas à y entrer. Supposons également que, alors que le fil ID exécute la deuxième phase, le fil J n'a pas encore exécuté l'opération de mise à jour de son ticket dans la première phase (COMPTEUR [J] = MAX + 1 n'a pas été exécutée). Supposons enfin que l'on a retiré la boucle d'attente sur la valeur de CHOIX[J] (ligne (1)). Dans ce cas, le fil ID lit COMPTEUR[J] (ligne (2)), qui vaut 0, sans prendre en compte la valeur de CHOIX[J]. Cette valeur de 0 est censée signifier que le fil J est hors de la section critique et ne cherche pas à y entrer. Le fil ID en déduit qu'il est prioritaire par rapport à J et entre dans la section critique. Le fil J, poursuivant son exécution, met à jour COMPTEUR[J] et entre dans la deuxième phase. Il remarque alors qu'il a le même numéro de ticket que le fil ID et compare leurs identifiants. Comme J < ID, J est prioritaire. Il finit donc par entrer dans la section critique. Finalement, dans ce cas, les fils J et ID peuvent tous les deux entrer dans la section critique, ce que l'algorithme cherche justement à éviter.

Sortie de la section critique

À la sortie de la section critique, le fil courant (ID) exécute simplement le code ci-dessous. COMPTEUR[ID] est remis à zéro, indiquant aux autres fils que le fil ID n'est plus en section critique et ne cherche pas à y accéder.

 COMPTEUR[ID] = 0

Historique et propriétés

L'algorithme de la boulangerie a été introduit par Leslie Lamport en 1974[1], comme une solution à un problème initialement posé et résolu par Edsger Dijkstra en 1965[2] (voir Algorithme d'exclusion mutuelle de Dijkstra).

Le problème original était de fournir un algorithme réalisant l'exclusion mutuelle de N processus, utilisant uniquement des opérations atomiques simples (une seule lecture ou écriture à la fois) et vérifiant certaines propriétés :

  • Symétrie de l'algorithme (aucun processus n'est favorisé a priori).
  • Interblocage apparent impossible (pas de séquence du type: après vous, après vous).
  • Support de processus aux vitesses d'exécution différentes.
  • Un processus bloqué hors de la section critique ne doit pas empêcher d'autres processus d'y entrer.

L'algorithme de la boulangerie est en réalité une solution à un problème plus large, puisque, en plus des propriétés précédentes, il possède les suivantes :

  • Aucune famine n'est possible.
  • Les opérations de lecture et d'écriture dans les tableaux partagés n'ont pas besoin d'être atomiques.

Le premier point résulte de l'obligation pour un fil d'obtenir un nouveau ticket afin de rentrer dans la section critique une nouvelle fois. Ce nouveau ticket a nécessairement un numéro d'ordre strictement supérieur à celui de l'ancien ticket, à moins que les autres fils ne soient tous hors de la section critique et ne cherchent pas à y entrer. Un fil qui cherche à entrer dans la section critique est donc certain d'y entrer au plus tard lorsque tous les autres fils ayant exécuté la première phase de manière concurrente vis-à-vis de lui sont passés dans la section critique une seule fois.

Le second point est particulièrement remarquable et délicat à assimiler. Il résulte de plusieurs caractéristiques de l'algorithme. En premier lieu, ce dernier n'utilise pas d'écritures concurrentes aux mêmes adresses mémoire. Le fil ID, et lui seul, peut écrire dans CHOIX[ID] et COMPTEUR[ID]. En second lieu, les valeurs de CHOIX[ID] sont booléennes, ce qui implique que n'importe quel changement de valeur est visible au travers d'un seul bit, et la modification de ce dernier est nécessairement atomique. Autrement dit, les changements de CHOIX[ID] sont perçus de manière atomique. En troisième lieu, l'utilisation de CHOIX sérialise tout accès concurrent à COMPTEUR[J], à l'exception de ceux se produisant entre fils en train d'exécuter la première phase en même temps. Dans ce dernier cas, les fils peuvent obtenir des numéros de tickets différents, mais ils attendront tous mutuellement que leurs valeurs soient visibles dans la deuxième phase, et un seul fil finira par accéder à la section critique. Par ailleurs, si un fil K était déjà dans la deuxième phase avant que les premiers ne commencent l'exécution de la première phase, alors son COMPTEUR[K] a nécessairement été lu correctement pour le calcul du maximum et les nouveaux tickets sont nécessairement supérieurs à celui-ci, même si on ne peut prévoir leur ordre relatif. Une démonstration plus formelle est disponible dans l'article original de Leslie Lamport[1].

La littérature présente parfois sous le nom d'algorithme de la boulangerie de légères variantes qui, en réalité, sont plus faibles que l'original, car elles ne vérifient pas toutes les propriétés énoncées plus haut, et notamment la dernière (lecture et écriture non nécessairement atomiques)[3]. La variante consistant, par exemple, à supprimer le tableau CHOIX et à le remplacer par l'utilisation d'une nouvelle valeur spéciale dans les cases de COMPTEUR, ne fonctionne pas sans opération atomique.

Notes

  1. a b et c (en) Leslie Lamport, « A New Solution of Dijkstra's Concurrent Programming Problem », Communications of the ACM, vol. 17, no 8,‎ , p. 453-455 (lire en ligne [PDF])
  2. (en) Edsger Dijkstra, « Solution of a Problem in Concurrent Programming Control », Communications of the ACM, vol. 8, no 9,‎ , p. 569 (lire en ligne [PDF])
  3. « The Writings of Leslie Lamport », sur microsoft.com (consulté le ).

Voir aussi