Exclusion mutuelle

La suppression simultanée de deux nœuds, i et i + 1, a pour conséquence que le nœud i + 1 n'est pas supprimé.

Un Mutex (anglais : Mutual exclusion, Exclusion mutuelle) est une primitive de synchronisation utilisée en programmation informatique pour éviter que des ressources partagées d'un système ne soient utilisées en même temps. Son implémentation varie selon les systèmes (masquage des interruptions, lecture/écriture en un cycle, etc.)

Ces algorithmes permettent par exemple de réguler l'accès parallèle par plusieurs fils d'exécution (threads) à une même donnée.

Définition

Un Mutex est une primitive de synchronisation utilisée en programmation informatique pour éviter que des ressources partagées d'un système ne soient utilisées en même temps.

Certains algorithmes utilisent un état pour commander l'exécution : les mutex doivent savoir si les programmes concernés sont occupés (busy) ou s'ils ont terminé et sont en attente (wait). De tels algorithmes sont par exemple :

La plupart des mutex ont des effets secondaires, par exemple les sémaphores (mutex avec un compteur) peuvent bloquer l'exécution créant des goulots d'étranglement. Un autre effet est le blocage total des ressources, si le programme qui les utilisait n'a pas informé le système qu'il n'en avait plus besoin.

Interblocage

L'interblocage (de l'anglais deadlock) se produit, par exemple, lorsqu'un thread T1 ayant déjà acquis la ressource R1 demande l'accès à une ressource R2, pendant que le thread T2, ayant déjà acquis la ressource R2, demande l'accès à la ressource R1. Chacun des deux threads attend alors la libération de la ressource possédée par l'autre. La situation est donc bloquée.

Plusieurs méthodes existent pour les éviter :

  • imposition de l'ordre d'acquisition des ressources ;
  • élimination lors de la conception par une analyse détaillée des algorithmes ;
  • système préventif qui détecte un risque d'interblocage avant que celui-ci ne se produise durant l'exécution ;
  • système de récupération si un interblocage se produit, le système doit pouvoir repartir dans un état valide.

Un interblocage peut également se produire si un seul thread demande l'accès à une ressource qu'il a déjà acquise, certaines implémentations comme le mutex « rapide » de Linux vont bloquer le thread. L'implémentation peut gérer cette situation grâce à un mutex réentrant ou en détectant cette situation et en indiquant une erreur.

Le deadlock ne se limite pas qu'aux primitives de synchronisation comme les mutex, il peut également survenir lors d'inversions de priorité dans le cadre de l'ordonnancement des tâches.

Un problème concret : Mars Pathfinder

En 1997, la mission Mars Pathfinder rencontre un problème alors que le robot est déjà sur Mars. Après un certain temps, des données sont systématiquement perdues. Les ingénieurs découvrent alors un bug lié à la synchronisation de plusieurs tâches. Les éléments incriminés étaient les suivants :

  • une mémoire partagée, qui était protégée par un mutex
  • une gestion de bus sur la mémoire partagée, qui avait une priorité haute
  • une écriture en mémoire partagée (récupération de données), qui avait la priorité la plus basse
  • une troisième routine de communication, avec une priorité moyenne, qui ne touchait pas à la mémoire partagée

Il arrivait parfois que l'écriture (priorité faible) s'approprie le mutex. La gestion du bus (priorité haute) attendait ce mutex. La commutation de tâches laissait alors la routine de communication (priorité moyenne) s'exécuter. Or pendant ce temps, le mutex restait bloqué puisque les ressources étaient allouées à la routine de priorité basse. La gestion de bus ne pouvait donc plus s'exécuter et après un certain temps d'attente (une protection insérée par les ingénieurs via un chien de garde), le système effectuait un redémarrage. Un tel problème est connu sous le nom d'inversion de priorité.

Le problème n'était pas critique et le code fut corrigé à distance. Toutefois dans d'autres situations, les conséquences auraient pu être catastrophiques. On a ensuite constaté le fait que le problème était déjà survenu lors des essais sans avoir été corrigé.

Voir aussi

Articles connexes

Références

Liens externes