Filtrage par motif

Exemple d'arbre de décision d'un filtrage par motif.

Le filtrage par motif est la vérification de la présence de constituants d'un motif par un programme informatique, ou parfois par un matériel spécialisé. Par contraste avec la reconnaissance de forme, les motifs sont complètement spécifiés. De tels motifs concernent conventionnellement des séquences ou des arbres.

Par exemple "*HD*pdf" peut signifier : "Toute chaîne contenant HD et se terminant par pdf".

Le filtrage par motif permet de vérifier si l'objet du filtrage possède une structure donnée, s'il s'y trouve telle ou telle sous-structure spécifique et laquelle, pour y retrouver des parties par l'organisation de leur contenu, et/ou éventuellement pour substituer quelque chose d'autre aux motifs reconnus.

Les séquences (particulièrement les chaînes de caractères) sont souvent décrites par des expressions rationnelles. Elles peuvent aussi être vues comme des arbres.

Les motifs d'arbre peuvent être utilisés par les langages de programmation comme un outil général pour traiter leur structure. Certains langages de programmation fonctionnelle tels qu'Haskell, ML et le langage de mathématiques symboliques Mathematica disposent d'une syntaxe permettant d'exprimer les motifs d'arbre et une construction de langage déclenchant l'exécution conditionnelle et la récupération de valeurs fondées sur celle-ci. Pour des raisons d'efficacité et de simplicité, ces motifs d'arbre n'ont pas toutes les fonctionnalités propres aux expressions rationnelles.

Selon le langage, les expressions de reconnaissance de motif peuvent être utilisées comme argument de fonctions, dans des expressions case où de nouvelles variables sont liées, ou dans des situations très limitées comme l'affectation[1] en Python. Il est souvent possible de spécifier plusieurs motifs à essayer en séquence. La reconnaissance de motif peut bénéficier de gardes.

Les langages de réécriture de termes utilisent le filtrage par motif pour évaluer un résultat.

Le filtrage par motif est d'autant plus approprié que la structure de données sous-jacente à chercher est simple et flexible.

C'est le cas pour les langages, tels que Lisp, manipulant des symboles de préférence à des chaînes de caractères ou des nombres. Dans ceux-ci, les motifs sont du même type que le reste des données, et peuvent donc être passés en paramètres à des fonctions. En d'autre termes, ce sont des entités de première classe.

Le filtrage par motif reconnaît un motif dans une structure arborescente préexistante tandis que les expressions rationnelles reconnaissent un motif dans une structure plate. Perl 6 propose un système qui intègre les deux sémantiques dans une syntaxe concrète unifiée.

Exemple de filtrage en OCaml

Dans cet exemple écrit en OCaml, on crée une liste. Puis on définit une fonction récursive de recherche dans la liste à l'aide d'un filtrage.

# let l_test = [3 ; 4 ; 5];;
val l_test : int list = [3; 4; 5]

# let rec est_dans_liste x liste = match liste with
| [] -> false
(* fin de la liste : l'élément n'a pas été trouvé *)
| tete::queue -> (x = tete) or (est_dans_liste x queue)
(* il y a au moins un élément dans la liste : on le compare et si ce n'est pas le bon on continue le parcours récursif de liste *)
;;
val est_dans_liste : 'a -> 'a list -> bool = <fun>

# est_dans_liste 4 l_test;; (* recherche de l'entier 4 dans la liste l_test *)
- : bool = true

# est_dans_liste 4 [];; (* recherche de l'entier 4 dans une liste vide *)
- : bool = false

Voir aussi

Articles connexes

Sources

Notes et références

  1. Jusqu'à la version 3.9 de Python. En version 3.10, du pattern matching structurel, inspiré des langages fonctionnels, est ajouté au langage. Voir « What’s New In Python 3.10 — Python 3.10.0b3 documentation », sur docs.python.org (consulté le )

Liens externes