Le lambda-calcul pose comme primitive la notion de fonction. Si est une expression, représente la fonction définie par l'équation , et si et sont deux expressions, désigne l'application de à [2]. Enfin, le lambda-calcul possède une notion dite de réduction qui correspond à effectuer une étape de calcul[3].
Par analogie, pourrait désigner la fonction qui renvoie le carré de son argument, et est la suite des étapes de calcul pour calculer cette fonction en [2]. On peut définir et utiliser des types de données dans le lambda-calcul, notamment les entier naturels, les paires ou les listes[4]. Néanmoins, tous les calculs ne terminent pas : présente la propriété que , donc que le calcul de ne termine pas[5], et de plus, si est un terme, il existe un terme tel que [6]. Pour reprendre l'analogie précédente, pour , un tel vérifierait , ce qui est impossible pour un entier naturel. L'introduction d'une discipline de types permet de résoudre ces deux problèmes, au prix d'une expressivité moindre[5].
Syntaxe
Il y a deux sortes d'objets dans le lambda-calcul simplement typé : les types, qui correspondent à des types de donnée en informatique et à des propositions en logique, et les termes qui correspondent à des programmes ou à des démonstrations. On notera ce système.
Types
On suppose donné un ensemble de variables de types, qu'on note par des lettres grecques Les types du lambda-calcul simplement typé sont désignés par les lettres et sont formés par[7],[8] :
les variables de types ;
si et sont des types, est le type des fonctions de vers .
Termes
Les variables seront notées par des lettres minuscules tandis que les termes seront notés Les termes sont formés ainsi[7],[8] :
Les variables sont des termes ;
Si est un type et un terme, est un terme qui représente la fonction qui à de type associe l'expression . On peut voir ça comme l'abstraction de dans l'expression ;
Si et sont des termes, est un terme qui correspond à l'application de la fonction à l'expression .
De plus, on considèrera que l'application est associative à gauche, c'est-à-dire qu'on notera pour .
Règles de typage
On introduit la notation [7], où est une liste de paires de la forme où est une variable et un type, est un terme et un type. Elle se lit « dans le contexte , le terme a pour type ». Par exemple, se lit « si est une variable de type , la fonction qui à de type associe la valeur est une fonction qui envoie les éléments de dans ».
Une règle de la forme doit se comprendre comme « si , ..., alors ». En particulier, signifie que est toujours vrai.
La présentation ici donnée correspond au typage à la Church[9], ou typage explicite, c'est-à-dire qu'un terme donné a au plus un seul type. Il existe une autre façon de présenter le lambda-calcul simplement typé, c'est le typage à la Curry[9], ou typage implicite. Les règles de typage restent les mêmes, mais les termes sont ceux du lambda-calcul pur : notamment, l'abstraction se note . Par exemple, avec un typage à la Church, a pour type , tandis qu'avec un typage à la Curry, a tous les types de la forme . L'opération qui consiste à trouver le type le plus général qui convient pour un lambda-terme donné, si un tel type existe, s'appelle l'inférence de types[10].
Réduction
Tout comme le lambda-calcul non typé, le lambda-calcul simplement typé identifie les termes -équivalents et définit la substitution de façon similaire. De même, on peut définir pour le lambda-calcul simplement typé une notion de réduction[11], qui correspond à une opération de réécriture représentant une étape de calcul :
Une des règles est étiquetée , elle correspond à une règle de calcul. La réduction associée est nommée -réduction. L'autre est étiquetée , elle correspond à une simplifications : si , et se « comportent » pareil. On nomme cette réduction -réduction. On note si ou : c'est la -réduction.
Enfin, si est une réduction, est sa clôture réflexive et transitive et sa clôture réflexive, symétrique et transitive, c'est-à-dire que s'il existe tels que et s'il existe tels que , et pour tout entre et , ou .
Préservation du typage
La -réduction possède la propriété de préservation du typage[11] (en anglais : subject reduction) : si et alors .
Normalisation forte
Un terme est dit en forme normale s'il ne peut pas se réduire d'avantage[3]. La -réduction possède la propriété de normalisation forte[12], c'est-à-dire que tous les termes sont fortement normalisables : il n'y a pas de suite infinie de réductions Ainsi tout terme peut, en un nombre fini (potentiellement nul) d'étapes, être réduit en une forme normale. On dit aussi que la réduction est fortement normalisante. Si et que est en forme normale pour , on dit que est une -forme normale de . Comme l’énonce le paragraphe suivant, cette forme est unique pour la -réduction et la -réduction.
Confluence
Une réduction est dite confluente si pour tous termes , et tels que et , il existe un terme tel que et . La -réduction et la -réduction sont confluentes[13].
La confluence assure l'unicité de la forme normale pour la réduction : en effet, supposons et avec et en forme normale. Si alors puisque ne peut pas se réduire. De même, si alors . Donc .
Cela signifie qu'en partant d'un terme donné, l'ordre des -réductions n'importe pas : quel que soit l'ordre de réduction choisi, en un nombre fini d'étapes, on atteindra une forme normale qui ne dépend pas de l'ordre des réductions. En revanche, l'ordre de réduction peut avoir une influence sur le nombre de réductions. Par exemple, si , alors atteint une forme normale en une étape en réduisant d'abord le premier rédex, tandis que atteint la même forme normale en deux étapes, en réduisant d'abord le deuxième rédex.
De plus, on peut choisir de faire les -réductions après les -réductions ou bien faire les -réductions après les -réductions : si , alors le -rédex réduit dans la deuxième réduction était déjà présent dans , et si est en -forme normale, il existe un terme (non nécessairement unique) en -forme normale tel que [13].
Types produits
On peut étendre la présentation précédente du lambda-calcul avec un typé unité et des produits de types[7], on le note alors . On ajoute alors aux types un type unité, qui possède un unique élément, et et sont des types, on ajoute le type qui représente le produit des types et , dont les éléments sont des paires composées d'un élément de et d'un de .
De plus, on étend la syntaxe des termes :
L'unique terme du type unité, se note ;
Si et sont des termes, le terme , représente la paire dont la première composante est et la deuxième ;
Si est un terme et , la -ème projection de la paire se note .
On peut également ajouter des règles de calcul sur les produits[11], à savoir :
;
.
Il est aussi possible d'ajouter des règles à ce lambda-calcul[11] :
;
si est de type .
Mais celles-ci ne se comportent pas aussi bien que dans le cas sans type unité. En effet, si la -réduction reste confluente[13], la -réduction ne l'est plus, comme le montre l'exemple suivant[13], où :
;
;
mais et sont tous deux en forme normale, donc ils ne peuvent pas se réduire vers un terme commun.
En revanche toutes ces réductions continuent à préserver le typage[11] et à être fortement normalisantes[12].
Types sommes
On peut également introduire dans le lambda-calcul simplement typé des types représentant respectivement la proposition toujours fausse ou le type vide, ainsi que la disjonction de deux propositions ou la somme de deux types[14],[15]. Pour cela, on ajoute à la syntaxe le type , et si et sont deux types, aussi. Le type peut être vu comme des couples avec dans ou dans et une étiquette indiquant la provenance de : ou . Ce système se note .
De plus, on ajoute à la syntaxe les termes suivants :
Si est un type et un terme, est un terme, qui sera de type . En effet, si possède un élément, tous les autres types aussi.
Si et sont des types, et un terme, et sont des termes correspondant aux injections respectives de et dans .
Si et sont des types, , et des termes, alors est un terme qui correspond à un filtrage par motif.
Ces nouveaux termes se typent comme suit :
On peut également ajouter des règles de réduction[15], mais il faut ajouter un nouveau type de règles : les conversions commutatives, notées . Elles permettent d'identifier deux termes qui devraient désigner la même preuve, mais sont différents.
Les deux règles correspondent au calcul du filtrage : si provient de , on renvoie où est remplacé par , et on fait de même avec et si provient de :
;
.
Les cinq règles suivantes correspondent aux conversions commutatives pour :
;
;
;
;
Si et sont de type , .
Ces cinq règles correspondent aux conversions commutatives pour la somme :
;
;
;
;
.
Enfin, on peut aussi définir des règles : la première règle correspond à , la deuxième à la somme.
;
.
Les réductions et préservent le typage et sont fortement normalisantes. De plus, est confluente.
Les règles de typage du lambda-calcul simplement typé correspondent, une pour une, aux règles[16],[17] d'introductions et d'éliminations de la déduction naturelle pour la logique intuitionniste[18]. Cela permet d'établir une correspondance formelle entre preuves et programmes. Par exemple, les règles de l'implication en déduction naturelle sont :
où signifie que l'on « charge » l'hypothèse , c'est-à-dire qu'on a le droit de l'utiliser comme hypothèse uniquement au-dessus de la barre.
C'est encore plus flagrant si l'on considère la présentation de la déduction naturelle avec des séquents, qui correspond exactement aux règles du lambda-calcul dans lesquelles on a enlevé les termes et les variables pour ne garder que les types.
En déduction naturelle, il existe une notion de simplification des preuves, appelée élimination des coupures[19],[20],[21]. Une coupure correspond à une règle d'introduction immédiatement suivie de la règle d'élimination correspondante. La procédure d'élimination des coupures correspond exactement à la relation [22], permettant de faire le lien entre un calcul et une simplification de preuves. Ainsi, les résultats précédents — comme la confluence, la préservation du typage et la normalisation forte — sont aussi valides pour la déduction naturelle[22],[23].
Par exemple, si est de type et de type , la règle du lambda-calcul simplement typé correspond exactement, dans la déduction naturelle, à la règle :
Sémantique
On peut définir différentes sémantiques pour le lambda-calcul simplement typé, qui permettent à la fois d'étudier le lambda-calcul en tant que tel, ou d'étudier d'autres objets en utilisant le lambda-calcul simplement typé.
Catégorie cartésienne fermée
On peut interpréter un jugement de typage du lambda-calcul simplement typé avec les produits dans une catégorie cartésienne fermée[24]. Une catégorie cartésienne fermée est une catégorie qui possède un objet terminal, des produits et des objets exponentiels, qui représentent l'ensemble des morphismes d'un objet vers un autre. Cette correspondance entre lambda-calcul typé, déduction naturelle et catégorie cartésienne fermée est parfois connue sous le nom de correspondance de Curry-Howard-Lambek.
Plus généralement, Joachim Lambek et Dana Scott ont mis en évidence[25],[26] l'équivalence entre lambda-théories typées, c'est-à-dire les extensions de avec éventuellement des constantes et des règles supplémentaires étendant , et catégories cartésiennes fermées.
Si assigne à chaque variable de type un objet d'une catégorie , on peut définir une sémantique [24] qui associe à un séquent un morphisme : l'interprétation des types envoie le type unité sur l'objet terminal , le produit de deux types sur le produit catégorique des interprétations de chaque type et le type est envoyé sur , où désigne l'objet représentant les morphismes de vers dans la catégorie . On peut étendre cette définition à un contexte : si , . Pour les termes,
Si est une variable et , est la projection de sur la composante représentée par ;
est envoyé sur l'unique morphisme de vers ;
est envoyé sur , qui désigne l'unique morphisme de vers induit par et ;
est envoyé sur , qui désigne la -ème projection du morphisme ;
doit-être envoyé sur un morphisme . Or est un morphisme et dans une catégorie cartésienne fermée, pour tout morphisme , il existe un unique morphisme représentant sa version curryfiée. On définit donc .
Pour déterminer , on remarque que est un morphisme , et est un morphisme . Or dans une catégorie cartésienne fermée, pour toute paire d'objets et il existe un morphisme d'évaluation , qui est la counité de l'adjonction entre les foncteurs et . On définit donc .
Cette sémantique est correcte[24] vis-à-vis de , c'est-à-dire que si alors. De plus, elle est également complète[24], c'est-à-dire que si pour toute interprétation alors .
Dans cette sémantique, la substitution correspond à la composition[27] : si et ,
Ensembles
Les ensembles et les fonctions entre eux forment une catégorie cartésienne fermée, où l'objet terminal est le singleton (il y n'en a qu'un seul à unique isomorphisme près), le produit est le produit cartésien de et et l'objet exponentiel est l'ensemble des fonctions de dans . Harvey Friedman a montré que si n'a pour valeurs que des ensembles infinis, la sémantique induite par est complète[28],[29].
Domaines
La théorie des domaines fournit un certain nombre de catégories cartésiennes fermées, comme celles des dcpo et -cpo, ainsi que leurs versions pointées[30]. Cette théorie a notamment permis à Dana Scott de construire un modèle non-trivial [31],[32] vérifiant , modèle qui peut servir à interpréter le lambda-calcul non typé[33].
Espace cohérents
Les espaces cohérents(en) forment également une catégorie cartésienne fermée. Ils ont été introduit par Jean-Yves Girard[34],[35] et c'est la découverte que le type des fonctions usuelles pouvait s'écrire , où désigne l'implication linéaire et une opération de copie, qui lui a inspiré la logique linéaire.
Une première méthode est celle de Timothy G. Griffith[37], qui consiste à ajouter une version typée de l'opérateur de Matthias Felleisen[38] : si est de type , où est défini comme , est de type . Cet opérateur peut aussi être munie de règles de réduction[39] : et si n'est pas libre dans . La variable désigne ici une continuation, et est un opérateur proche de l'opérateur call-with-current-continuation du langage Scheme. Cet opérateur peut être traduit dans le lambda-calcul non typé avec une traduction CPS.
La méthode précédente se base sur la déduction naturelle intuitionniste. Michel Parigot a proposé une variante du lambda-calcul basé sur la déduction naturelle classique, dans laquelle il peut y avoir plusieurs formules à droite de : le lambda-mu calcul(en)[40]. Dans son calcul, il y a deux types de termes, les termes nommés qui correspondent aux formules à droite du et les termes innomés, qui correspondent aux termes à gauche du . Un terme innomé peut être nommé par la construction . Les termes innomés sont les termes du lambda-calcul usuel et ceux de la forme , qui permette d'abstraire un terme nommé .
Le lemme de Joyal[41] montre qu'il n'y a pas de correspondance de Curry-Howard-Lambek pour la logique classique : il énonce que si est une catégorie cartésienne fermée munie d'un objet dualisant, c'est-à-dire un objet tel que pour tout , le morphisme est un isomorphisme, alors est un préordre. Cela signifie que toutes les preuves d'une même proposition sont égales, et donc que la réduction n'a pas d'intérêt.
Entiers naturels
Il est possible, comme dans le lambda-calcul non typé, de définir les entiers comme les entiers de Church, c'est-à-dire comme le type pour un type de base. Un entier est alors représenté par qui compose la fonction en argument fois avec elle-même. Mais cette représentation est limitée : en effet, seuls les polynômes généralisés, c'est-à-dire les fonctions obtenues par composition de polynôme et de la fonction , sont définissables avec cette présentation des entiers[42].
Pour pallier ce problème, on peut utiliser le système T de Gödel[43]. C'est une extension du lambda calcul simplement typé avec les produits qui possède des booléens et des entiers naturels : il y a deux constantes booléennes et et une structure conditionnelle : si est un booléen et et sont de type , est de type . On a de plus les règles et . De plus, il y a une constante de type entier, et si est un entier, aussi, qui représente son successeur. Enfin, pour chaque type , il y a un une construction qui permet de produire une valeur par récurrence sur un entier : si est un entier, un terme de type , de type , est de type vérifiant pour tout , et , et [44]. Système T a notamment permis de donner une preuve de l'arithmétique de Heyting, de laquelle on peut déduire l'arithmétique de Peano[43]. Notamment, les fonctions entre les entiers définissables dans le système T correspondent exactement aux fonctions prouvablement totales dans l'arithmétique de Peano[45], ou, ce qui revient au même, dans l'arithmétique de Heyting[46].
Combinateurs de points fixes
Le -calcul est une extension du lambda-calcul simplement typé avec produits avec des combinateurs de points fixes, introduit par Dana Scott[47] et étudiée par Gordon Plotkin[48]. On ajoute pour chaque type une constante de type et une constante de type , et la règle de réduction [49]. Le -calcul s'interprète notamment dans la catégorie cartésienne fermée des dcpo pointés et des fonctions continues entre eux. Dans cette catégorie, chaque objet a un plus petit élément (qui sert à interpréter ) et chaque fonction continue d'un dcpo dans lui-même a un plus petit point fixe : a alors pour sémantique la fonction qui a associe son plus petit point fixe.
PCF[48],[50] est une variante du -calcul avec les types de fonctions et deux types de bases, les booléens et les entiers naturels, vu comme des domaines plats. Cela signifie que si représente les entiers naturels usuels, les entiers de PCF sont , avec le plus petit élément de , les autres éléments étant incomparables entre eux. Une valeur représente une valeur indéfinie. En plus des constantes et pour chaque type, PCF possède également une constante pour chaque entier et pour chaque booléen, une structure conditionnelle, une fonction pour tester si un entier vaut zéro, ainsi que les fonctions successeur et prédécesseur. C'est un exemple minimal de langage de programmation fonctionnel, et il est Turing-complet[48].
Polymorphisme
Il est possible d'étendre le lambda-calcul simplement typé pour qu'il supporte des abstractions et des instanciations de type, c'est-à-dire ajouter du polymorphisme[51]. Le système formel obtenu se nomme le système F[52]. Très expressif, ce système permet de définir les produits, les sommes et le quantificateur existentiel, ainsi que les types inductifs comme les entiers ou les listes. Les fonctions définissables sur les entiers dans le système F sont exactement les fonctions prouvablement totales dans l'arithmétique du second ordre[53], ou de façon équivalente, dans l'arithmétique de Heyting du second ordre.
Types dépendants, types d'ordre supérieurs
On peut également étendre le système de types pour obtenir des types dépendants[54], c'est-à-dire des types qui dépendent de valeur, et des types d'ordre supérieur[55], c'est-à-dire des types qui dépendent d'autre types, formant ainsi le lambda-cube[56],[57]. De plus, on peut également considérer diverses théories des types possédant à la fois du polymorphisme, des types d'ordre supérieur et des types dépendants, comme par exemple la théorie des types de Martin-Löf MLTT[58], le calcul des constructions CoC[59],[60], ou enfin la théorie homotopique des types HoTT[61].
↑Timothy G. Griffin, « A formulae-as-type notion of control », Proceedings of the 17th ACM SIGPLAN-SIGACT symposium on Principles of programming languages, Association for Computing Machinery, pOPL '90, , p. 47–58 (ISBN978-0-89791-343-0, DOI10.1145/96709.96714, lire en ligne, consulté le )
↑(en) Matthias Felleisen, Daniel P. Friedman, Eugene Kohlbecker et Bruce Duba, « A syntactic theory of sequential control », Theoretical Computer Science, vol. 52, no 3, , p. 205-237 (DOIhttps://doi.org/10.1016/0304-3975(87)90109-5)
↑(en) Michel Parigot, « λμ-Calculus: An algorithmic interpretation of classical natural deduction », Logic Programming and Automated Reasoning, Springer, , p. 190–201 (ISBN978-3-540-47279-7, DOI10.1007/BFb0013061, lire en ligne, consulté le )
↑(de) Helmut Schwichtenberg, « Definierbare Funktionen im λ-Kalkül mit Typen », Archiv für mathematische Logik und Grundlagenforschung, vol. 17, no 3, , p. 113–114 (ISSN1432-0665, DOI10.1007/BF02276799)
↑(en) Dana S. Scott, « A type-theoretical alternative to ISWIM, CUCH, OWHY
Author links open overlay », Theoretical Computer Science, vol. 121, nos 1–2, , p. 411-440 (DOI10.1016/0304-3975(93)90095-B)
(en) Roberto M. Amadio et Pierre-Louis Curien, Domains and Lambda-Calculi, Cambridge University Press, coll. « Cambridge Tracts in Theoretical Computer Science », , 534 p. (ISBN978-0-521-62277-6, lire en ligne)..