Système F
Le système F est un formalisme logique qui permet d'exprimer de façon très riche et très rigoureuse des fonctions et d'y démontrer formellement des propriétés difficiles. Plus précisément, le système F (également connu sous le nom de lambda-calcul polymorphe ou de lambda-calcul du second ordre) est une extension du lambda-calcul simplement typé introduite indépendamment par le logicien Jean-Yves Girard et par l'informaticien John C. Reynolds. Ce système se distingue du lambda-calcul simplement typé par l'existence d'une quantification universelle sur les types qui permet d'exprimer du polymorphisme.
Le système F possède deux propriétés cruciales :
- la réduction des termes est fortement normalisante (dit plus crûment : tous les calculs se terminent) ;
- il correspond par la correspondance de Curry-Howard à la logique minimale propositionnelle du second ordre. Soit : le calcul propositionnel, sans la négation mais avec les quantificateurs.
Note liminaire : La lecture de cet article suppose la lecture préalable de l'article « lambda-calcul » et son assimilation.
Introduction
modifierAinsi que l'atteste sa double origine, le système F peut être étudié dans deux contextes très différents :
- Dans le domaine de la programmation fonctionnelle, où il apparaît comme une extension très expressive du noyau du langage ML. Son expressivité est illustrée par le fait que les types de données courants (booléens, entiers, listes, etc.) sont définissables dans le système F à partir des constructions de base ;
- Dans le domaine de la logique, et plus particulièrement de la théorie de la démonstration. À travers la correspondance de Curry-Howard, le système F est en effet isomorphe à la logique minimale du second ordre. En outre, ce système capture très exactement la classe des fonctions numériques dont l'existence est prouvable en arithmétique intuitionniste du second ordre (parfois appelée analyse intuitionniste). C'est d'ailleurs cette propriété remarquable du système F qui a historiquement motivé son introduction par Jean-Yves Girard, dans la mesure où cette propriété permet de résoudre le problème de l'élimination des coupures en arithmétique du second ordre, conjecturé par Takeuti.
Historiquement le système F a joué un rôle essentiel dans les fondations de l'informatique en proposant, dès le début des années 1970, un formalisme de types riche, simple et très expressif de fonctions calculables très générales. Il ouvrait la voie aux langages de programmation typés modernes et aux assistants de preuve comme Coq.
Comme le lambda-calcul simplement typé, le système F admet deux présentations équivalentes :
- Une présentation à la Church, dans laquelle chaque terme contient toutes les annotations de type nécessaires à la reconstruction de son type (de manière univoque) ;
- Une présentation à la Curry, due à l'informaticien Daniel Leivant, dans laquelle les termes (qui sont ceux du lambda-calcul pur) sont dépourvus de toute annotation de type, et sont ainsi sujets aux problèmes d'ambiguïté typique.
Présentation à la Church
modifierLe système F admet deux sortes d'objets: les types et les termes. Les termes peuvent être « réduits » et traduisent des fonctions calculables, tandis que les types annotent les termes et permettent de les catégoriser.
La syntaxe
modifierLes types du système F (notés , , , etc.) sont formés à partir d'un ensemble de variables de types (notées , , , etc.) à l'aide des trois règles de construction suivantes :
- (Variable de type) Si est une variable de type, alors est un type ;
- (Type flèche) Si et sont des types, alors est un type ;
- (Type universel) Si est une variable de type et un type, alors est un type.
En résumé, les types du système F sont donnés par la grammaire BNF :
Comme en lambda-calcul ou en calcul des prédicats, la présence d'un symbole mutificateur nécessite de distinguer les notions de variable libre et de variable liée, et d'introduire les mécanismes usuels de renommage permettant de travailler à -conversion près. Enfin, l'algèbre de types du système F est munie d'une opération de substitution similaire à celle du lambda-calcul, et l'on note le type obtenu en remplaçant dans le type toutes les occurrences libres de la variable de type par le type .
Les termes (bruts) du système F (notés , , etc.) sont formés à partir d'un ensemble de variables de termes (notées , , , etc.) à l'aide des cinq règles de construction suivantes :
- (Variable) Si est une variable de terme, alors est un terme ;
- (Abstraction) Si est une variable de terme, un type et un terme, alors est un terme ;
- (Application) Si et sont des termes, alors est un terme ;
- (Abstraction de type) Si est une variable de type et un terme, alors est un terme ;
- (Application de type) Si est un terme et un type, alors est un terme.
En résumé, les termes (bruts) du système F sont donnés par la grammaire BNF :
Les termes du système F incorporent deux mécanismes de liaison de variable : un mécanisme de liaison de variables de termes (par la construction ) et un mécanisme de liaison de variables de types (par la construction ), qui sont tous les deux pris en compte au niveau de la relation d' -conversion. Ce double mécanisme donne naturellement lieu à deux opérations de substitution : une substitution de terme notée , et une substitution de type notée .
La β-réduction
modifierLa présence d'un double mécanisme d'abstraction et d'application (abstraction/application de terme et abstraction/application de type) donne lieu à deux règles de -réduction, dont l'union engendre par passage au contexte la relation de -réduction en une étape du système F :
- ;
- .
Comme pour le lambda-calcul pur, la -réduction du système F est confluente (sur les termes bruts) et vérifie la propriété de Church-Rosser :
- (Confluence de la -réduction) Si et , alors il existe un terme tel que et ;
- (Propriété de Church-Rosser) Pour que deux termes et soient -convertibles, il faut et il suffit qu'il existe un terme tel que et .
Le système de types
modifierOn appelle contexte de typage (notation : , , etc.) toute liste finie de déclarations de la forme (où est une variable de terme et un type) dans laquelle une variable de terme est déclarée au plus une fois.
Le système de types du système F est construit autour d'un jugement de typage de la forme (« dans le contexte , le terme a pour type »), qui est défini à partir des règles d'inférence suivantes :
- (Axiome) si ;
- ( -intro) ;
- ( -élim) ;
- ( -intro) si n'a pas d'occurrence libre dans ;
- ( -élim) .
Les deux propriétés principales de ce système de types sont la propriété de préservation du type par -réduction et la propriété de normalisation forte :
- (Préservation du type par réduction) Si et si , alors ;
- (Normalisation forte) Si , alors est fortement normalisable.
La première de ces deux propriétés est une propriété purement combinatoire qui se démontre par une induction directe sur la dérivation de typage. En revanche, la propriété de normalisation forte du système F est une propriété dont la démonstration repose fondamentalement sur des méthodes non combinatoires, basées sur la notion de candidat de réductibilité.
Indécidabilité
modifierLe système de type présenté dans la section précédente est explicite, ce qui veut dire de les informations sur le type des termes sont données à chaque étape. On dit aussi que c'est un système « à la Church ». Dans un tel système, vérifier qu'un terme est bien typé est très simple.
En 1994, Joe B. Wells a résolu une conjecture ancienne, qui répond à un problème plus général, à savoir que la vérification de type pour un variant « à la Curry » du système F (un système de type où les informations de type ne sont pas données) est indécidable[1]. Le résultat de Wells signifie que la reconstruction du type pour le système F n'est pas possible. Autrement dit, en système F, on ne peut pas avoir un mécanisme logiciel qui, comme en OCaml ou en Haskell, assigne un type à une fonction que le programmeur a entrée. Cependant dans ces langages, pour aller vers des systèmes de type qui englobent le système F, le programmeur doit fournir, ici ou là, des informations de type pour aider le logiciel à reconstruire le type du terme entier. Dans des langages comme Gallina (de Coq) ou Agda (en) qui contiennent une large extension du système F, la contribution du programmeur au typage est déterminante.
Représentation des types de données
modifierPour pouvoir utiliser le lambda-calcul simplement typé comme un langage de programmation, il est nécessaire de lui adjoindre des types de base (booléens, entiers, etc.) et des règles de réduction supplémentaires qui étendent le pouvoir expressif du formalisme. Un exemple d'une telle extension est le système T de Gödel, qui est obtenu en ajoutant au lambda-calcul simplement typé des entiers naturels primitifs et un mécanisme de récursion similaire à la récursion primitive (mais plus expressif).
Dans le système F, une telle extension n'est pas nécessaire car l'expressivité du formalisme permet de définir les types de base et les constructeurs de types usuels sans qu'il soit nécessaire de modifier ni le système de types ni les règles de réduction.
Booléens et types finis
modifierLe type des booléens est défini dans le système F par
et les constantes et par :
- ;
- .
On peut démontrer que les deux termes ci-dessus sont les deux seuls termes clos en forme normale de type . Ainsi, le type de données capture effectivement la notion de booléen.
La construction 'if … then … else …' est définie par
où désigne le type d'élimination de la construction 'if ...', c'est-à-dire le type commun aux deux branches de la conditionnelle. Cette définition est correcte du point de vue du typage comme du point de vue calculatoire dans la mesure où :
- Dans tout contexte où le terme a le type et où les termes et ont le type , la construction est bien typée et a pour type le type ;
- Si le terme se réduit sur , alors la construction se réduit sur ;
- Si le terme se réduit sur , alors la construction se réduit sur .
Plus généralement, on peut définir un type fini à valeurs en posant :
- ;
- (pour tout ).
Là encore, on peut démontrer que les termes sont les seuls termes clos en forme normale de type . L'opération de filtrage correspondant est définie par :
(où désigne le type des branches de filtrage).
En particulier :
- (type des booléens) ;
- (type singleton) ;
- (type vide).
Le type n'est habité par aucun terme clos en forme normale, et, d'après le théorème de normalisation forte, il n'est habité par aucun terme clos.
Produit cartésien et somme directe
modifierSoit et deux types. Le produit cartésien est défini dans le système F par
et la construction de couple par
- (si et )
Comme pour les types énumérés, on peut démontrer que les seuls termes clos en forme normale de type sont de la forme , où et sont des termes clos en forme normale de type et , respectivement. Les fonctions de projection correspondantes sont données par
Ces fonctions vérifient naturellement les égalités et .
La somme directe est définie par
Les habitants des types et sont plongés dans le type à l'aide des constructions
- (si )
- (si )
tandis que le filtrage des éléments de type est assuré par la construction
qui satisfait les égalités définitionnelles attendues.
Contrairement au produit cartésien, l'encodage de la somme directe dans le système F ne capture pas toujours la notion d'union disjointe, dans la mesure où il est possible, dans certains cas, de construire des termes clos en forme normale de type qui ne sont ni de la forme (avec ) ni de la forme (avec )[réf. nécessaire].
Les entiers de Church
modifierLe type des entiers de Church est défini dans le système F par
Chaque entier naturel est représenté par le terme
Comme pour les booléens, le type capture la notion d'entier naturel puisque tout terme clos de type en forme normale est de la forme pour un certain entier naturel .
Présentation à la Curry
modifierLa fonction d'effacement
modifierLe système de types
modifier- (Axiome) si
- ( -intro)
- ( -élim)
- ( -intro) si n'a pas d'occurrence libre dans
- ( -élim) .
Équivalence entre les deux systèmes
modifierLe théorème de normalisation forte
modifierLes termes typables du système F sont fortement normalisables, autrement dit la réduction des termes est une opération qui se termine toujours en produisant une forme normale.
Candidats de réductibilité
modifierLa méthode des candidats de réductibilité a été développée par Jean-Yves Girard en généralisant la preuve de William W. Tait (en)[3] pour prouver la forte normalisation du système T pour montrer la forte normalisation du système F, plus particulièrement, sa terminaison. En effet, une simple récurrence sur la taille du type ou du terme n'est pas suffisante, pour deux raisons. Premièrement, si et sont fortement normalisables, ce n'est pas nécessairement le cas de . Ce problème était déjà résolu par la méthode de Tait. Deuxièmement, pour montrer que est fortement normalisable, il faut montrer que pour tout type , est fortement normalisable, or n'est pas nécessairement un type plus petit que , ce qu'on peut constater en choisissant , , on a alors . C'est ce problème en particulier que Girard a résolu.
Un candidat de réductibilité de type est un ensemble de termes de type qui vérifie un certain nombre de propriétés :
- tous les termes d'un candidat sont fortement normalisables,
- un candidat est stable par réduction,
- si est un terme neutre et que tous les réduits de sont dans , alors . Un terme neutre est une variable, appliquée à une liste potentiellement vide de types et de termes en forme normale.
En particulier, l'ensemble des termes fortement normalisables de type est un candidat de réductibilité de type .
Soit un type dont les variables libres sont incluses dans et des candidats de réductibilité de type respectivement. On définit par induction sur l'ensemble , qui est un candidat de réductibilité de type :
- Si est la variable , .
- Si , .
- Si , , où désigne l'ensemble des candidats de réductibilité de type .
Ensuite, on montre, par induction sur la dérivation, que si , . On peut en déduire que si est typable alors est fortement normalisable.
Les candidats de réductibilité connaissent plusieurs variantes[4], par exemple les candidats peuvent être non-typés, et cette technique a été largement déclinée pour divers systèmes de types, présentant des caractéristiques variées : intersections de types[5], types récursifs[6], types modaux[7], types dépendants[8].
Correspondance avec la logique du second ordre
modifierÀ travers la correspondance de Curry-Howard, le système F correspond très exactement à la logique minimale du second ordre, dont les formules sont construites à partir des variables propositionnelles à l'aide de l'implication et de la quantification propositionnelle :
Rappelons que dans ce cadre, les unités (vérité) et (absurdité), les connecteurs (négation), (conjonction) et (disjonction) et la quantification existentielle sont définissables par
(On notera qu'à travers la correspondance de Curry-Howard, l'absurdité correspond au type vide, la vérité au type singleton, la conjonction au produit cartésien et la disjonction à la somme directe.)
On démontre que dans ce formalisme, une formule est prouvable sans hypothèses si et seulement si le type correspondant dans le système F est habité par un terme clos.
Correspondance avec l'arithmétique du second ordre
modifierBibliographie
modifier- Lambda-calcul, types et modèles, Jean-Louis Krivine, chapitre VIII, Masson, 1990, (ISBN 2-225-82091-0)
- Proofs and Types, Jean-Yves Girard, Paul Taylor, Yves Lafont, chapitre 11, Cambridge University Press, 1989, (ISBN 0-521-37181-3)
Notes et références
modifier- J. B. Wells, « Typability and Type-Checking in the Second-Order lambda-Calculus are Equivalent and Undecidable », Proceedings of the Ninth Annual Symposium on Logic in Computer Science, Paris, France, , p. 176-185.
- (en) Jean-Yves Girard, Paul Taylor et Yves Lafont, chap. 14 « Strong Normalisation for F », dans Proofs and Types, Cambridge University Press, (ISBN 0-521-37181-3, lire en ligne)
- (en) W. W. Tait, « Intensional interpretations of functionals of finite type I », The Journal of Symbolic Logic, vol. 32, no 2, , p. 198–212 (ISSN 0022-4812 et 1943-5886, DOI 10.2307/2271658)
- (en) Jean H. Gallier, « On Girard’s “Candidats de réductibilité” », dans Piergiorgio Odifreddi, Logic and Computer Science, Academic Press, coll. « APIC studies in data processing » (no 31), , 430 p. (ISBN 978-0-12-524220-2, lire en ligne)
- (en) M. Dezani-Ciancaglini, F. Honsell et Y. Motohama, « Compositional Characterizations of λ-Terms Using Intersection Types », Mathematical Foundations of Computer Science 2000, Springer, , p. 304–313 (ISBN 978-3-540-44612-5, DOI 10.1007/3-540-44612-5_26)
- Nax Paul Mendler, « Inductive types and type constraints in the second-order lambda calculus », Annals of Pure and Applied Logic, vol. 51, nos 1-2, , p. 159–172 (ISSN 0168-0072, DOI 10.1016/0168-0072(91)90069-x)
- (en) G. A. Kavvos, « Dual-context calculi for modal logic », 2017 32nd Annual ACM/IEEE Symposium on Logic in Computer Science (LICS), IEEE, , p. 1–12 (ISBN 978-1-5090-3018-7, DOI 10.1109/LICS.2017.8005089, arXiv https://arxiv.org/abs/1602.04860)
- (en) Arthur Adjedj, Meven Lennon-Bertrand, Kenji Maillard, Pierre-Marie Pédrot et Loïc Pujet, « Martin-Löf à la Coq », Proceedings of the 13th ACM SIGPLAN International Conference on Certified Programs and Proofs, New York, NY, USA, Association for Computing Machinery, , p. 230–245 (DOI 10.1145/3636501.3636951, arXiv 2310.06376)