Mot morphique

Mot infini engendré par un morphisme

En mathématiques et informatique théorique, un mot morphique (ou une suite morphique) est un mot infini obtenu par itération d'un morphisme (appelé le générateur), suivie de l'application d'un morphisme préservant la longueur (appelé le morphisme de codage). Les mots morphiques sont une généralisation des suites automatiques, et comprennent certains mots sturmiens comme le mot de Fibonacci, et d'autres mots comme la suite caractéristique des carrés et des mots sans carré. Une classe particulière est constituée des mots purement morphiques : ce sont les mots où le morphisme de codage est l'identité.

Les mots morphiques sont plus stables pour les transformations simples que les morphismes purement morphiques ; de plus, de nombreuses propriétés sont décidables. Les mots morphiques sont de faible complexité : le nombre de facteurs de longueur donnée croît moins qu'exponentiellement. Il en résulte que le mot de Champernowne n'est pas une suite morphique.

Définition

modifier

Morphisme prolongeable

modifier

Soit   un alphabet. Un morphisme de monoïdes   est prolongeable pour une lettre   de   si   est un préfixe propre de  , et si de plus, la suite des longueurs de itérés   tend vers l'infini lorsque   tend vers l'infini.

Si   est prolongeable en  , il existe un mot non vide   tel que  . En itérant, on obtient l'expression :

 

La suite de ces mots converge vers un mot infini noté   :

 .

Ce mot est le mot infini engendré par   en  . Le morphisme   est parfois appelé un générateur du mot infini.

Mot morphique

modifier

Un mot infini   sur un alphabet   est purement morphique s'il existe un morphisme   et une lettre   dans   tel que

 .

Un mot infini   sur un alphabet   est morphique s'il est l'image par un morphisme littéral (lettre à lettre) d'un mot purement morphique. Ce morphisme est appelé parfois morphisme de codage.

Ainsi, un mot morphique   est défini par un triplet  , où   est une lettre,   est un morphisme prolongeable en  , et   est un morphisme de codage. Le mot infini engendré par ce triplet est

 .

Exemples

modifier

Premiers exemples

modifier
  • Le morphisme de Thue-Morse   est défini par .Il est prolongeable à la fois en la lettre   et en la lettre  . Pour la lettre  , on obtient le mot infini de Thue-Morse : et pour la lettre  , on obtient le mot opposé .Ce sont donc des mots purement morphiques.
  • Le morphisme de Fibonacci est défini par .Il est prolongeable en   ; en itérant, on obtient le mot infini : .C'est un mot purement morphique.
  • Le morphisme est prolongeable en  . En itérant, on obtient le mot infini : qui, à la première lettre près, est la suite caractéristique des carrés (0, 1, 4, 9, 16, etc). En lui appliquant le morphisme littéral qui identifie   et  , on obtient exactement la suite caractéristique, qui est donc un mot morphique. On peut vérifier facilement que cette suite n'est pas purement morphique : l'image de la lettre 1 doit commencer par le mot 110 (car si l'image est seulement 11, le mot infini engendré est  ). Mais alors, dès la deuxième itération, on produit un mot contenant deux facteurs 11, ce qui contredit le fait qu'il n'y a pas deux entiers consécutifs carrés à l'exception de 0 et 1.
  • Lorsque le morphisme qui est itéré est uniforme, c'est-à-dire lorsque les images des lettres ont toutes la même longueur (par exemple, le morphisme de Thue-Morse est uniforme), la suite engendrée est une suite automatique. La suite ternaire de Thue-Morse est à la fois un mot purement morphique, car engendré par le morphisme et une suite automatique, par la construction de Thue-Morse.

Un autre exemple

modifier

Un autre exemple de mot morphique sans être purement morphique a été donné par Abram, Hu et Li[1]. Ce sont des mots qui comptent les occurrences de facteurs dans certains développements.

Soit   un entier, soit  , et soit  . La suite de comptage de blocs est le mot infini

 

qui compte le nombre d'occurrences du mot   dans le dévelopement en base   des entiers consécutifs et

 

la suite d'entiers sur   définie par

 

La suite de Thue-Morse peut être définie ainsi : c'est la suite   pour le mot  . De même, la suite de Rudin-Shapiro est la suite   pour le mot  .

Les auteurs prouvent le résultat suivant[1] :

Si l'entier   est un nombre premier, alors la suite   est uniformément morphique, c'est-à-dire engendré par un morphisme uniforme de taille m. De plus, elle est purement morphique si et seulement si   est une lettre non nulle.
De plus, la série formelle   est algébrique de degré   sur  .

Matrice du morphisme générateur

modifier
 
Matrice d'un morphisme : le coefficient en ligne   et colonne   est le nombre   d'occurrences de la lettre   dans le mot  .

À uu morphisme   est naturellement associé une  -matrice  , où   est le nombre d'occurrences de la lettre   dans le mot  . Cette matrice est appelée la matrice d'incidence du morphisme  .

Exemples

modifier

Pour la suite de Fibonacci, la matrice est :

 ,

pour la suite binaire de Thue-Morse, c'est :

 ,

pour la suite ternaire de Thue, c'est:

 ,

pour la suite de carrés, la matrice est :

 .

Pour un mot w, on a la formule :

 

et par itération :

 

et aussi :

 

Morphisme irréductible et morphisme primitif

modifier

Une matrice   à coefficients positifs ou nuls est primitive s'il existe un entier   telle que les coefficients de la matrice   sont tous non nuls. Si   est primitive, un tel entier   existe vérifiant  , où   est l'ordre de la matrice  .

Un morphisme   est primitif si sa matrice d'incidence   est primitive. Seule la matrice du dernier exemple n'est pas primitive.

Dire que   est primitif revient à dire que pour un certain entier  , tous les mots  , pour   parcourant l'alphabet  , contient chacun toutes les lettres de l'alphabet au moins une fois. Par exemple, pour le morphisme ternaire   de Thue

 

on a  .

Un matrice   d'ordre   est irréductible si le graphe dont les arcs sont les couples   tels que   est fortement connexe.

Si   est prolongeable en une lettre   de  , et si   est irréductible, alors   (et donc  ) est primitive. En effet, soient   et   deux lettre de  . Il existe, dans le graphe dont   est la matrice d'adjacence, un chemin de   vers  , et un chemin de   vers  , tous deux de longueur au plus  . En parcourant une ou plusieurs fois, si nécessaire, la boucle autour de  , on obtient un chemin de longueur   de   vers  . Ceci montre que   a toutes ses coordonnées non nulles.

Récurrence uniforme

modifier

Soit   un mot infini sur un alphabet  . Le mot   est uniformément récurrent si, pour tout entier  , il existe un entier   tel que tout facteur de longueur   de   contient tous les facteurs de longueur   de  .

Si un mot morphique admet un générateur primitif, alors il est uniformément récurrent.[réf. nécessaire]

Réciproquement, on a :

Si un mot morphique est uniformément récurrent, alors il possède un générateur primitif.[réf. nécessaire]

Propriétés

modifier

Assouplissement des hypothèses

modifier
L'image, par une morphisme, d'un mot morphique, est encore un mot morphique, s'il est infini[2].

Ceci implique en particulier que le morphisme de codage, dans la définition des mots morphiques, peut être remplacé par un morphisme quelconque, même effaçant, pourvu que l'image du mot soit encore infinie.

Renforcement des hypothèses

modifier
Tout mot morphique peut être engendré avec un morphisme générateur non effaçant[3]

Un morphisme   est non effaçant si   n'est pas le mot vide pour toute lettre  .

Complexité des mots morphiques

modifier

La fonction de complexité   d'un mot infini   est la fonction qui, pour tout entier naturel  , donne le nombre   de facteur de   de longueur  . Alors que la fonction de complexité d'un mot purement morphique peut se classer en quatre rubriques, les résultats pour les mots morphiques sont moins complets. On sait [4] :

Soit   un mot infini binaire morphique. La fonction de complexité de   vérifie l'une des propriétés suivantes
  1. il existe un entier   tel que  ,
  2.  .

Problèmes de décision

modifier
Il est décidable si un mot morphique   est ultimement périodique, c'est-à-dire s'il existe des mots   et   tels que  [5].

Ce résultat était connu depuis longtemps pour les mots purement morphiques[6].

Il est décidable si un mot morphique   est uniformément récurrent[7].

Variantes

modifier

Dans un article publié sur Arxiv[8], Allouche, Cassaigne, Shallit et Zamboni dressent des variantes dans la définition des mots morphiques, et donnent leurs propriétés respectives :

  1. Mot purement morphique
  2. Mot morphique : comme défini ici, un mot purement morphique suivi d'un codage ( )
  3. Mot purement morphique uniforme : le morphisme sousjacent est uniforme ( )
  4. Mot morphique uniforme ( )
  5. Mot purement morphique primitif ( )
  6. Mot morphique primitif: le morphisme est primitif ( )
  7. Mot purement morphique primitif uniforme ( )
  8. Mot morphique primitif uniforme ( )
  9. Mot uniformément récurrent ( )
  10. Mot récurrent.

Ces 10 propriétés, comme elles ne sont pas indépendantes, ne donnent lieu qu'à 20 cas distincts pour lesquels les auteurs fournissent des exemples[8].

Notes et références

modifier

Références

modifier
  1. a et b Abram, Hu et Li 2024.
  2. Allouche & Shallit (2003), p. 233, Théorème 7.7.4. Dans le cadre des problèmes de décision dont il est question plus bas, on a besoin d'une preuve constructive de ce fait, donnée dans Durand (2011).
  3. Allouche & Shallit (2003), p. 231, Théorème 7.7.1.
  4. Julien Cassaigne et François Nicolas, « Factor complexity », dans CANT (2010), p. 163-247.
  5. Durand (2011) et Mitrofanov (2011).
  6. Voir Durand (2011) pour un historique.
  7. Mitrofanov (2011).
  8. a et b Allouche, Cassaigne et al 2017.

Bibliographie

modifier
  • Ivan Mitrofanov, « A proof for the decidability of HD0L ultimate periodicity », arXiv,‎ (arXiv 1110.4780)
  • Ivan Mitrofanov, « On uniform recurrence of HD0L systems », arXiv,‎ (arXiv 1111.1999v2)
  • Antoine Abram, Yining Hu et Shuo Li, « Block-counting sequences are not purely morphic », Advances in Applied Mathematics, vol. 155,‎ , p. 102673 (ISSN 0196-8858, DOI 10.1016/j.aam.2024.102673, arXiv 2304.14595)