La complexité en états (en anglais « state complexity ») est un thème en informatique théorique qui traite de la taille d'automates abstraits, tels que les diverses variantes des automates finis reconnaissant un langage rationnel donné. Un exemple typique dans ce domaine est le résultat selon lequel un automate fini non déterministe à états peut être simulé par un automate fini déterministe à au plus états, et que cette borne peut être atteinte.
La complexité en états d'un langage régulier est la taille, mesurée en nombre d'états, du plus petit automate fini, soit déterministe, soit non déterministe qui reconnaît ce langage. La complexité opérationnelle (en anglais « operational state complexity ») est la description de la complexité en états des diverses opérations sur les langages qui préservent leur régularité.
On distingue entre plusieurs problèmes dans cette thématique : la transformation d'un modèle d'automate en un autre, et la complexité des opérations sur les langages et leurs automates. Parfois, des résultats existent sur des sous-familles de langages réguliers. Enfin, il apparaît que dans le cas des langages sur un alphabet de taille donnée, et notamment sur un alphabet à une seule lettre (alphabet unaire), des résultats plus précis peuvent être formulés. Plusieurs exposés de synthèse ont été rédigés sur ces problèmes, par Holzer et Kutrib[1],[2] et par Gao et al.[3].
La détermination de la complexité d'un opération ou d'une transformation demande deux informations : d'abord un procédé général dont on sait majorer le coût, en nombre d'états, dans tous les cas ; ensuite un jeu d'exemples qui montrent que la majoration est en fait une borne supérieure, c'est-à-dire effectivement atteinte. L'exemple le plus connu est la déterminisation d'un automate fini non déterministe à n états : l'algorithme de la construction par sous-ensembles fournit un automate qui a toujours au plus états ; la deuxième étape demande de fournir des exemples où cette borne est effectivement atteinte.
Transformation entre variantes d'automates finis
Un automate fini peut être
déterministe ou
non déterministe,
unidirectionnel (noté AFD, AFN)
ou bidirectionnel
(noté alors 2AFD, 2AFN). D'autres types sont les automates
inambigus (notés UFA),
automates auto-vérifiant(en) (SVFA)
et les automates alternants (AFA).
Ces automates peuvent également être bidirectionnels (les classes sont ntées 2UFA, 2SVFA, 2AFA).
Tous ces modèles de machines reconnaissent exactement les langages rationnels. Toutefois, la taille de ces différents types d'automates, mesurée en nombre d'états, peut être différente. Le gain (la perte) de complexité entre deux de ces types d'automates est une fonction , qui, pour un automate du premier type à état, associe le nombre minimal d'état d'un automate du deuxième type qui est reconnaît le même langage.
Voici les résultats de complexité pour les diverses opérations de transformation.
De 2AFD en AFD : états[9]. Une construction plus ancienne par John Cedric Shepherdson[10] utilise plus d'états, et une borne inférieure par Frank R. Moore [11] est moins bonne.
De 2AFD en AFN : états[9]. Une construction antérieure par Birget[12] utilise plus d'états.
Le problème 2AFD versus 2AFN et l’espace logarithmique
Le problème suivant est ouvert : Peut-on déterminiser un automate bidirectionnel non déterministe (2AFN), c'est-à-dire le convertir en un automate bidirectionnel déterministe (2AFD) ayant un nombre polynomial d'états, en d'autres termes avec états pour un automate de départ à et un polynôme . Ce problème a été posé en 1978 par William J. Sakoda et Michael Sipser[17]. Piotr Berman et Andrzej Lingas[18] ont découvert une relation entre ce problème et le problème ouvert du lien etre les classes de complexité L et NL. Cette relation a été apporfondie par Christos Kapoutsis[19].
Complexité en états d'opérations entre langages
Étant donné une opération binaire entre langages formes préservant la régularité et une famille d'automates (déterministe, non déterministe etc.) la complexité en états de l'opération est une fonction telle que
pour toute paire d'automates à états et à états de la famille , il existe un automate à états de la famille qui accepte le langage
pour toute paire d'entiers , il existe un automate à états et un automate à états dans la famille X telle que tout automate de la famille acceptant a au moins états.
Des définitions analogues valent pour des opérations a plus de deux arguments.
Les premiers résultats sur la complexité des opérations, pour les automates finis déterministes, ont été publiés par A. N. Maslov en 1970[20], d'autre travaux pionniers, plus récents sont de Sheng Yu, Qingyu Zhuang et Kai Salomaa en 1994[21] et de
Markus Holzer et Martin Kutrib en 2003[22]
On suppose que est accepté par un automate à états, et par un automate à états ; on demande le nombre d'états.
Union
Nombre d'états nécessaires pour :
AFD: états, démontré par Maslov[20] et Yu, Zhuang et Salomaa[21].
La table suivante résume les complexités ; elle figure aussi en partie dans l'article d'Okhotin et Salomaa[35] où contient les bornes connues en 2017 pour la complexité des opérations pour les automates finis déterministes (AFD), inambigus (UFA), non déterministes(AFN).
Complexité des opérations binaires
AFD
AFN
UFA
SVFA
2AFD
2AFN
union
intersection
complément
concaténation
étoile
transposé
Une variante est la complexité en états d'opérations inambigues sur les automates. Des résultats ont été présentés à la International Conference on Descriptional Complexity of Formal Systems (2018) ; l'article détaillé intitulé « State complexity of unambiguous operations on finite automata » de Galina Jirásková et Alexander Okhotin paraît en décembre 2019[36]. La borne en états pour le complémentaire d'un automate fini non ambigu avec états est d'Emil Indzhev et Stefan Kiefer[29]
Automates finis sur un alphabet unaire
L'étude de la complexité en états des automates finis sur un alphabet à une seule lettre (alphabet « unaire ») a été initiée par Marek Chrobak en 1986[37]. Les résultats sont différents car la structure particulière des automates unaires fait naturellement appel à des fonctions de théorie des nombres.
Janusz A. Brzozowski a publié des articles[42], où il étudie l'influence de divers paramètres sur la complexité en états. Il définit une famille de langages qui pour certaines opérations atteignent les bornes supérieures, à l'aide d'une famille particulière d'automates appelés automates de Brzozowski par Caron et al.[43].
La complexité pour des opérations combinées a été étudiée par Bo Cui, Yuan Gao, Lila Kari, Kai Salomaa et Sheng Yu et d'autres dans une série d'articles
[44],[45],[46].
La complexité de deux opérations combinées est majorée par la composition des majorations de chacune des opérations, mais les bornes supérieures atteintes dans chacune des opérations peuvent se simplifier dans leur composition, puisque le résultat d'une première opération n'est pas toujours un automate qui peut atteindre la borne pour la deuxième.
Ainsi, la complexité de la concaténation d'un AFD à états et d’un AFD à états est ; la complexité d’une opération booléenne d’un AFD à états et d'un AFD à états est . La combinaison d'une concatéation et d'une intersection (un langage ) est , alors que dans la combinaison avec une union , elle descend à [44].
Jozef Jirásek et Galina Jirásková[47] étudient la complexité du bord d'un langage rationnel. Pour un langage rationnel donné, le bord est par définition le langage
,
c'est-à-dire l'intersection de l’étoile d'un langage et de l’étoile de son complémentaire. Ici, la complémentation est notée par l'exposant c.
Si est la complexité en état de , alors la complexité du complémentaire est également , et la complexité en état de et de est au plus . Les auteurs montrent que la complexité en état du bord est en . La majoration est, plus précisément, . Cette borne est atteinte sur alphabet à 5 lettres, sur 4 lettres elle est la même à une unité près[47].
Une approche plus algébrique du problème est proposée par Pascal Caron et. al.[43]. Ils montrent que les opérations de la forme se ramènent, quitte à remplacer les langages ou par leur complémentaires, aux trois cas où l'opération est l’union, l'intersection et la différence symétrique. Ils obtiennent des bornes qui s'expriment à l'aide de fonctions connues en combinatoire algébrique. Un autre article[48] traite de concaténations multiples ; ils montrent que la borne supérieure est atteinte sur un alphabet à lettres pour concaténations. Ils précisent aussi l'expression de la complexité en états, et utilisent les automates de Brzozowski dans ces développements[49]. Ils systématisent ensuite leur approche et donnent plusieurs applications[50],[51],[52].
↑(en) Markus Holzer et Martin Kutrib, « Nondeterministic finite automata — recent results on the descriptional and computational complexity », International Journal of Foundations of Computer Science, vol. 20, no 4, , p. 563–580 (ISSN0129-0541, DOI10.1142/S0129054109006747)
↑(en) Markus Holzer et Martin Kutrib, « Descriptional and computational complexity of finite automata—A survey », Information and Computation, vol. 209, no 3, , p. 456–470 (ISSN0890-5401, DOI10.1016/j.ic.2010.11.013)
↑(en) M. O. Rabin et D. Scott, « Finite Automata and Their Decision Problems », IBM Journal of Research and Development, vol. 3, no 2, , p. 114–125 (ISSN0018-8646, DOI10.1147/rd.32.0114)
↑(en) Oleg B. Lupanov, « A comparison of two types of finite sources », Problemy Kibernetiki, vol. 9, , p. 321–326
↑ a et b(en) Hing Leung, « Descriptional complexity of NFA of different ambiguity », International Journal of Foundations of Computer Science, vol. 16, no 5, , p. 975–984 (ISSN0129-0541, DOI10.1142/S0129054105003418)
↑ a et bErik M. Schmidt, Succinctness of Description of Context-Free, Regular and Unambiguous Languages (Ph.D.), Cornell University,
↑(en) Galina Jirásková et Giovanni Pighizzini, « Optimal simulation of self-verifying automata by deterministic automata », Information and Computation, vol. 209, no 3, , p. 528–535 (ISSN0890-5401, DOI10.1016/j.ic.2010.11.017)
↑ ab et c(en) Christos Kapoutsis, « Removing Bidirectionality from Nondeterministic Finite Automata », Lecture Notes in Computer Science, vol. 3618 « Mathematical Foundations of Computer Science 2005 », , p. 544–555 (ISBN978-3-540-28702-5, ISSN0302-9743, DOI10.1007/11549345_47)
↑(en) J. C. Shepherdson, « The Reduction of Two-Way Automata to One-Way Automata », IBM Journal of Research and Development, vol. 3, no 2, , p. 198–200 (ISSN0018-8646, DOI10.1147/rd.32.0198)
↑(en) Frank R. Moore, « On the Bounds for State-Set Size in the Proofs of Equivalence Between Deterministic, Nondeterministic, and Two-Way Finite Automata », IEEE Transactions on Computers, vol. C-20, no 10, , p. 1211–1214 (ISSN0018-9340, DOI10.1109/T-C.1971.223108)
↑(en) Jean-Camille Birget, « State-complexity of finite-state devices, state compressibility and incompressibility », Mathematical Systems Theory, vol. 26, no 3, , p. 237–269 (ISSN0025-5661, DOI10.1007/BF01371727)
↑(en) Ashok K. Chandra, Dexter C. Kozen et Larry J. Stockmeyer, « Alternation », Journal of the ACM, vol. 28, no 1, , p. 114–133 (ISSN0004-5411, DOI10.1145/322234.322243)
↑(en) Abdelaziz Fellah, Helmut Jürgensen et Sheng Yu, « Constructions for alternating finite automata », International Journal of Computer Mathematics, vol. 35, nos 1–4, , p. 117–132 (ISSN0020-7160, DOI10.1080/00207169008803893)
↑(en) Viliam Geffert et Alexander Okhotin, « Transforming Two-Way Alternating Finite Automata to One-Way Nondeterministic Automata », Lecture Notes in Computer Science, vol. 8634 « Mathematical Foundations of Computer Science 2014 », , p. 291–302 (ISBN978-3-662-44521-1, ISSN0302-9743, DOI10.1007/978-3-662-44522-8_25)
↑William J. Sakoda et Michael Sipser, « Nondeterminism and the Size of Two Way Finite Automata », ACM, , p. 275–286 (DOI10.1145/800133.804357)
↑Piotr Berman et Andrzej Lingas, « On the complexity of regular languages in terms of finite automata », Report 304, Polish Academy of Sciences,
↑(en) Christos A. Kapoutsis, « Two-Way Automata Versus Logarithmic Space », Theory of Computing Systems, vol. 55, no 2, , p. 421–447 (DOI10.1007/s00224-013-9465-0)
↑ abcd et e(en) A. N. Maslov, « Estimates of the number of states of finite automata », Soviet Mathematics Doklady, vol. 11, , p. 1373–1375
↑ abcdefghi et j(en) Sheng Yu, Qingyu Zhuang et Kai Salomaa, « The state complexities of some basic operations on regular languages », Theoretical Computer Science, vol. 125, no 2, , p. 315–328 (ISSN0304-3975, DOI10.1016/0304-3975(92)00011-F)
↑ abcdefghij et k(en) Markus Holzer et Martin Kutrib, « Nondeterministic descriptional complexity of regular languages », International Journal of Foundations of Computer Science, vol. 14, no 6, , p. 1087–1102 (ISSN0129-0541, DOI10.1142/S0129054103002199)
↑ abc et d(en) Jozef Jirásek, Galina Jirásková et Juraj Šebej, « Operations on Unambiguous Finite Automata », Lecture Notes in Computer Science, vol. 9840 « Developments in Language Theory 2016 », , p. 243–255 (ISBN978-3-662-53131-0, ISSN0302-9743, DOI10.1007/978-3-662-53132-7_20)
↑ abcdefgh et i(en) Michal Kunc et Alexander Okhotin, « State complexity of operations on two-way finite automata over a unary alphabet », Theoretical Computer Science, vol. 449, , p. 106–118 (ISSN0304-3975, DOI10.1016/j.tcs.2012.04.010)
↑ abc et d(en) Michal Kunc et Alexander Okhotin, « State Complexity of Union and Intersection for Two-way Nondeterministic Finite Automata », Fundamenta Informaticae, vol. 110, , p. 231–239 (DOI10.3233/FI-2011-540)
↑(en) Jean-Camille Birget, « Partial orders on words, minimal elements of regular languages, and state complexity », Theoretical Computer Science, vol. 119, no 2, , p. 267–291 (ISSN0304-3975, DOI10.1016/0304-3975(93)90160-U)
↑Mikhail Raskin, « A superpolynomial lower bound for the size of non-deterministic complement of an unambiguous automaton », Arxiv, (arXiv1711.03993). Accepté pour ICALP 2018 à Prague.
↑ a et bEmil Indzhev et Stefan Kiefer, « On complementing unambiguous automata and graphs with many cliques and cocliques », Information Processing Letters, vol. 177, , article no 106270 (DOI10.1016/j.ipl.2022.106270, arXiv2105.07470).
↑ a et b(en) Viliam Geffert, Carlo Mereghetti et Giovanni Pighizzini, « Complementing two-way finite automata », Information and Computation, vol. 205, no 8, , p. 1173–1187 (ISSN0890-5401, DOI10.1016/j.ic.2007.01.008)
↑Henning Bordihn, Michal Hospodár, Galina Jirásková, Benedek Nagy et György Vaszil, « The complexity of concatenation on deterministic and alternating finite automata », RAIRO - Theoretical Informatics and Applications, vol. 52, nos 2-3-4, , p. 153–168 (ISSN0988-3754, DOI10.1051/ita/2018011).
↑(en) Boris G. Mirkin, « On dual automata », Cybernetics, vol. 2, , p. 6–9
↑(en) Ernst Leiss, « Succinct representation of regular languages by boolean automata II », Theoretical Computer Science, vol. 38, , p. 133–136 (ISSN0304-3975, DOI10.1016/0304-3975(85)90215-4)
↑(en) Alexander Okhotin et Kai Salomaa, « State complexity of operations on input-driven pushdown automata », Journal of Computer and System Sciences, vol. 86, , p. 207–228 (ISSN0022-0000, DOI10.1016/j.jcss.2017.02.001)
↑Galina Jirásková et Alexander Okhotin, « State complexity of unambiguous operations on finite automata », Theoretical Computer Science, vol. 798, , p. 52–64 (DOI10.1016/j.tcs.2019.04.008).
↑ a et b(en) Michal Kunc et Alexander Okhotin, « Describing Periodicity in Two-Way Deterministic Finite Automata Using Transformation Semigroups », Springer Lecture Notes in Computer Science, vol. 6795, , p. 324–336 (ISSN0302-9743, DOI10.1007/978-3-642-22321-1_28).
↑(en) Carlo Mereghetti et Giovanni Pighizzini, « Optimal Simulations between Unary Automata », SIAM Journal on Computing, vol. 30, no 6, , p. 1976–1992 (ISSN0097-5397, DOI10.1137/S009753979935431X).
↑ a et b(en) Viliam Geffert, Carlo Mereghetti et Giovanni Pighizzini, « Converting two-way nondeterministic unary automata into simpler automata », Theoretical Computer Science, vol. 295, nos 1-3, , p. 189–203 (ISSN0304-3975, DOI10.1016/S0304-3975(02)00403-6).
↑ abc et d(en) Alexander Okhotin, « Unambiguous finite automata over a unary alphabet », Information and Computation, vol. 212, , p. 15–36 (ISSN0890-5401, DOI10.1016/j.ic.2012.01.003)
↑Par exemple
Janusz A. Brzozowski, « In the search of
most complex regular languages », Int. J. Found. Comput. Sci., vol. 24
numéro = 6, , p. 691–708.
↑ a et bPascal Caron, Jean-Gabriel Luque, Ludovic Mignot et Bruno Patrou, « State complexity of catenation combined with a boolean operation : a unified approach », International Journal of Foundations of Computer Science, vol. 27, no 6, , p. 675-703 (DOI10.1142/S0129054116500234)
↑ a et bBo Cui, Yuan Gao, Lila Kari et Sheng Yu, « State complexity of two combined operations: Catenation-union and catenation-intersection », Int. J. Found. Comput. Sci., vol. 22, no 8, , p. 1797–1812
↑Yuan Gao et Sheng Yu, « State Complexity of Combined Operations with Union, Intersection, Star and Reversal », Fundamenta Informaticae, vol. 116, nos 1-4, , p. 79-92
↑Yuan Gao, Kai Salomaa et Sheng Yu, « The state complexity of two combined operations: Star of catenation and star of reversal », Fundamenta Informaticae, vol. 83, nos 1-2, , p. 75–89
↑ a et bJozef Jirásek et Galina Jirásková, « On the boundary of regular languages », Theoretical Computer Science, vol. 578, , p. 42–57 (DOI10.1016/j.tcs.2015.01.022).
↑Pascal Caron, Jean-Gabriel Luque et Bruno Patrou, « State complexity of multiple catenation », Arxiv (preprint), (arXiv1607.04031)
↑Pascal Caron, Jean-Gabriel Luque et Bruno Patrou, « State complexity of combined operations involving catenation and binary Boolean operations: Beyond the Brzozowski conjectures », Theoretical Computer Science, vol. 800, , p. 15–30 (ISSN0304-3975, DOI10.1016/j.tcs.2019.10.013).
↑Pascal Caron, Jean-Gabriel Luque et Bruno Patrou, « A combinatorial approach for the state complexity of the Shuffle product », Arxiv, (arXiv1905.08120)
↑Pascal Caron, Edwin Hamel-de le Court et Jean-Gabriel Luque, « Combination of roots and boolean operations: An application to state complexity », Information and Computation, vol. 289, , article no 104961 (DOI10.1016/j.ic.2022.104961, lire en ligne, consulté le ).
↑Oliver A. S. Lyon et Kai Salomaa, « The nondeterministic state complexity of the site-directed deletion language operation », Theoretical Computer Science, vol. 968, , article no 113999 (DOI10.1016/j.tcs.2023.113999)