Árvore de sufixosEm ciência da computação, uma árvore de sufixos (também chamada árvore PAT ou, na forma anterior, árvore de posições) é uma trie comprimida, contendo todos os sufixos de um dado texto, assim como suas chaves e posições no texto como seus valores. Árvores de sufixo permitem uma implementação particularmente rápida de muitas operações importantes com strings. A construção de tal árvore para uma string leva tempo e espaço lineares no tamanho de . Uma vez construída, muitas operações podem ser realizadas rapidamente, por exemplo, localizar uma substring em , localizar uma substring se um certo número de erros for permitido, localizar acertos para uma expressão regular etc. Árvores de sufixo também proveem uma das primeiras soluções em tempo linear para o problema da maior substring comum. Estes ganhos de velocidade vem com um custo: armazenar uma árvore de sufixos de uma string tipicamente requer significativamente mais espaço do que armazenar a própria string. DefiniçãoUma árvore de sufixos para a string de tamanho é definida como uma árvore tal que:[1]
Como tal árvore não existe para todas as strings, é customizado com um símbolo terminal não visto na string (usualmente denotado Suffix links são uma característica chave para algoritmos de construção em tempo linear mais antigos, apesar da maioria dos algoritmos mais novos, que são baseados no algoritmo de Farach, dispensarem suffix links. Em uma árvore de sufixos completa, todos os nós internos não-raízes possuem um para outro nó interno. Se o caminho da raiz até um nó resulta na string , aonde é um caractere simples e é uma string (possivelmente vazia), este caminho possui um suffix link para o nó interno representando . Veja o exemplo com o nó de Notas
|