Conectividad dinámicaEn computación y teoría de grafos, una estructura de conectividad dinámica es una estructura de datos que dinámicamente mantiene información sobre las componentes conexas de un grafo. El conjunto V de vértices del grafo está fijado, pero el conjunto E de las aristas pueden cambiar. Los tres casos, por orden de dificultad, son:
Después de cada adición/eliminación de una arista, la estructura de conectividad dinámica se tendría que adaptar tal que pueda dar respuestas rápidas a las consultas de la forma "existe camino entre x e y?" (equivalente: "x e y pertenecen a la misma componente conexa?"). Conectividad incrementalSi las aristas solo pueden ser añadidos, entonces el problema de conectividad dinámico puede ser solucionado con un conjunto disjunto. Cada conjunto representa un componente conectado; existe camino entre x e y si y solo si pertenecen al mismo conjunto. El tiempo amortizado por operación es , donde n es el número de vértices y α es la inversa de la función de Ackermann, el cual es casi constante. El caso en las aristas solo pueden ser eliminadas fue resuelto por Shimon Even y Yossi Shiloach.[1] La estructura utiliza una tabla que especifica, para cada vértice, el nombre de la componente a la que pertenece. Por lo tanto una consulta de conectividad toma tiempo constante. El reto es actualizar la tabla cuando la arista es eliminada. Grafos Acíclicos (bosques)Cuando la arista u-v es eliminada en un bosque, el árbol que contiene esa arista es roto en dos árboles: uno de ellos contiene u y el otro contiene v. La tabla es actualizada de la manera siguiente.
Como siempre renombramos la componente más pequeña, el tiempo amortizado para la operación de eliminar es . Grafos generalesCuándo una arista es eliminada en un grafo general, no sabemos si su componente queda conectada por otras aristas o es separada en dos componentes. Así que utilizamos dos procesos en paralelo (o intercalando). El proceso A controla si la eliminación de la arista rompe la componente, y si lo hace, ambos procesos paran. El proceso B controla si la eliminación de la arista no rompe la componente al cual pertenece, y si no lo hace, otra vez ambos procesos paran. Proceso A es similar al caso del grafo acíclico: hay dos sub-procesos que recorren a partir de ambos vértices que une la arista. Si uno de los sub-procesos termina antes de llegar al otro extremo, esto significa que la componente está rota en dos sub-componentes, y el nombre de la sub-componente más pequeña es actualizado, como antes. Por ello el tiempo amortizado para eliminar es otra vez . Proceso B utiliza una estructura "primero a lo ancho" (BFS), la cual es inicializada de la siguiente forma. Un vértice r es escogido y el BFS empieza desde él. El único vértice en el nivel 0 es r. Todos los vértices de distancia i de la raíz están en el nivel i. Si G no es conexo, se comienza un nuevo recorrido desde cualquier vértice v no visitado, v es puesto en el nivel 1, y una arista artificial es conectada de v a la raíz r; todos los vértices a distancia i de v están ahora en el nivel i+1, etc. Las aristas artificiales son introducidas para mantener todas las componentes conexas en una sola estructura BFS y serán utilizadas solo para este propósito. Claramente, las aristas artificiales están utilizadas solo en el proceso B. La estructura tiene las siguientes propiedades. Un vértice v en el nivel i, i>0 tiene solo tres tipos de aristas: aristas de retroceso, que conectan este al nivel i-1 (hay al menos una de estas aristas, la cual puede ser artificial); aristas locales, que conectan este con otras aristas en el nivel i( hay cero o más de estas aristas); o aristas de adelanto, que conectan este al nivel i+1 (hay cero o más de estas aristas). Entonces para cada vértice v, mantenemos tres conjuntos de aristas (retroceso, local y adelanto). Cuándo una arista u-v es eliminada, hay dos opciones: ya sea u o v están en el mismo nivel, o en niveles que difieren por uno. Caso 1: ambos u y v están en el mismo nivel. En este caso, la eliminación de aristas no puede cambiar las componentes. La arista es eliminada de los conjuntos de aristas locales de u y v, y el proceso B para (y por tanto el proceso A se detiene también). Nuestra estructura BFS es todavía válida. Caso 2: u y v están en niveles diferentes. W.l.o.g, asume que u está en el nivel i-1 y v en el nivel i; por ello el borde tendría que ser eliminado de adelante(u) y de retroceso(v). Caso 2.1: Si el nuevo retroceso(v) no es vacío, entonces las componentes no han cambiado: hay otras aristas que conectan v en retroceso. Proceso B para (y proceso A también). Caso 2.2: Si el nuevo retroceso(v) es vacío, entonces v ya no está conectado al nivel i-1, y así su distancia a la raíz ya no es i; tiene que ser al menos i+1. Además, puede haber otros vértices, conectados a v, cuya distancia a la raíz aumenta como resultado de la eliminación. Para actualizar las distancias, utilizamos un cola Q, la cual inicialmente contiene solo el vértice v. Mientras Q no está vacía:
Si la eliminación de aristas no rompe cualquier componente y estamos en el caso 2.2, entonces en algún momento el procedimiento parará. En este caso es fácil de ver que la estructura BFS es mantenida correctamente. Si su eliminación rompe un componente, entonces el procedimiento no parará por él mismo. Aun así, el proceso A, reconociendo la interrupción, parará, y ambos procesos pararán. En este caso todos los cambios hechos a la estructura BFS son ignorados, y volvemos a la estructura BFS que teníamos antes de la eliminación, exceptuando que la arista eliminada es ahora una arista artificial. Claramente, en este caso v es ahora la raíz de un árbol qué incluye el componente nuevo, y quizás componentes adicionales, a través de algunas otras aristas artificiales. También, no hay ninguna arista conectando los descendientes de v con cualesquier vértices qué no es descendiente de v, excepto la arista artificial u-v.[2] Siempre que una arista es procesada en el procedimiento, uno de su extremos disminuye un nivel. Dado que el vértice de nivel más bajo es |V|-1, el coste por arista es acotado por 2|V|. Por ello el tiempo amortizado para la operación de eliminación es . Conectividad dinámica completaGrafos Acíclicos (bosques)Un bosque puede ser representado utilizando una colección de ya sea "Link-cut trees" o "Euler tour trees". Entonces el problema de conectividad dinámico puede ser solucionado fácilmente, para cada dos nodos x,y, x está conectado a y si y solo si FindRoot(x)=FindRoot(y). Los tiempos de actualización amortizados y tiempo de consulta son ambos O(log(n)). Grafos generalesUn grafo general puede ser representado por su bosque abarcador - un bosque que contiene un árbol para cada componente. Llamamos a este bosqueF. F puede ser representado por un bosque de "Euler tour trees". Las operaciones de consulta e inserción son implementadas utilizando las operaciones correspondientes en los árboles del ET que representan a F. La operación que es un reto es la de eliminación, y en particular, eliminando una arista qué está contenido en uno de los árboles abarcador de F. Esto rompe el árbol en dos árboles, pero, es posible que exista otra arista que los conecta. El reto es encontrar de manera rápida tal arista de sustitución, si existe. Esto requiere una estructura de datos más compleja. Muchas de estas estructuras están descritas más abajo. La estructura de NivelCada arista en el grafo le es asignado un nivel. Dejado L=lg n. El nivel de cada arista insertada al grafo es inicializado a L, y puede disminuir a 0 durante operaciones de eliminación. Para cada i entre 0 y L, define Gi como el subgrafo constando de las aristas que son de nivel i o menos, y Fi un bosque abarcador de Gi. Nuestro bosque F es ahora llamado FL. Mantendremos una secuencia de decrecimiento de bosques FL ⊆ ... ⊆ F0. OperacionesLas operaciones de consulta e inserción utilizan solo el bosque más grande FL. Los subgrafos más pequeños son consultados solo durante la operación de eliminar, y en particular, eliminando una arista qué está contenida en uno de los árboles abarcador de FL. Cuándo tal arista e = x-y es eliminada, es primero sacada de FL y de todos los bosques abarcadores más pequeños al que pertenece, i.e. de cada Fi con i≥nivel(e). Entonces buscamos una arista de sustitución. Empezar con el bosque abarcador más pequeño que contiene e, concretamente, Fi con i=nivel(e). La arista e pertenece a un árbol T⊆Fi. Después de la eliminación de e, el árbol T se rompe en dos árboles más pequeños: Tx que contiene el nodo x y Ty que contiene el nodo y. Una arista de Gi es de sustitución, si y solo si conecta un nodo en Tx con un nodo en Ty. Supongamos que Tx es el árbol más pequeño (i.e. contiene como máximo la mitad de los nodos de T; podemos decir la medida de cada subtree por una anotación añadida a los "Euler trees"). Recorremos todas las ariatas ε con nivel i y al menos un nodo en Tx:
AnálisisEl nivel de cada borde será decrementado como máximo lg n tiempo. Por qué? Porque con cada disminución, cae a un árbol cuya medida es como máximo la mitad de la medida de su árbol en el nivel anterior. Entonces en cada nivel i, el número de los nodos en cada componente conectado es como máximo 2^i. Por ello el nivel de una arista es siempre al menos 0. Cada arista cuyo nivel es decrementado toma tiempo para encontrar (utilizando las operaciones del árbol ET).En total, cada arista insertada toma tiempo hasta que es eliminada, así que el tiempo amortizado para la elimiación es . La parte restante de eliminar también toma , ya que tenemos que eliminar la arista de como máximo niveles, y eliminando de cada nivel toma (otra vez utilizando las operaciones del árbol ET). En total, el tiempo amortizado por actualización es . Los tiempos por consulta pueden ser mejorados a . Aun así, el tiempo del caso peor por actualización podría ser . La cuestión de si los tiempos del caso peor pueden ser mejorados había sido una cuestión abierta, hasta que fue solucionado por la estructura "Cutset". La estructura CutsetDado un grafo G(V,E) y un subconjunto T⊆V, definimos cutset(T) como el conjunto de aristas que conecta T con V\T. El cutset es una estructura de datos que, sin mantener el grafo entero en memoria, puede encontrar deprisa una arista en el cutset, si tal arista existe.[3] Empezamos por dar un número a cada vértice. Suponer que hay n vértices; entonces cada vértice puede ser representado por un número con lg(n) bits. Luego, dar un número a cada arista, el cual es una concatenación de los números de sus vértices - un número con 2lg(n) bits. Para cada vértice v, calcula y mantener xor(v), el cual es el xor de los números de todos las aristas adyacentes a él. Ahora para cada subconjunto T⊆V, es posible de calcular xor(T) = el xor de los valores de todos los vértices en T. Considerar una arista e = u-v cuál es una arista interna de T (i.e. ambos u y v están en T). El número de e está incluido dos veces en xor(T) - una vez para u y una vez para v. Ya que el xor de cada número con él es 0, e desaparece y no afecta al xor(T). Así, xor(T) es de hecho el xor de todas las aristas en cutset(T). Hay varias opciones:
Nuestro objetivo ahora es manejar esta tercera opción. Primero, crear una secuencia de lg(n) niveles de las estructuras cutset, cada cual contiene sobre la mitad de las aristas del nivel superior (i.e., para cada nivel, selecciona cada arista del nivel superior con probabilidad 1/2). Si en el primer nivel xor(T) regresa un valor ilegal, significando que cutset(T) tiene dos o más aristas, entonces hay una posibilidad que en el nivel próximo, el cual contiene menos aristas, xor(T) regresará un valor legal ya cutset(T) contendrá una sola arista. Si xor(T) todavía regresa un valor ilegal, continúa al nivel próximo, etc. Como el número de aristas va en decrecimiento, hay dos casos:
Es posible de probar que la probabilidad de éxito es al menos 1/9. Luego, crear una colección de Clg(n) versiones independientes de la estructura de nivel, donde C es una constante. En cada versión, hacer una reducción aleatoria independiente de bordes de nivel a nivel. Probar cada consulta en cada una de las versiones hasta que una de ellas tiene éxito. La probabilidad de que todas las versiones fallan es como máximo: Por selección apropiada de C podemos hacer la probabilidad del fracaso arbitrariamente cercana a 0. OperacionesPodemos añadir una estructura cutset a una estructura de conectividad dinámica. Las operaciones de Insertar y Eliminar en la estructura cutset están hecha en exactamente la misma manera: la arista insertada/eliminada es XOReada a ambos de sus extremos. Cuándo una arista es eliminada del bosque abarcador utilizado para la estructura de conectividad dinámica, el cutset suele encontrar una arista de sustitución. AnálisisUna sola estructura cutset requiere O(n lg n) memoria - un único número, con 2 lg n bits, para cada uno de los n vértices. No tenemos que mantener las aristas. Para grafos densos, esto es mucho más barato que manteniendo el grafo entero en memoria. Tenemos que mantener lg(n) versiones, cada cual contiene lg(n) niveles. De ahí, el requisito de memoria total es O(n lg^3 n). El tiempo de consulta es O(polylog(n)) en el caso peor. Esto es en contraste a #La estructura de Nivel, en qué el tiempo de consulta es O(polylog(n)) amortizado, pero el tiempo peor es O(n). Referencias
|