Lowest Common AncestorAls Lowest Common Ancestor oder Least Common Ancestor (LCA), deutsch „letzter gemeinsamer Vorfahre“, wird in der Informatik und Graphentheorie ein Ermittlungskonzept bezeichnet, das einen gegebenen gewurzelten Baum von Datenstrukturen effizient vorverarbeitet, sodass anschließend Anfragen nach dem letzten gemeinsamen Vorfahren für beliebige Knotenpaare in konstanter Zeit beantwortet werden können. Bäume gehören zu den fundamentalen Datenstrukturen der Informatik. Sie werden häufig verwendet, um Daten in einer hierarchischen oder geschachtelten Struktur darzustellen. Zwei klassische Beispiele sind Such- und Entscheidungsbäume. Algorithmische Standardfragen für Bäume sind zum Beispiel die Pre-, Post- und Inordertraversierung. Ein in diesem Kontext weniger bekanntes algorithmisches Problem ist die Suche nach dem letzten gemeinsamen Vorfahren (LCA).[1] Definition des LCAGegeben sei ein Baum mit einem Wurzelknoten , insgesamt Knoten und einer Höhe . Der Lowest Common Ancestor (LCA) zweier Knoten und ist derjenige Knoten, der ein Elternknoten von sowohl als auch ist und am weitesten von der Wurzel entfernt liegt, also die größtmögliche Tiefe besitzt. Ziel ist es, einen gegebenen Baum effizient so vorzuverarbeiten, dass LCA Anfragen möglichst schnell beantwortet werden können. Entwicklung (Geschichte)Das LCA-Problem wurde 1973 erstmals von Alfred Aho, John Hopcroft und Jeffrey Ullman definiert. Im Jahre 1984 entwickelten Dov Harel und Robert Tarjan die erste effiziente Datenstruktur zur Lösung des LCA-Problems. Dabei wird der Eingabebaum in (siehe Landau-Symbole) vorverarbeitet, so dass die Abfragen in konstanter Zeit, beantwortet werden können. Allerdings gilt die Datenstruktur als sehr komplex und schwierig zu implementieren. Tarjan fand später einen einfacheren, wenn auch weniger effizienten Algorithmus, der auf der Union-Find-Struktur basiert und den LCA aus einer vorher berechneten Menge von Knotenpaaren ermittelt (Tarjan’s Offline Least Common Ancestor Algorithm (TOLCA)). Im Jahre 1988 vereinfachten Baruch Schieber und Uzi Vishkin diese Datenstruktur, so dass diese implementierbar wurde und dennoch einen Vorverarbeitungsaufwand von Zeit und einen Abfrageaufwand von aufweist. 1993 entdeckten Omer Berkman und Uzi Vishkin einen neuen Weg, das LCA-Problem mit Hilfe von Reduktion und Range Minimum Query (RMQ) zu lösen. Der Zeitaufwand hat auch hier lineare Vorverarbeitungszeit und konstante Abfragezeit . Dieser Lösungsansatz wurde 2000 von Michael Bender und Martin Farach-Colton vereinfacht.[2][3] AnwendungsgebieteDie LCA-Ermittlung kann angewendet werden, um den LCA (Last common ancestor, auch Most recent common ancestor, MRCA) von Gen-Bäumen (Bioinformatik) zu ermitteln.[4] VerallgemeinerungUrsprünglich wurde der Begriff des LCA im Zusammenhang mit Bäumen untersucht, doch kann er auch für gerichtete azyklische Graphen (englisch directed acyclic graphs, DAGs) definiert werden. Dabei wird davon ausgegangen, dass die Kanten des DAG von den Eltern zu den Kindern führen. Die ursprüngliche Definition von Aït-Kaci et al. (1989)[5] wurde von Bender et al. (2005) vereinfacht.[6] WeblinksEinzelnachweise
|