Dichtestes PunktpaarDas Problem des dichtesten Punktpaares (englisch closest pair of points problem) ist die Suche nach den zwei am dichtesten beieinander liegenden Punkten in einer Ebene. Gegeben ist eine beliebige Menge von Punkten in der Ebene und gesucht sind zwei dieser Punkte, sodass der euklidische Abstand minimal ist. Ein ähnliches Problem ist die Suche nach den zwei am weitesten voneinander entfernten Punkten in der Ebene, also den zwei Punkten mit dem maximalen euklidischen Abstand. Kleinster Abstand von Punkten in der EbeneBrute-force-AlgorithmusDer Brute-force-Algorithmus berechnet die Abstände zwischen allen möglichen Punktpaaren und wählt das Punktpaar mit dem kleinsten Abstand aus. Wenn die Anzahl der Punkte ist, gibt es mögliche Punktpaare, für die die Abstände berechnet werden müssen. Die Laufzeit des Algorithmus ist also quadratisch und liegt in . Divide-and-conquer-AlgorithmusZunächst wird die gegebene Menge der Punkte einmal nach x-Koordinaten und einmal nach y-Koordinaten sortiert. Man erhält zwei sortierte Listen und . Der Divide-Schritt teilt die nach x-Koordinaten sortierte Liste in zwei Hälften und links und rechts des Medians auf. Der rekursive Aufruf geschieht nun jeweils für die beiden Hälften. Man erhält das jeweils dichteste Punktpaar beider Hälften, ohne dass eventuelle Punktpaare zwischen beiden Hälften berücksichtigt werden. Der Conquer-Schritt kombiniert nun diese beiden Hälften. Es wird das Punktpaar mit dem kleinsten gefundenen Abstand ausgewählt. Hierbei sind zwei Fälle zu beachten:
Es ist nicht nötig, alle solchen Punktpaare einzeln durchzuprüfen. Ist der kleinste gefundene Abstand in einer der beiden Hälften, dann ist dies eine obere Grenze für den kleinsten Abstand. Daher müssen nur noch Punkte betrachtet werden, deren Abstand zum Median in x-Richtung höchstens beträgt. Außerdem müssen für diese Punkte nur noch Partner betrachtet werden, deren Abstand in y-Richtung kleiner als ist. ProgrammierungDas folgende Computerprogramm in der Programmiersprache C++ zeigt eine Implementierung des Divide-and-conquer-Algorithmus. Bei der Ausführung des Programms wird die Methode main verwendet, die das Punktpaar und den kleinsten Abstand zwischen dem Punktpaar das auf der Konsole ausgibt.[1] Die Funktion getSmallestDistanceBruteForce verwendet für Teilbereiche aus 2 oder 3 Punkten den Brute-force-Algorithmus. Der Conquer-Schritt wird von der rekursiven Funktion getSmallestDistanceRecursive durchgeführt, die sich selbst für die linke Hälfte und für die rechte Hälfte aufruft. Die Funktion getSmallestDistanceOfStrip bestimmt das Punktpaar und den kleinsten Abstand für den Streifen, der Punkte aus beiden Hälften enthält. Die Laufzeit dieser Funktion ist linear zur Anzahl der Punkte. #include <iostream>
#include <sstream>
using namespace std;
// Deklariert den Datentyp für Punkte mit x-Koordinate und y-Koordinate in der Ebene
struct Point
{
int x, y;
};
// Vergleichsfunktion für das Sortieren der Punkte nach der x-Koordinate
int compareX(const void* a, const void* b)
{
Point* point1 = (Point*)a, * point2 = (Point*)b;
return point1->x - point2->x;
}
// Vergleichsfunktion für das Sortieren der Punkte nach der y-Koordinate
int compareY(const void* a, const void* b)
{
Point* point1 = (Point*)a, * point2 = (Point*)b;
return (point1->y - point2->y);
}
// Diese Funktion berechnet den euklidischen Abstand zwischen zwei Punkten
double getDistance(Point point1, Point point2)
{
return sqrt((point1.x - point2.x) * (point1.x - point2.x) + (point1.y - point2.y) * (point1.y - point2.y));
}
// Diese Funktion gibt den kleinsten Abstand der Punkte bis zum gegebenen Index zurück, indem alle Paare von Punkten durchlaufen und geprüft werden
double getSmallestDistanceBruteForce(Point points[], Point& point1, Point& point2, int index)
{
double minimumDistance = FLT_MAX;
for (int i = 0; i < index; i++)
{
for (int j = i + 1; j < index; j++)
{
// Die for-Schleifen durchlaufen alle Paare von Punkten
double currentDistance = getDistance(points[i], points[j]); // Ruft die Funktion für die Berechnung des euklidischen Abstands auf
if (currentDistance < minimumDistance) // Prüft, ob der Abstand zwischen den aktuellen Punkten kleiner als der bisher kleinste Abstand ist
{
point1 = points[i];
point2 = points[j];
minimumDistance = currentDistance;
}
}
}
return minimumDistance;
}
// Diese Funktion gibt den kleinsten Abstand der Punkte im gegebenen Streifen zurück, wenn der Abstand kleiner als der vorgegebene Abstand ist
double getSmallestDistanceOfStrip(Point points[], Point& point1, Point& point2, int index, double distance)
{
double minimumDistance = distance; // Initialisiert den kleinsten Abstand
qsort(points, index, sizeof(Point), compareY); // Sortiert die Punkte nach der y-Koordinate mithilfe der Vergleichsfunktion compareY
for (int i = 0; i < index; i++)
{
for (int j = i + 1; j < index && points[j].y - points[i].y < minimumDistance; j++) // Durchläuft die Punkte, so lange die Differenz der y-Koordinaten kleiner als der vorgegebene Abstand ist
{
double currentDistance = getDistance(points[i], points[j]); // Ruft die Funktion für die Berechnung des euklidischen Abstands auf
if (currentDistance < minimumDistance) // Prüft, ob der Abstand zwischen den aktuellen Punkten kleiner als der bisher kleinste Abstand ist
{
point1 = points[i];
point2 = points[j];
minimumDistance = currentDistance;
}
}
}
return minimumDistance;
}
// Diese rekursive Funktion gibt den kleinsten Abstand der Punkte zurück. Sie verwendet das Teile-und-herrsche-Verfahren, indem sie die Menge der Punkte in zwei Hälften teilt und den kleinsten Abstand für die beiden Hälften und den Streifen zwischen den beiden Hälften berechnet.
double getSmallestDistanceRecursive(Point points[], Point& point1, Point& point2, int index)
{
if (index <= 3)
{
return getSmallestDistanceBruteForce(points, point1, point2, index); // Wenn das Array aus 2 oder 3 Punkten besteht, wird die Brute Force Funktion aufgerufen
}
int medianIndex = index / 2;
Point medianPoint = points[medianIndex];
Point leftPoint1, leftPoint2, rightPoint1, rightPoint2; // Deklariert Referenzen für die Punkte mit dem kleinsten Abstand
double leftDistance = getSmallestDistanceRecursive(points, leftPoint1, leftPoint2, medianIndex); // Rekursiver Aufruf der Funktion für die linke Hälfte der Punkte
double rightDistance = getSmallestDistanceRecursive(points + medianIndex, rightPoint1, rightPoint2, index - medianIndex); // Rekursiver Aufruf der Funktion für die rechte Hälfte der Punkte
// Bestimmt den kleineren der beiden Abstände und weist die Referenzen auf die Punkte zu
double distance;
if (leftDistance < rightDistance) // Wenn der Abstand in der linken Hälfte kleiner ist
{
point1 = leftPoint1;
point2 = leftPoint2;
distance = leftDistance;
}
else
{
point1 = rightPoint1;
point2 = rightPoint2;
distance = rightDistance;
}
// Erzeugt ein Array mit einem Streifen von Punkten auf, deren x-Koordinate einen kleineren Abstand hat
Point* stripPoints = new Point[index];
int j = 0;
for (int i = 0; i < index; i++)
{
if (abs(points[i].x - medianPoint.x) < distance) // Prüft, ob der Abstand der x-Koordinate zwischen den aktuellen Punkten kleiner als der bisher kleinste Abstand ist
{
stripPoints[j] = points[i];
j++;
}
}
getSmallestDistanceOfStrip(stripPoints, point1, point2, j, distance); // Aufruf der Funktion für den Streifen von Punkten aus beiden Hälften. Wenn der Abstand in diesem Streifen kleiner ist, wird dieser zurückgegeben.
}
// Diese Funktion gibt den kleinsten Abstand der Punkte und Referenzen auf die zwei Punkte mit dem kleinsten Abstand zurück
double getSmallestDistance(Point points[], Point& point1, Point& point2, int numberOfPoints)
{
qsort(points, numberOfPoints, sizeof(Point), compareX); // Sortiert die Punkte nach der x-Koordinate mithilfe der Vergleichsfunktion compareX
return getSmallestDistanceRecursive(points, point1, point2, numberOfPoints); // Aufruf der rekursiven Funktion
}
// Diese Funktion gibt den Punkt in der Form (x, y) zurück
string pointToString(Point* point)
{
stringstream text;
text << "(" << point->x << ", " << point->y << ")" << endl;
return text.str(); // Typumwandlung von stringstream nach string
}
// Hauptfunktion die das Programm ausführt
int main()
{
Point points[] = { {2, 3}, {12, 30}, {40, 50}, {5, 1}, {12, 10}, {3, 4} }; // Deklariert und initialisiert ein Array mit 6 Punkten
int numberOfPoints = sizeof(points) / sizeof(points[0]);
Point point1, point2; // Deklariert Referenzen für die zwei Punkte mit dem kleinsten Abstand
cout << "Der kleinste Abstand zwischen zwei Punkten ist " << getSmallestDistance(points, point1, point2, numberOfPoints) << endl; // Aufruf der Funktion, Ausgabe auf der Konsole
cout << "Erster Punkt: " << pointToString(&point1); // Ausgabe auf der Konsole
cout << "Zweiter Punkt: " << pointToString(&point2); // Ausgabe auf der Konsole
}
Randomisierter AlgorithmusFunktionsweiseDer randomisierte Algorithmus beruht darauf, dass die Punkte in zufälliger Reihenfolge in eine Hashtabelle eingefügt werden, wobei das Einfügen eines Punktes ebenso wie das Testen, ob er den vorher bekannten minimalen Abstand unterbietet, konstante Laufzeit hat. Die Hashtabelle bildet alle Gitterzellen der Größe auf den eventuell darin liegenden Punkt ab. Es muss zwar bei jeder solchen Aktualisierung von die Hashtabelle neu aufgebaut werden, die Gesamtzahl der Einfügeoperationen in sämtliche dieser Hashtabellen liegt aber trotzdem in . Bilde eine zufällige Reihenfolge der Punkte P1, ..., Pn δ = Abstand zwischen P1 und P2 Füge P1 und P2 in die Hashtabelle ein (Gittergröße δ/2) Für i = 3, ..., n Falls Pi einen Abstand δ < δ' zu einem der Punkte P1, ..., Pi-1 hat: δ = δ' Baue die Hashtabelle neu auf (Gittergröße δ'/2) Füge Pi in die Hashtabelle ein Gitterstruktur und HashfunktionMan kann vereinfachend annehmen, dass alle Punkte Koordinaten zwischen (0,0) und (1,1) haben. Gegebenenfalls kann hierfür eine Koordinatentransformation vorgenommen werden. Die Ebene, in der die Punkte liegen, wird sodann durch ein Gitter der Weite überdeckt. Es wird nun eine universelle Hashfunktion benötigt; sie ermöglicht es einerseits, von einer gegebenen Gitterzelle in konstanter Laufzeit festzustellen, ob sich in dieser Gitterzelle einer der Punkte befindet, und andererseits neue Punkte in konstanter Laufzeit in die bestehende Hashtabelle einzufügen. Einfügen neuer PunkteBei jedem Einfügen eines neuen Punktes P ist zu prüfen, ob dadurch der bereits bekannte minimale Abstand unterschritten wird. Anhand der Koordinaten von P lässt sich sofort bestimmen, in welcher der Gitterzellen der Punkt P liegt. Aufgrund der Aufteilung in Gitterzellen der Größe muss nur festgestellt werden, ob in einer der umliegenden Gitterzellen schon ein Punkt liegt. Umliegend sind dabei alle Gitterzellen, die einen solchen Abstand begründen könnten, also nur das umgebende 5x5-Rechteck. Alle Punkte, die außerhalb dieses Bereichs liegen, können keinen kleineren Abstand zu P haben, weil sie aufgrund der Gittergröße mindestens den Abstand haben. Weil in jeder Gitterzelle nur ein einziger Punkt liegen kann, denn sonst wäre vorher bereits ein kleinerer Abstand gefunden worden, müssen also auch nur höchstens 25 Punkte geprüft werden. Sofern in diesem Bereich keine Punkte liegen, kann P bedenkenlos in die bestehende Hashtabelle eingefügt werden. Sind jedoch in diesem Bereich bereits weitere Punkte vorhanden, so wird der Abstand auf den neu gefundenen minimalen Abstand gesetzt. Dies hat zur Folge, dass die bisherige Hashtabelle nutzlos geworden ist, weil ihre Gitterweite nicht mehr mit übereinstimmt. Wir benötigen also eine neue Hashtabelle mit korrektem . Wir erstellen einfach eine solche Tabelle für alle Punkte bis zu P von Grund auf neu. Der Effizienz halber kann man sich beim Neuerstellen die Abstandsprüfung sparen, weil der minimale Abstand aller Punkte zu P bereits bekannt ist. Schließlich hat man nach dem Einfügen eines neuen Punktes immer eine korrekte Hashtabelle mit Gitterweite und in jedem Gitterquadrat liegt höchstens ein Punkt. LaufzeitRelevant für die Laufzeit ist lediglich die Anzahl der Einfüge-Operationen neuer Punkte. Trivialerweise muss jeder Punkt mindestens einmal eingefügt werden, also ist die Laufzeit mindestens linear. Fraglich ist jedoch, wie sich der gelegentlich vorkommende Neuaufbau der Hashtabelle auswirkt, weil hierfür alle bereits bekannten Punkte erneut eingefügt werden müssen. Hierfür ist es notwendig, die Wahrscheinlichkeit anzugeben, mit der beim Einfügen eines Punkts ein Neuaufbau erforderlich wird, und die dafür notwendigen Kosten einzuberechnen. Intuitiv sieht man, dass mit zunehmender Anzahl der Punkte der Aufwand für die Reorganisation immer größer wird, die Wahrscheinlichkeit dafür aber immer kleiner. Der Erwartungswert für die Laufzeit kann wie folgt berechnet werden: Die Wahrscheinlichkeit dafür, dass der Punkt beim Einfügen einen kleineren Abstand erzeugt, ist gleich , denn dafür müsste einer der 2 Punkte sein, die diesen Abstand zueinander haben. Definieren wir nun die Zufallsvariable . Sie sei 1, falls beim Einfügen des Punkts ein kleinerer Abstand entsteht, und sonst 0. Dann gilt: Die Gesamtanzahl der Einfügeoperationen ist , also die Anzahl der eingefügten Punkte plus die Anzahl der Einfügeoperationen durch die Neuorganisationen der Hashtabelle. Für den Erwartungswert gilt aufgrund dessen Linearität: . Das heißt, die Gesamtanzahl der erwarteten Einfügeoperationen ist lediglich gleich . Insgesamt ist die erwartete Laufzeit somit linear, liegt also in . Größter Abstand von Punkten in der EbeneRotating calipers AlgorithmusDer Rotating calipers Algorithmus ist danach benannt, dass ein Messschieber um die Außenseite eines konvexen Polygons gedreht wird. Jedes Mal, wenn ein Messschenkel flach an einer Seite des Polygons liegt, bildet es ein antipodales Punktpaar, wobei der Punkt oder die Seite den entgegengesetzte Messschenkel berührt. Die vollständige Drehung des Messschiebers um das Polygon erkennt alle antipodalen Punktpaare und bestimmt das Punktepaar mit dem größten Abstand. Um den Algorithmus auf beliebige Punkte in der Ebene anwenden zu können, muss erst die konvexe Hülle der Punkte bestimmt werden. Dafür wird die Laufzeit benötigt. Zwei Punkte mit maximalem Abstand müssen auf den Rand des konvexen Polygons liegen, das die konvexe Hülle bildet. Der Algorithmus beginnt mit den Punkten und und berechnet den Flächeninhalt der Dreiecke . Zunächst wird gesetzt und so lange erhöht, wie der Flächeninhalt zunimmt. So wird der antipodalen Punkt für bestimmt. Auf ähnliche Weise wird der antipodale Punkt für bestimmt wird, indem der Flächeninhalt der Dreiecke berechnet wird und der Index weiter erhöht wird, so lange der Flächeninhalt zunimmt. Diese Schritte werden mit den anderen Punkten wiederholt, bis der Index erreicht ist, also ist. Die Abstände der antipodalen Punktpaare werden berechnet und mit dem größten bisher gefundenen Abstand verglichen. Die Laufzeit für die Berechnung der Flächeninhalte und Abstände liegt in . Insgesamt ergibt sich die Laufzeit . ProgrammierungDas folgende Computerprogramm in der Programmiersprache C++ zeigt eine Implementierung des Rotating calipers Algorithmus. Bei der Ausführung des Programms wird die Methode main verwendet, die das Punktepaar und den kleinsten Abstand zwischen dem Punktpaar das auf der Konsole ausgibt.[2] Die Funktion getConvexHull bestimmt die konvexe Hülle der Punkte mit dem Graham-Scan-Algorithmus. Die Funktion getOrientation bestimmt die Orientierung der Dreiecke mithilfe des Flächeninhalts.
Literatur
Einzelnachweise |