Minimaler Spannbaum SS12

Aus ProgrammingWiki

< AuK
Wechseln zu: Navigation, Suche

Loading
Von Christopher Voigt und Daniel Müssig


Minimale Spannbäume (englisch: Minimal Spanning Tree, Abkürzung: MST) können zum lösen vieler Probleme genutzt werden. Ein Problem, dass man mit MST lösen kann, ist zum Beispiel das Verbinden mehrerer Inseln mit Brücken. Man möchte, dass alle Inseln miteinander verbunden sind und die Brücken minimale Länge haben und damit minimale Kosten entstehen. Dabei sollen die Inseln so verbunden werden, dass man alle Inseln über die Brücken bereisen kann und keine redundanten Brücken entstehen. Redundante Brücken sind Brücken mit denen man eine Insel erreicht, die man auch über einen anderen ggf. längeren Weg hätte erreichen können. Längerer Weg heißt in diesem Fall, dass man über (eine) andere Brücke(n) reisen muss, um die Insel zu erreichen.


Inhaltsverzeichnis

Spannbäume

Graph

Im Folgenden soll eine Einführung in die Begriffe und Grundvoraussetzungen für MST gegeben werden. Die Begriffe werden dabei anhand des obigen Beispiels erklärt.
Im Allgemeinen hat man $n$-Knoten die man zu einem Spannbaum verbinden möchte. Wir haben also $n$-Inseln die miteinander verbunden werden sollen. Dazu benötigt man immer $n-1$ Kanten (Brücken).
Man geht immer von einem zusammenhängenden, gewichteten und ungerichteten Graphen $G=(V,E)$ aus. $V$ ist die Menge der Knoten und $E$ ist die Menge der Kanten des Graphen. In unserem Beispiel also alle möglichen Brücken. Jede Kante $(u,v)\in E$ besitzt ein Gewicht $w(u,v)$ (deshalb gewichtet), dass die Länge (auch Kosten genannt) angibt. Ein Graph $G$ ist ungerichtet, wenn man für eine Kante $(u,v)$ direkt von $u$ nach $v$ und umgekehrt kan. Das heißt also, dass es innerhalb des Graphen keine Einschränkung der Richtungen gibt. Ein ungerichteter Graph heißt zusammenhängend, wenn für alle Knoten gilt, dass es zu je zwei beliebigen Knoten $u$ und $v$ einen ungerichteten Weg gibt mit $u$ als Startknoten und $v$ als Endknoten.
Die Kante $(u,v)$ ist die Kante, die die beiden Knoten $u$ und $v$ verbindet. Ist $S$ eine azyklische Teilmenge $S \subseteq E$ die alle Knoten verbindet so ist dies ein Spannbaum. Azyklisch bedeutet, dass sich keine Kreise bilden dürfen. Da dies eine nötige Bedingung für Bäume ist. Der Spannbaum ist eine Sonderform des Baums, denn es ist ein Baum der einen Graphen aufspannt.

Minimale Spannbäume

minimaler Spannbaum

Die azyklische Teilmenge $T \subseteq E$, die alle Knoten miteinander verbindet, ist ein Spannbaum. Ist das Gesamtgewicht minimal so ist dies ein minimaler Spannbaum.

$$w(T)=\sum_{(u,v)\in{}T}{w(u,v)}$$

Scheme-Prozedur zur Berechnung des Gewichts.

Auf der rechten Seite ist ein minimaler Spannbaum zu sehen. Die roten Kanten sind die Kanten des minimalen Spannbaums, die grauen Kanten, sind die Kanten, die vom Graphen nicht benötigt werden.

Zur Bestimmung minimaler Spannbäume gibt es zwei bekannte Algorithmen. Einen von Kruskal und einen von Prim. Beide haben eine Laufzeit unter Verwendung binärer Heaps von $\mathcal{O}(E\lg{}V)$. Der Prim-Algorithmus läuft jedoch effektiver unter Verwendung von Fibonacci-Heaps mit einer Laufzeit von $\mathcal{O}(E+V\lg{}V)$. Dies ist eine Verbesserung unter der Vorraussetzung, dass $|V|$ wesentlich kleiner ist als $|E|$.

Beide Algorithmen sind Greedy-Algorithmen

Beispiel

Graph Kanaren

$G=(V,E)$
$V=\{A, B, C, D, E, F, G\}$
$E=\{(A, B), (A, C), (A, D), (A, F), (A, G),$
         $(B, C), (B, E),$
         $(C, D), (C, E),$
         $(D, E), (D, F),$
         $(E, F), (E, G),$
         $(F, G)\}$

Gewicht der Kanten (in km):
$w(A, B)=67$   $w(A, C)=58$   $w(A, D)=90$   $w(A, F)=386$   $w(A, G)=390$
$w(B, C)=60$   $w(B, E)=202$
$w(C, D)=28$   $w(C, E)=154$
$w(D, E)=62$   $w(D, F)=217$
$w(E, F)=117$   $w(E, G)=171$
$w(F, G)=16$

Aufgabe 1
Der Graph zeigt die Kanarischen Inseln, diese Inseln sollen durch Fähren verbunden werden. Dabei sollen die Fährverbindungen so billig wie möglich sein. Es ist davon auszugehen, dass je kürzer die Entfernung ist, desto billiger ist die Fährverbindung. Es muss einen Weg zwischen je zwei Inseln geben, direkte Verbindungen sind nicht notwendig. Die Menge der Kanten sind die möglichen Fährverbindungen.
Wie viele Fährverbindungen sind notwendig? Welche Verbindungen sollten gewählt werden? Wie groß ist die Gesamtstrecke der Fährverbindungen?

Grundbegriffe

Schnitt

Cut-Property

Ein Schnitt in einem verbundenen Graphen ist eine Teilmenge $S$ von Kanten, so dass sie mit $G \setminus S$ nicht verbunden ist.

Kreuzen

Wenn einer der Endpunkte einer Kante $(u,v) \in{} E$ in $S$ und der Andere in $V \setminus{} S$ liegt, so kreuzt diese Kante den Schnitt $(S, V\setminus{}S)$.

Respektieren

Wenn keine Kante von $A \in{} E$ den Schnitt kreuzt, so respektiert der Schnitt die Kantenmenge $A$.

Leichte Kante

Eine Kante wird als leichte den Schnitt kreuzende Kante bezeichnet, wenn sie das geringste Gewicht aller den Schnitt kreuzenden Kanten hat.

Sichere Kante

$G=(V,E)$ ist ein ungerichter, zusammenhängender und gewichteter Graph. $A$ ist eine Teilmenge von $E$ und gehört zu einem minimalen Spannbaum von $G$. Weiterhin ist $(S,V\setminus{}S)$ ein Schnitt von $G$ der außerdem $A$ respektiert. Dann ist die Kante $(u,v)$ für A sicher, wenn diese Kante eine leichte den Schnitt $(S, V\setminus{}S)$ kreuzende Kante ist.

Zyklus

Ein Zyklus in einem verbundenen Graphen ist eine Möglichkeit von einem Knoten $u \in{} V$ über beliebig viele Kanten wieder zum Knoten $u$ zu gelangen.

Wichtig! Dann ist die Baumeigenschaft nicht mehr hergestellt!

Es muss also vermieden werden, dass sich während der Erzeugung eines minimalen Spannbaums Zyklen bilden.

Algorithmen zum Bilden minimaler Spannbäume

Generischer Algorithmus

Im generischen Algorithmus ist die Greedy-Strategie verarbeitet. Dies bedeutet, dass in jedem Schritt eine Kante dem Baum hinzugefügt wird.

Idee

$A$ ist eine Kantenmenge und wird vom Algorithmus verarbeitet. Dabei ist $A$ vor jeder Iteration eine Teilmenge eines minimalen Spannbaums. Während der Laufzeit des Algorithmus wird in jedem Schritt eine Kante $(u,v)$ bestimmt, sodass auch $A\cup{}{(u,v)}$ eine Teilmenge eines minimalen Spannbaums ist. $A$ muss dabei immer azyklisch sein, damit der Algorithmus, wenn er terminiert $A$ ein Spannbaum ist. Solange der Algorithmus ausgeführt wird, ist der Graph $G_{A}=(V,A)$ ein Wald. Die Zusammenhangskomponenten des Waldes sind Bäume. Diese Bäume können auch nur aus einem einzigsten Knoten bestehen. Dies ist zum Beispiel zu Beginn der Fall. Zu diesem Zeitpunkt gibt es $|V|$ Bäume. Die while-Schleife wird $|V|-1$ mal ausgeführt, da ein Spannbaum aus $Knoten - 1 Kanten$ besteht. Nach jedem Schleifendurchlauf verringert sich die Anzahl der Bäume im Wald um eins. Sobald der Wald aus nur noch einem Baum besteht terminiert der Algorithmus.

Pseudocode

Generischer_minimaler_spannbaum(G, w)
$A\leftarrow{}\emptyset{}$
while $A$ kein Spannbaum
   do bestimme sichere Kante $(u,v)$ für $A$
      $A\leftarrow{}A\cup{}{(u,v)}$
return $A$



Algorithmus von Kruskal

Joseph Kruskal (1928-2010)

Joseph Bernard Kruskal

Joseph Kruskal war ein US-amerikanischer Mathematiker und Statistiker. Er hat an der Universität von Chicago und der Princeton Universität studiert, wo er 1954 mit der Dissertation Theory of Well-Quasi-Ordering unter Roger Lyndon und Paul Erdős promoviert hatte.

Von ihm stammt der nach ihm benannte Algorithmus zum Bilden minimaler Spannbäume von 1956.


Idee

Basierend auf dem generischen Algorithmus funktioniert der Algorithmus nach Kruskal nach folgendem Prinzip:

  1. Nimm die kleinste Kante (u,v) aus E(G).
  2. Prüfe ob die Kante für den Spannbaum nützlich ist.
  3. Füge die Kante dem Baum hinzu.

Dieses Verfahren nennt man auch die FIND-UNION-Methode.

Verständnis-Aufgabe: Applet Kruskal-Algorithmus
Hinweis: In der Hochschule funktioniert dieser Link nur über einen Proxy wie kproxy.com.

FIND-UNION-Methode

Bildung von LEADER-Ketten

Der Algorithmus von Kruskal führt zwei Operationen aus: Er testet ob sich 2 verschiedene Knoten im selben Teilbaum befinden oder nicht und verbindet 2 Teilbäume miteinander.
Man nennt diese Operationen FIND und UNION.

Die FIND-Operation
Hier wird die kleinste Kante aus $E$ genommen und geprüft, ob ihre beiden Enden sich im selben Teilbaum befinden oder nicht. Ist dies der Fall ist die Kante unnütz, da das hinzufügen lediglich einen Kreis oder Zyklus im Baum erschaffen würde.
Befinden sich jedoch beide Enden in verschiedenen Teilbäumen, so kann man die Kante zum Baum hinzufügen ohne einen Kreis zu erzeugen.

Wie erkennt man ob sich beide Enden im selben Teilbaum befinden?

Dafür gibt es eine einfache Lösung. Man übergibt den Knoten bei ihrer Initialisierung eine Variable, die sogenannte LEADER- oder PARENT-Variable. Am Anfang initialisiert sich jeder Knoten selbst als sein LEADER, sodass die Frage nach dem LEADER immer den Knoten selbst zurückgibt.

Die UNION-OPERATION
Hierbei wird als erstes die LEADER-Variable des einen Endknotens auf den anderen Endknoten gesetzt. Dabei entstehen Ketten, welche die Suche nach einer geeigneten Kante ermöglichen. Wenn zwei Endknoten einer Kante sich in der selben Kette befinden, kann die Kante nicht von Nutzen sein, da ein Kreis oder Zyklus entstehen würde.

Nachdem die Kante gelinked wurde wird sie dem Baum hinzugefügt.

Pseudocode

Aus der Idee lässt sich nun folgender Pseudocode entwickeln:

$T \leftarrow$ {}
for alle $v$ aus $V[G]$
    $v = Knoten(v)$;
while $E[G] \neq$ {}
    Nimm die kleinste Kante aus $E[G]$.
    if ($Leader(u) \neq Leader(v)$)
        then Füge die Kante $(u,v)$ dem Baum $T$ hinzu.
        else Nimm die nächst kleinere Kante aus $E[G]$.
return $T$;

Implementierung

Am Beispiel vom Anfang:


Das Gewicht des minimalen Spannbaums lässt sich mit der oben erläuterten Scheme-Prozedur berechnen.


Algorithmus von Prim

Algorithmus von Prim Animation

Der Jarnik-Prim-Algorithmus für minimale Spannbäume ist dem Dijkstra Algorithmus für kürzeste Wege sehr ähnlich. Beginnend bei einem zufälligen Startknoten $s$, wächst der Baum zu einem minimalen Spannbaum durch das hinzufügen eines Knoten nach dem anderen.

Idee

Bei jeder Iteration ist $S$ die Menge der bereits zum minimalen Spannbaum hinzugefügten Knoten und der Schnitt $E'$ ist die Menge der Kanten, die genau einen Endpunkt in $S$ haben. In jeder Wiederholung wird eine Kante minimalen Gewichts dem Baum hinzugefügt. Die größte Herausforderung ist es die Kante effizient zu finden.

Verständnis-Aufgabe: Applet Prim-Algorithmus
Hinweis in der Hochschule funktioniert dieser Link nur über einen Proxy wie kproxy.com.

Allgemeiner Pseudocode

$s$: Startknoten $(s \in V)$
$Q$: Prioritätswarteschlange
$π[u]$: Elternknoten von Knoten $u$ im Spannbaum
$Adj[u]$: Adjazenzliste von $u$ (alle Nachbarknoten)
$wert[u]$: Abstand von $u$ zum entstehenden Spannbaum

allgprim(G,w,s)
$Q \leftarrow V$
for all $u \in Q$
    $wert[u] \leftarrow ∞$
    $π[u] \leftarrow null$
$wert[s] \leftarrow 0$
while $Q != \emptyset$
    $u \leftarrow$ extract_min($Q$)
    for all $v \in Adj[u]$
        if $v \in Q$ and $w(u,v) < wert[v]$
            then $π[v] \leftarrow u$
                $wert[v] \leftarrow w(u,v)$

Pseudocode einer Scheme-Prozedur

Der Folgende Pseudocode soll die Scheme-Prozedur veranschaulichen. Da diese ohne Seiteneffekte arbeitet wird bei jeder Iteration die Menge $S$ und $E'$ neu bestimmt. Die Prozedur verwendeteKnoten erstellt die Menge $S$ und die Prozedur moeglicheKanten erstellt die Menge $E'$. Als letztes sucht die Prozedur kuerztKante die Kante mit den minimalen Kosten. Dise wird dann dem MST hinzugefügt.
Anmerkung Der folgende Algorithmus ist keine effiziente Implementierung. Dies liegt hauptsächlich daran, dass diese Prozdur Seiteneffektfrei sein soll. Desweiteren soll dies zeigen, dass minimale Spannbäume nur mit Listen und ohne Seiteneffekte erstellt werden können.
Am schnellsten läuft der Algorithmus mit Fibonacci-Heaps.

prim($V$,$E$,$ls$)
if length($V$) $-$ $1$ == length($ls$)
  then return $ls$
  else 
    if $ls$ == $null$
      then $ls$ $\leftarrow{}$ kuerztKante(erstesElement($V$))
      prim($V$,$E$,$ls$)
      else $vls$ $\leftarrow{}$ verwendeteKnoten($ls$)
        $mls$ $\leftarrow{}$ moeglicheKanten($vls$)
        $ls$ $\leftarrow{}$ $ls +$ kuerztKante($mls$)
        prim($V$,$E$,$ls$)

Implementierung

Das Gewicht des minimalen Spannbaums lässt sich mit der oben erläuterten Scheme-Prozedur berechnen.

Algorithmus von Sibeyn

Die hohe Kapazität und der niedrige Preis von PC Hardware machen es möglich große Datenmengen zu verarbeiten. Die billige Hardware bringt jedoch eine hohe Speicherzugriffswartezeit mit sich. Um diese zu verringern werden "External Memory Algorithms" (Externer Speicher Algorithmus) verwendet. Ein solcher ist der Algorithmus von Sibeyn, der dem Algorithmus von Borůvka zum berechnen eines minimalen Spannbaums ähnlich ist.
Der Algorithmus von Sibeyn dient dazu, die Knoten von $n$ auf $n'$ zu reduzieren.
In jeder Iteration wird ein zufälliger Knoten $u$ aus dem Graphen entfernt. Bis dahin werden jedoch noch einige Schritte durchgeführt.Als erstes wird die leichteste Kante $(u,v)$ zu $u$ gesucht. Durch die "cut-property", die in den meisten MST Algorithmen auch verwendet wird, muss $(u,v)$ eine Kante des minimalen Spannbaums sein. Dann wird $(u,v)$ ausgeben, aus $E$ entfernt und zusammmengezogen. Alle anderen Kanten $(u,w)$ werden durch die Kanten $(v,w)$ ersetzt. Wenn die ursprüngliche ID jeder Kante gespeichert wurden ist, kann aus der Ausgabe der minimale Spannbaum erstellt werden.

Anwendungen

Den minimalen Spannbaum kann man zum lösen vieler anderer Graphenprobleme verwenden. Im Folgenden sollen das Steinerbaumproblem und das Problem des Handelsreisenden erläutert werden.

Steinerbaumproblem

Jakob Steiner (1796 – 1863)

Jakob Steiner war ein Schweizer Mathematiker und arbeitete vor allem in der Geometrie.
Ein Steinerbaum ist ein minimaler Spannbaum eines Teilgraphen von $G$, dabei werden die Knoten $V$ eingeschränkt. Auf unser Beispiel mit den Fähren auf den Kanarischen Inseln angewendet:
Einige Inseln sind unrentabel, da niemand sie besuchen möchte. Nun ist der Steinerbaum, der minimale Spannbaum der restlichen Inseln.
Das Steinerbaumproblem gehört zu den 21 NP-vollständigen Problemen, von denen Richard Karp 1972 die Zugehörigkeit zu dieser Klasse zeigen konnte.
Gegeben ist ein nicht-negativ gewichteter, ungerichteter und zusammenhängender Graph $G=(V,E)$ und eine Menge $S$ von Knoten. Gesucht ist eine minimal-gewichtete Teilmenge $T$ der Kanten, die die Knoten in $S$ verbinden. Diese Teilmenge $T$ wird minimaler Steinerbaum genannt. Die Knoten des Steinerbaums sind die Menge $U$ mit $S\subseteq{}U\subseteq{}V$. Dies lässt sich dadurch begründen, dass durch die hinzunahme von Knoten aus $V\setminus{}T$ das Gewicht des minimalen Spannbaums verringert werden kann. Diese Knoten werden Steinerknoten oder Steinerpunkte genannt.
Das Problem des minimalen Spannbaums, ist der Spezialfall wenn $S=V$ ist.

Problem des Handlungsreisenden (TSP)

Das TSP ist eines der am meist untersuchten Probleme der Informatik. Es gehört wie das Steinerbaum-Problem zu den 21 NP-vollständigen Problemen. Ziel ist es, eine Tour für den Besuch mehrerer Orte so zu wählen, sodass die gesamte Reisestrecke des Handlungsreisenden nach der Rückkehr zum Ausgangsort möglichst kurz ist.

Für dieses Problem gibt es einige konkrete Lösungsverfahren, wie z.B. Branch-and-Bound oder Branch-and-Cut.

Man kann sich aber auch mit verschiedenen Heuristiken der optimalen Tour nähern.

Passend zu unserem Thema bietet sich die MST-Heuristik an. Sie dient dazu, das metrische Problem des Handlungsreisenden (TSP) zu approximieren. Dabei geht man wie folgt vor:

  1. Erzeuge einen minimalen Spannbaum für den zugrundeliegenden ungerichteten Graphen
  2. Verdopple jede Kante im resultierenden Spannbaum, was zu einem Eulerschen Graphen führt
  3. Wähle einen beliebigen Startknoten und folge den Kanten des verdoppelten Spannbaums im Sinne eines Eulerkreises. Bereits besuchte Knoten werden dabei durch die direkte Kante zum folgenden Knoten übersprungen, sofern es sich nicht um den letzten Knoten des Kreises handelt.


Anwendung in der Netzwerktechnik

Um kreisende Pakete im Netzwerk zu vermeiden, wendet man das Prinzip des minimalen Spannbaums an.

Dabei ermitteln die Switche, durch das Senden von PING-Signalen, die Verbindungsgeschwindigkeit untereinander. Durch die Netzwerkstruktur ist es möglich, dass diese dann als ungerichteter gewichteter Graph angesehen werden kann.

Um eine Schnelle Verbindung von A nach B zu erhalten, werden die teuren Switch-Verbindungen zeitweise deaktiviert und es entsteht ein minimaler Spannbaum.

Genaueres folgt im Modul Rechnernetzwerke 1.

Komplexaufgabe

  1. Finden Sie den minimalen Spannbaum im folgenden Graphen:
    G = (V, E)
    V = {A, B, C, D, E}
    E = {AB 6, AC 4, AD 2, BC 3, CD 2, CE 9, DE 8}
  2. Machen Sie sich die Unterschiede der Bildungsstrategien zwischen dem Kruskal-Algorithmus und dem Prim-Algorithmus klar.
    1. Wenden Sie den Kruskal-Algorithmus auf den gegebenen Graphen an.
    2. Wenden Sie den Prim-Algorithmus auf den gegebenen Graphen an. Wählen Sie einen beliebigen Startknoten.
  3. Berechnen Sie nun das Gewicht des oben gefundenen minimalen Spannbaums.
  4. Das Problem des Handlungsreisenden wird im Beleg vertieft. Schon angefangen? ;-)

Literatur

Algorithmen --- Robert Segdewick
Algorithmen - Eine Einführung --- Th.H.Cormen | Ch.E.Leiserson | R.Rivest | C.Stein
Data Structures and Algorithms - The Basic Toolbox --- K. Mehlhorn | P. Sanders
Engineering an external memory minimum spanning tree algorithm --- R. Dementiev | P. Sanders | D. Schultes | J. Sibeyn.

Persönliche Werkzeuge