Teile und Herrsche 2 SS09

Aus ProgrammingWiki

< AuK
Wechseln zu: Navigation, Suche

Loading
Diese Seite stellt eine inhaltliche Fortsetzung des Themas Teile und Herrsche 1 dar.

Autoren:

Markus Fleck (simaflec@stud.hs-zigr.de)

Manuel Mauky (simamauk@stud.hs-zigr.de)

Alle Seiten, die zu diesem Lehrgebiet gehören:

Inhaltsverzeichnis

Einführende Worte

Auf dieser Seite werden, die Algorithmen Binäre Suche, Strassens-Matrix-Multiplikation und den Multiplikation's Algorithmus von Karatsuba vorgestellt.

Dabei findet ihr verschiedene Implementierungen der Algorithmen in Java und Scheme.

Übungsaufgaben

Die Übungsaufgaben zu diesen Themen findet ihr hier Aufgaben - TuH2.

Ihr findet aber auch im Text Hinweise und Hilfestellungen zu etwaigen Problemen auf die man während der Bearbeitung stoßen könnte. Ihr findet zusätzlich Programmierbeispiele in Java mit einigen Anmerkungen auf folgender Seite, TuH2_java.

Vorlesungs Folien

AuK_TuH2_presentation_wikiversion.pdf (0.3 MB)

Binäre Suche

Funktionsweise

Jeder war bestimmt schon einmal in einer Situation, in der man aus einer großen Menge von Informationen eine bestimmte wiederfinden musste. Als Beispiel dient das Suchen einer Seite anhand Ihrer Seitenzahl in dicken Büchern. Die meisten Menschen schauen in das Inhaltsverzeichnis und erhalten die Seitenzahl der gesuchten Information. Dann schlägt man das Buch in der Mitte auf und schaut ob die Seitenanzahl der Seite, auf der man sich nun befindet, größer oder kleiner ist, als die Seitenzahl unserer gesuchten Seite. Abhängig vom Ergebnis nimmt man die vordere oder hintere Hälfte des Buches und schlägt von dieser die Hälfte auf und vergleicht wieder... das wiederholt man solange bis die gesuchte Seite auftaucht.

Der Trick besteht also darin, den Suchraum stets zu halbieren und festzustellen, in welcher Hälfte unsere gesuchte Information wohl zu finden ist. Diese Hälfte wird dann wieder halbiert und es wird wieder verglichen und so weiter... . Um nun auf einen konkreten Algorithmus und dessen Effizienzanalyse hinzuarbeiten, reduzieren wir das Problem auf eine aufsteigend sortierte Liste mit Integerzahlen.

Also nun zu unserer Liste:

Wie erwähnt, muss die Liste bereits zu Beginn geteilt werden, dies geschieht beim Element mit dem Index k, die Mitte der Liste ist also . Wobei man davon ausgehen kann, das die Liste nicht zwangsläufig ungerade zahlig viele Elemente besitzt, sodass man ein Element in der Mitte ausmachen kann. Also müssen wir unser k folgendermassen korrigieren somit nehmen wir bei der Division den ganzzahligen Wert, nach unten gerundet.

Nun haben wir eine linke Teilliste und eine rechte Teilliste oder anders dargestellt:


Jetzt wird unser Zielwert x mit dem ersten Element der rechten Liste verglichen, abhängig vom Ergebnis wird mit oder weiter gearbeitet bzw. das Element ausgegeben. Natürlich kann bereits zu Beginn der Elementarfall eintreten das ist.

Fassen wir es noch einmal zusammen:



Übungsaufgabe: Probieren Sie die binäre Suche anhand eines Beispiels aus. Zeichnen Sie den Suchbaum auf.

Siehe Aufgabe1(a) Aufgaben_-_TuH2#Aufgabe_.28a.29_-_Durchrechnen


Vergleich mit der herkömmlichen sequenziellen Suche

Betrachten wir nun noch die einfachste Art des Suchens. Man nimmt eine Liste L mit der Länge n, ein gesuchtes Element x und beginnt dieses mit jedem Element der Liste zu vergleichen. Dieses Verfahren besitzt linearen Aufwand. Wobei davon auszugehen ist, das die Wahrscheinlichkeit, das x mit dem Element a aus L übereinstimmt für jedes Element gleich ist.

In manchen Situationen geht es auch noch etwas effizienter schaut euch die Interpolationssuche einmal an.


Wie sieht der Algorithmus aus?

Im Folgenden wird der Algorithmus, im Code als BinSuch betitelt, in Scheme und Java gezeigt. Man kann den Algorithmus in iterativer und rekursiver Form angeben.

Zu erst benötigen wir wieder die Prozedur "teillisten2", welche im Kapitel "Teile und Herrsche 1" bei Mergesort bereits behandelt wurde.


Die Binäre Suche in Scheme:

Zum Testen der Suche definieren wir uns eine Liste. Der Einfachheit halber wollen wir diese hier explizit angeben - zum selbstständigen Arbeiten können die Prozeduren "zzls" zum Erstellen einer Zufallszahlenliste und "mergesort" zum Sortieren selbiger verwendet werden. Die Prozeduren sind am Ende des Kapitels noch einmal aufgeführt und wurden in der Vorlesung "Teile und Herrsche 1" bereits behandelt.

Wir möchten das Element 23 in der Liste suchen:

Die Prozedur setzt uns davon in Kenntniss, dass das Element gefunden wurde. In der Praxis ist diese Aussage aber höchst unbefriedigend. Wünschenswert ist die Ausgabestelle, an welcher das Element gefunden wurde. Diese Funktionalität soll nun ergänzt werden. Ausserdem möchten wir einen Zähler implementieren, welcher die Anzahl der benötigten Rekursionsschritte aufzeichnet. Diese Information können wir im Anschluss für eine empirische Aufwandsanalyse des Verfahrens verwenden.

Die nötigen Modifikationen können wie folgt aussehen:

Dabei wird davon ausgegangen, dass eine Zählervariable calls existiert, welche bei jedem Rekursionsschritt um mit (set! calls (+ calls 1)) inkrementiert wird. Ausserdem wurde eine Variable index eingeführt, welche der Feststellung des Elementindexes bei erfolgreicher Suche dient. In diesem Fall wird mittels der Scheme-Sprachelemente sting-append und number->string ein passender Ausgabestring erzeugt. Andernfalls erscheint der Hinweis auf Nichtvorhandensein des Elements.

Aus Gründen der bequemeren Bedienbarkeit und um Fehler zu vermeiden, erstellen wir eine Prozedur binaersuche2, aus welcher heraus die eben modifizierte Variante des Suchverfahrens aufgerufen wird. Diese Prozedur stellt zudem sicher, dass sowohl index als auch calls vor der Ausführung wieder auf 0 gesetzt werden. Würde dies nicht passieren, so müsste man bei mehrmaligem Aufrufen der Suchprozedur jedes mal die Variablen per Hand auf 0 zurücksetzen.



Die binäre Suche soll nun den Vergleich mit der klassichen sequenziellen Suche antreten, bei welcher, ausgehend vom kleinsten Element, jedes Element daraufhin überprüft wird, ob es das gesuchte Element ist. Wenn nicht, so wird mit dem Folgeelement weitergemacht. Hat man die komplette Liste durchsucht, ohne das gesuchte Element gefunden zu haben, so ist das Element nicht in der Liste enthalten.

Der Schemecode der sequenziellen Suche sieht folgendermaßen aus:

Auch hier wird die Anzahl der Rekursionsschritte für eine empirische Analyse aufgezeichnet. Da das Verfahren am Anfang der Liste beginnt, entspricht der Rekursionszähler im Fall eines gefundenen Elements gleichzeitig dem Index des Elements. Zusätzlichen Programmieraufwand für die Bestimmung der Position des gesuchten Elements kann damit gespart werden.



Übungsaufgabe: Führen Sie eine empirische Analyse der binären Suche und der sequenziellen Suche durch und vergleichen Sie die Ergebnisse.

Siehe Aufgabe1(b) Aufgaben_-_TuH2#Aufgabe_.28b.29_-_Empirische_Analyse


Komplexitätsverhalten

Best Case

Es liegt nahe, dass es sich bei beiden Suchalgorithmen im besten Fall um einen konstanten Aufwand handelt. Beim sequenziellen Suchen finden wir das Element am Anfang der zu durchsuchenden Liste und bei der binären Suche in der Mitte der Liste.

Diese Erkenntnis ist für die Praxis eher irrelevant 
von daher sollte man sich das Verhalten 
im Average- und Worst Case genauer betrachten.

Average Case & Worst Case

In diesem Abschnitt wollen wir die binäre Suche und die sequenzielle Suche auf ihren Aufwand hin untersuchen.

Bei der sequenziellen Suche fällt bereits durch scharfes Hinsehen auf, das es sich im schlechtestem Fall um linearen Aufwand handelt. Denn die Laufzeit hängt von der Anzahl der Elemente n innerhalb der Liste ab. Also egal ob das Element gefunden wird. Im Durschnitt hingegen kann die Suche lediglich Vergleiche benötigen, wobei die Gleichverteilung aller Listen Elemente annehmen muss. Somit kommt ebenfalls ein linearer Aufwand zustande.

Die Rekursionsgleichung für die binäre Suche sieht folgender Maßen aus.

Wie kommt dieses dazu? Um diese Frage zu beantworten, betrachten wir die Schritte folgendermaßen:

  • Für diese Untersuchung nehmen wir an, das die Schritte in einem Aufruf unserer rekursiven Prozedur einen konstanten Aufwand besitzt. In den Übungsaufgaben sollten sie sich mit dieser Annahme noch einmal beschäftigen.
  • Wir wissen, das der Suchraum bei jedem rekursiven Aufruf halbiert wird, und auf eine der beiden Hälften unser Algorithmus erneut angewendet wird. Dies wird durch beschrieben.

Unter der Annahme, dass die Länge der Liste n entspricht, wird sehr schnell deutlich, wie oft der Algorithmus rekursiv hochstens durchlaufen werden kann, bevor das Element gefunden wird oder die Abbruchbedingung eintritt. Dies tritt im WorstCase nach Schritten ein, da die Liste nur -mal halbiert werden kann. Daraus ergibt sich die Beziehung .

Daraus folgt die asymptotische Ordnung von:

Kurz gesprochen heißt dies nun, dass wir für eine Liste mit 1024 Elementen garantieren können, dass wir nach spätestens Schritten das Suchergebnis bekommen. Bei einer Liste mit ungefähr 1000000 Elemente mit 20 Schritten. Auf eine graphische Darstellung wird an dieser Stelle verzichtet. Da sie sich mit einer empirischen Analyse sowie der Darstellung mittels Gnuplot in den Übungsaufgaben auseinander setzen können.


Übungsaufgabe: Schauen Sie sich die Schemeimplementation der binären Suche etwas genauer an und finden Sie heraus, warum der Aufwand dieser Implementation nicht logarithmisch ist. Entwerfen Sie eine verbesserte Version, welche tatsächlich logarithmischen Aufwand besitzt.

Siehe Aufgabe1(c) Aufgaben_-_TuH2#Aufgabe_.28c.29_-_Modifikation_der_Binaeren_Suche

Die Multiplikation nach Karatsuba

Wir kennen die Multiplikation aus der Schule und haben die sog. Russische Bauernmultiplikation (Multiplikation à la Russe) kennengelernt. Infolge dessen, wollen wir hier noch ein anderes Multiplikationsverfahren analysieren. Zunächst ist die Frage interessant, warum man überhaupt noch einen Multiplikationsalgorithmus benötigt, wir haben ja alle in der Schule eine ganz brauchbare Lösung kennengelernt. Doch leider hat dieser quadratischen Aufwand sprich . Das heißt konkret, dass wir für die Multiplikation von sehr sehr großen Zahlen Unmengen von Operationen benötigen. Wir gehen an dieser Stelle nicht weiter darauf ein, in der Übung könnt ihr euch mit der Analyse der Schulbuchmultiplikation auseinander setzen.

Wie funktioniert es?

Wir nehmen 2 Zahlen a und b, wir vereinbaren das deren Stelligkeit n gleich und gerade ist. Dann zerlegen wir diese beiden Zahlen in jeweils 2 gleiche Teile. Im einfachsten Fall haben wir entsprechend nur eine Operation nämlich . Betrachten wir , als Beispiel dienten uns die Zahlen 14 und 73. Die beiden Faktoren werden wie folgt zerlegt,

Wobei B für die Basis der Zahlendarstellung steht. In unserm Fall 10.

Im nächsten Schritt schau wir uns an wie die Multiplikation von a und b mit Hilfe der Ziffern aussieht.

Ruft man sich das Verfahren ins Gedächtnis, welches wir einmal in der Schule gelernt haben, stellen wir schnell fest, dass uns unser neuer Algorithmus kein besseres Verfahren liefert.

Wir haben nach wie vor lediglich 4 Multiplikationen und die Addition der Ergebnisse. Der Trick, welchen Karatsuba anwendet, sieht wie folgt aus, er nutzt lediglich 3 Multiplikationen um folgende Werte zu berechnen. Er stellt die Formel auf geeignete Weise um und erhält:

Diese Formel sieht auf den ersten Blick kompliziert aus, man stellt jedoch fest, dass gewisse Multiplikationen mehrmals auftreten. Wir fassen diese folgender Maßen zusammen:

Für unser Beispiel:

An dieser Stelle wird auch die Absicht deutlich, die Karatsuba verfolgt!
Die aufwendigeren Multiplikations-Operationen in weniger aufwendige Additions bzw. Subtraktions-
Operationen aufzuspalten. Dies ist aber noch nicht alles, was den Algorithmus so beschleunigt!

Was bringen diese drei neuen Werte? Karatsuba setzt diese Werte nun folgendermaßen in die ursprüngliche Form ein:

Betrachtet man diese zunächst unübersichtliche Gleichung etwas vereinfacht, wird ein interessanter Vorteil deutlich:

 und  werden einmal berechnet, 
aber in der Gesamtberechnung jeweils zwei mal verwendet.

Um das Zahlenbeispiel noch fertig zu berechnen,

Für 2-stellige Zahlen sieht dieses Verfahren unnötig kompliziert aus. Betrachten wir nun 4-stelligen Zahlen!

Es werden genauso die beiden Faktoren halbiert, nur mit dem Unterschied, das man nun keine Ziffern mehr hat, sondern 2-stellige Zahlen. Mit diesen lässt es sich ebenso verfahren, wie bereits oben mit den Ziffern dargestellt:



Aus diesen Schritten ergibt sich nun:

Wirklich interessant ist nun noch die Multiplikation beliebig langer Zahlen, diese kommt in allgemeiner Form wie folgt zustande:

Die Zerlegung der Faktoren:

Das Produkt mit Hilfe der 3 Multiplikationen von Zahlen der Länge :


Hinweis: Für den Karatsuba-Algorithmus ist es notwendig, dass beide Zahlen die Gleiche Stelligkeit haben und diese Stelligkeit eine Zweierpotenz ist, es muss also  
gelten: , wobei 
Um das in jedem Fall zu gewährleisten, muss bei einer Implementation des Algorithmus sichergestellt werden, dass a und b mit führenden Nullen aufgefüllt werden, falls
diese Bedingung nicht von vorn herein gegeben ist.


Übungsaufgabe: Rechnen sie die Karatsuba-Methode einmal per Hand mit den gegebenen Werten durch.

Siehe Aufgabe2(a) Aufgaben_-_TuH2#Aufgabe_.28a.29

Aufwandsbetrachtung

Wir benötigen zur Bestimmung des Aufwandes die Meistermethode. Mit dieser bestimmen wir zunächst den Aufwand der Schulbuchmethode. Dies lässt sich mit folgender rekursiven Formel darstellen .

Wir wenden den zweiten Fall der Meistermethode an:

Wenn

Die Rekursionsformel des Karatsuba Algorithmus sieht ähnlich aus,

jedoch werden wir sehen, dass die fehlende Multiplikation einen beträchtlichen Effiziensgewinn hervorruft.

Wir wenden auch hier wieder die Meistermethode an.

Zusätzliche Betrachtung

Nehmen wir uns die Aufwände der eben genannten Multiplikationsverfahren noch einmal vor, um zu sehen, wie diese sich verhalten.

  • Aufwand für die Schulbuchmultiplikation =
  • Aufwand für Multiplikation à la Russe =
  • Aufwand für Karatsubas Algorithmus =

Um den, durch die fehlende Multiplikation verursachten, gigantischen Unterschied noch einmal zu verdeutlichen, sollte man folgende Tabelle betrachten!

Die schnelle Matrix Multiplikation

Ein weiteres Beispiel für den Nutzen der "Teilen und Herrschen"-Strategie ist die Matrixmultiplikation.

Die Schulbuchmethode

Beschreibung

Die Schulbuchmethode dafür sieht vor, jedes Element der ersten Zeile der ersten Matrix, mit der ersten Spalte der zweiten Matrix zu multiplizieren und die Produkte zu summieren. Damit erhält man das Element der ersten Zeile und ersten Spalte der Ergebnismatrix. Diesen Vorgang wiederholt man nun für alle weiteren Kombinationen von Zeilen und Spalten. (Korrekt so?) Beispiel:



Für einfache, d.h. kleine Matrizen ist diese Berechnungsvorschrift für den Menschen einfach zu merken und zu benutzen. Wenn jedoch die Größe der Matrizen wächst,erkennt man schnell, dass sehr viele Einzelberechnungen durchgeführt werden müssen.

Aufwandsanalyse

Man erkennt, dass für eine (n,n)-Matrix für jedes Element der Ergebnismatrix jeweils jedes Element der entsprechenden Zeile der ersten Matrix, mit jedem Element der entsprechenden Spalte der zweiten Matrix multipliziert werden muss. Daraus ergibt sich ein Aufwand von

Strassen-Algorithmus

Beschreibung

Einen anderen Ansatz wählt der nach Volker Strassen benannte STRASSEN-Algorithmus. Bei diesem müssen die Ausgangsmatritzen zuerst in Teilmatrizen nach folgendem Muster zerlegt werden:


Die Teilmatrizen sehen folgender Maßen aus:



Die Teilmatrizen der Lösungsmatrix C erhält man durch folgende Berechnungen:



Dies alleine stellt aber noch keine Effizienzverbesserung dar, da immer noch 8 (aufwandsmäßig ungünstige) Matrizenmultiplikationen mit einem Aufwand von durchgeführt werden müssen. Die eigentliche Leistung des STRASSEN-Algorithmus liegt in der Berechnung von Hilfsmatrizen nach folgendem Muster:



Die Ergebnismatrix ergibt sich durch:

Aufwandsanalyse

Strassens Algorithmus benötigt zur Berechnung des Produkts nun nur noch 7 Matrizenmultiplikationen statt 8 wie das oben gezeigte Verfahren. Die Aufwandsanalyse ergibt:

Für die klassische Methode ergibt ein Aufwand von

Es wird ein ähnliches Ziel wie auch schon beim Karatsuba-Algorithmus verfolgt: Nach Möglichkeit "kostspielige" Multiplikationen durch "günstige" Additionen bzw. Subtraktionen zu ersetzen. So benötigt der STRASSEN-Algoritmus ganze 18 Additionen/Subtraktionen wärend die oben gezeigte Variante mit nur 4 Stück auskommt. Da der Aufwand dieser Matrizenadditionen aber lediglich in liegt, stellt dieser Tausch bei großen einen Effizenzgewinn dar.

Der praktische Nutzen des Algorithmus ist allerdings beschränkt, da die numerische Stabilität, d.h. die Empfindlichkeit gegenüber Rundungsfehlern, schlechter ist als bei der klassischen Methode.



Literatur und andere Quellen

  • Th. H. Cormen, Ch. E. Leiserson, R. Rivest, C. Stein: Algorithmen - Eine Einführung, 2.Auflage, Oldenbourg Wissenschaftsverlag GmbH 2007, ISBN 978-3-486-58262-8
  • Ch. Wagenknecht: Algorithmen und Komplexität, 1.Auflage, Carl Hanser Verlag 2003, ISBN 3-446-22314-2
Persönliche Werkzeuge