Dynamisches Programmieren SS10

Aus ProgrammingWiki

< AuK
Wechseln zu: Navigation, Suche

Autoren:

Katja Lemberg (sikalemb@hs-zigr.de)

Marlene Knoche (simaknoc@hs-zigr.de)


Inhaltsverzeichnis

Einführung

Das Ziel der dynamischen Programmierung ist die Suche nach effizienten Algorithmen für Optimierungs- und Entscheidungsprobleme. Dabei ist der Begriff „Dynamisches Programmieren“ eher unpassend, da sich der Begriff „Programmieren“ in diesem Zusammenhang auf die tabellarische Methode und nicht auf das Schreiben von Code bezieht. Besser wäre der Begriff „Dynamisches Optimieren“, da eigentlich die Optimierung des Programmablaufes angestrebt wird. Die Grundlage für die „Dynamische Programmierung“ war „Teile und Herrsche“.



Dynamisches Programmieren

Bottom up Ansatz

Dieser Ansatz besagt, dass sich die optimale Lösung eines Problems aus optimalen Lösungen von Teilproblemen des Gesamtproblems zusammen setzt, was man auch als Optimalitätsbedingung bezeichnet. Dabei werden alle Teillösungen „von unten her“ betrachtet und die Lösungen werden in eine Tabelle eingetragen. Die Berechnung jeweils aufeinander folgender Tabelleneinträge nutzt bereits vorhandene Einträge zur Berechnung. Die Entwicklung eines dynamischen Programmes kann man in vier Schritten darstellen.

  1. Charakterisieren der Struktur einer optimalen Lösung
  2. Wert einer optimalen Lösung rekursiv definieren
  3. Wert einer optimalen Lösung durch Bottom-Up-Ansatz berechnen
  4. zugehörige optimale Lösung aus schon berechneten Daten konstruieren

Auch bei der „Dynamischen Programmierung“ gibt es gewisse Schwierigkeiten. Zum einen ist die Zerlegung eines großen Problems in kleinere unabhängige und überlappungsfreie Teilprobleme meist eine Illusion und die Teilprobleme sind meist nicht ausgewogen, das heißt, dass ein besonders aufwändig zu lösendes Teilproblem den Erfolg der Methode zunichte machen kann. Die Optimalitätsbedingung muss nicht in jedem Fall erfüllt sein. Das bedeutet, dass nicht zwingend ein Zusammenfügen aller optimalen Teillösungen eine optimale Gesamtlösung ergibt. Außerdem kann die Anzahl der Teilprobleme, die gelöst werden müssten, unvertretbar hoch sein, somit wäre der Aufwand für die Anwendung der „Dynamischen Programmierung“ höher als der Aufwand für die Lösung des Gesamtproblems.

Der Berechnungsprozess wird traditionell iterativ organisiert. Es werden also die Zeilen einer entsprechenden Tabelle nacheinander ausgefüllt. Auf den ersten Blick ist diese Berechnungsmethode aus Aufwandsgründen der rekursiven vorzuziehen, da für jedes Feld der Tabelle oder Matrix mit der Form (z,s) genau ein Resultat ermittelt werden muss. Es kann bei Lösungen, die rekursiv definiert und durch rekursive Prozeduren berechnet wurden, zu Mehrfachberechnungen von Teilausdrücken kommen.

Beispiel: Fib(5) Simaknoc Fibbaum.png

Bei „Dynamischer Programmierung“ wird der Aufwand für wiederholte und somit unnötige Berechnungen vermieden, was jedoch nicht einfach so passiert. Um diese Vermeidung herbeizuführen berechnet man alle Teillösungen, also auch diejenigen, die mit der optimalen Gesamtlösung am Ende nichts zu tun, somit keinen Einfluss auf diese haben. Wesentlich problematischer als diese zusätzlichen Berechnungen ist es den rekursiven Top-Down-Ansatz in einen Bottom-Up-Algorithmus umzuwandeln. Ein Bottom-Up-Algorithmus durchläuft eine zweidimensionale Tabelle im Allgemeinen mittels zwei verschachtelter Schleifen. Deswegen kann die Umwandlung schwierig sein, da sie mentalen Zusatzaufwand erfordert und somit fehleranfällig ist. Dazu kommt das eine Lösung durch eine rekursive Beschreibung fixiert ist und sich der „Geist dagegen sträubt“ die Transformation durchzuführen.

Der Ausweg aus dieser Zwickmühle heißt „Memoizing“. Die Idee besteht darin rekursiv erzeugte Teilprobleme einmal zu berechnen und die Lösungen danach in eine Tabelle einzutragen. So kann und wird vor der Ausführung jeder Berechnung geprüft, ob der Wert schon in der Tabelle vorhanden ist. Sollte dem so sein, wird der Wert einfach übernommen, anderenfalls wird der Wert ganz einfach berechnet und danach in die Tabelle eingetragen.

Vergleich zu "Teile und Herrsche"

Simaknoc Vergleichstabelle.PNG


Loading

0/1 Rucksackproblem

Die Optimalitätsbedingung ist erfüllt, da der Gegenstand i in den bis dahin optimal gepackten Rucksack, natürlich bisher ohne i, gepackt wird. So erhält man auf jeden Fall einen optimal gepackten Rucksack, der den Gegenstand i enthält. Dadurch werden alle Gegenstände, wenn sie noch hineinpassen, in einen optimal gepackten Rucksack eingepackt.

Für Gesamtwert wert(n, k) des Rucksacks folgende rekursive Beziehung:

Die Bezeichnung wert(n,K) bezeichnet den größtmöglichen Wert des Rucksackinhaltes, wobei man am Anfang die volle Kapazität K zur Verfügung hat. Die Gegenstände werden mit 1, 2, … durchnummeriert. Der Fall wert(i,g) = wert(i-1,g) zeigt an, dass der Gegenstand i nicht in den Rucksack gepackt wurde, da der Gesamtinhalt sonst die verbliebene Kapazität überschritten hätte. Der Maximalwert, der durch die Aufnahme von Gegenständen aus 1, 2, …, i-1 erzielt worden ist, wird mit wert(i-1, g) bezeichnet und berücksichtigt die vorhandene Kapazität. Logischerweise gibt es keinen Wertzuwachs, wenn der Gegenstand i, obwohl er in den Rucksack passen würde, nicht eingepackt wird. Der dritte Fall der Definition beschreibt die Aufnahme von i, die Reduzierung der Restkapazität durch g-gi und die Steigerung des Gesamtwertes durch wi. Dabei wird nicht ausgeschlossen, dass ein höherer Gesamtwert entsteht, wenn man den Gegenstand i, obwohl man ihn hätte einpacken können, nicht einpackt. Deswegen ist die in der Definition angegebene Maximumbestimmung aus wert(i-1,g) und wert(i-1, g-gi)+wi erforderlich. Zunächst verwendet man die traditionelle Form der Implementierung der „Dynamischen Programmierung“, wobei man die rekursiv definierte Funktion wert nicht verwenden darf, aber die Überlegungen, die zu dieser führten.

Beispiel mit K = 120 Simaknoc Gegenstaende.PNG

Die Gegenstände sind absichtlich nicht nach ihrem Gewicht geordnet.

Für die Gegenstandsliste wird ein Vektor verwendet, dessen Komponenten von den Gewicht-Wert-Paaren der Gegenstände gebildet werden. Dabei soll die Nummerierung der Gegenstände wie in der obigen Tabelle bei 1 beginnen. Deswegen belegt man die 0-te Vektorkomponente mit „dummy“.



Für die Lösung wird eine Tabelle mit n+1 Zeilen, also für jeden der Gegenstände i = 1, 2, …, n eine und eine zusätzliche Zeile 0 für den Wert des anfänglich leeren Rucksackes, die Initialisierung, sozusagen den Anfangsgesamtwert 0. Die Spaltenköpfe werden von allen möglichen Gewichtssummen von 0 bis K, also im Beispiel von 0 bis 120, gebildet. Der Tabellenkörper enthält jeweils die maximalen Gesamtwerte bezogen auf die bis dahin betrachteten Gegenstände (Zeilen) und das aktuelle Gesamtgewicht (Spalte).

Simaknoc Tabelle Rucksack.jpg

Die rechte untere Ecke der Tabelle (Matrix) zeigt das gesuchte Maximum R = wert(10,120). Eine Implementierung des iterativen Verfahrens mit dieser Matrix ist unnötig speicheraufwändig und da man gemäß der rekursiven Vorschrift (7.1 Seite 101) die i-te Zeile mit Hilfe der i-1-ten Zeile berechnet, reicht es auch, wenn man die letzten beiden Zeilen, in der Prozedur zeilealt und zeileneu, bereithält. Für die Repräsentation in Scheme benutzt man vier Vektoren.


-Wird die Protokollzeile entfernt, gibt die Prozedur einfach nur das Ergebnis, in diesem Fall 183, wider.-


Aufwandsbetrachtung

Beim Betrachten der Prozedur gesamtwert-iterativ ist direkt zu erkennen, dass ein Aufwand zur Berechnung der Tabelle in

erforderlich ist.

In Anbetracht des uniformen Komplexitätsmaßes kann man K als Konstante auffassen, wodurch sich ein linearer Aufwand ergibt. Allerdings handelt es sich dabei nicht um Tatsachen, da für alle n Gegenstände gilt. Damit hat K einen direkten Bezug auf n.

Im Folgenden untersuchen wir die Eingabelänge einer beliebigen Instanz des 0/1 Rucksackproblems.

Die Eingabe setzt sich aus 2n+1 natürlichen Zahlen zusammen:

und K in Binärdarstellung.

Zudem definieren wir

Die Eingabelänge wird durch nach oben beschränkt.

Angenommen, K lässt sich in der Form darstellen und, so liegt die Eingabelänge in und die Rechenzeit des Algorithmus ist exponentiell, nämlich .

Die Beschränkung für K und damit auch für sämtliche durch Polynom in n gilt für viele Anwendungen. So zum Beispiel , wodurch sich eine tatsächliche Rechenzeit in ergibt.

Allgemein ist das aber nicht die Regel. So ist die Suche nach einem Lösungsverfahren mit Polynomzeit recht aussichtslos.

Dennoch: Das 0/1-Rucksackproblem ist eines der wenigen Probleme mit folgenden Eigenschaften:

  • Die größte Zahl der Eingabe, also K, lässt sich durch kein Polynom in der Länge der Eingabe in der üblichen Darstellung, hier also 2n+1 oder einfach n, beschränken.
  • Es gibt einen Algorithmus zur Lösung des Problems, dessen Rechenzeit durch ein Polynom, hier , in der Eingabelänge und der größten Zahl der Eingabe abgeschätzt werden kann.

Ein solcher Algorithmus heißt pseudopolynomial. Es gibt nicht sehr viele Algorithmen dieser Art.

Das uniforme Komplexitätsmaß reicht also nicht aus, um die Komplexität des Verfahrens zu bewerten. Durch die Bit-Komplexität, welche die Länge der Eingabewerte berücksichtigt, wurde der exponentielle Aufwand offen gelegt. Es wird deutlich, dass das uniforme Maß in vielen Fällen zu grob ist oder überhaupt nicht anwendbar ist, wie es auch bei den pseudopolynomialen Algorithmen der Fall ist. Eine Rückkopplung hierfür ist in der Einführung im Abschnitt 1.4 vorzufinden.


Memoizing

Wir wollen vorerst eine Implementation der rekursiven Formel in einer rekursiven Prozedur ohne memoizing vornehmen, wobei wir die Anzahl der rekursiven Aufrufe ermitteln wollen.

Wir erhalten das Ergebnis von 183, das wir auch schon mit der traditionellen Berechnung ermittelt haben. Die Zahl der zu lösenden Teilprobleme ergibt sich aus der Anzahl der rekursiven Aufrufe und deren Reihenfolge der Bearbeitung wird nun durch den rekursiven Prozess bestimmt.

Wie wir deutlich sehen, sind die 2026 Prozeduraufrufe wesentlich mehr als die 1200 Felder, die man bei der Tabellenvariante zu berechnen hatte. Da manche Elemente der Tabelle scheinbar mehrfach berechnet wurden, wollen wir diese Tatsache durch memoizing vermeiden.

Der Grundgedanke beim memoizing setzt sich daraus zusammen, dass man vor der Berechnung eines Wertes überprüft, ob der Wert, den man ermitteln will, schon vorhanden ist. Trifft dies zu, wird der Wert übernommen. Wenn dem nicht so ist, wird der gesuchte Wert berechnet, gespeichert und für den eventuellen späteren Bedarf gespeichert.

Es kommt zum Einsatz von Assoziationslisten, wenn man die SCHEME-Repräsentation einer Tabelle darstellen will. Ihre Elemente sind als Paare in der Form (key . value) vorzufinden. Zugriff auf einen Wert erhalten wir durch das Sprachelement assoc über den key. Wird der angegebene key gefunden, so erhält man das gesamte Paar zurück. Ansonsten bekommt man den Wert #f ausgegeben.

Wenden wir uns nun der Funktion mit memoization zu. Den Quelltext können wir mit wenigen Veränderungen übernehmen.

Durch die Veränderung des Quelltextes haben wir nun die Technik des memoizing implementiert. Hier nun ein Aufrufbeispiel:

Aus diesem Beispiel lässt sich folgendes erkennen:

  1. Das Ergebnis (183) stimmt mit den Resultaten überein, die von gesamtwert-iterativ und gesamtwert-rekursiv ermittelt wurden.
  2. Die Zahl der rekursiven Aufrufe (502) ist gegenüber 2026 deutlich geringer und liegt ebenso deutlich unter 1331 bzw. 1200. Es werden - wie eingangs festgestellt - keineswegs alle Tabellenelemente gebraucht und mir der rekursiven Prozedur auch nicht berechnet.
  3. Die Länge (501) von Memoliste stimmt beinahe mit der Anzahl rekursiver Aufrufe überein. Der allererste Aufruf kommt hinzu und sorgt somit folglich für die Zahl 502.

Durch die Definition der Variable memoliste in einer Umgebung definiert ist, in welcher der Lambda-Ausdruck zur Definition der Prozedur gesamtwert-iterativ-memo evaluiert wird, bleiben, solange die Prozedur nicht widerholt definiert wird, nach jedem Aufruf erhalten.

Dies führt dazu, dass weitere Aufrufe davon profitieren können und die gegebenenfalls die Liste der bis zu diesem Zeitpunkt berechneten Werte ergänzen. Bei einem wiederholten Aufruf ist keine Neuberechnung nötig, da sich sämtliche Werte bereits in der Memoliste befinden.

Für den Fall, dass der Quellcode nicht richtig evaluiert wird, gibt es hier die Datei zum download:
Simaknoc_Memoizing.zip (0.1 MB)

Fazit

Beim dynamischen Programmieren ist dem Vorgang der rekursiven Implementation mit memoizing der Vorzug zu geben. Das liegt daran, dass sie mindestens so schnell arbeitet wie das iterative Arbeiten, da sie eine gleiche Aufwandsanordnung besitzen und zudem direkt aus der rekursiven Vorschrift abgeleitet werden kann, wodurch die fehleranfällige Transformation unnötig wird.


Rundreiseproblem

Betrachten wir nun die Lösung des Rundreiseproblems unter dem Aspekt der dynamischen Programmierung.

Die Optimalitätsbedingung ist erfüllt, denn es gibt einen minimalen Weg von einer Stadt i = 1 direkt nach Stadt j. Darauf folgen alle Städte aus genau einmal und das Ende ist wieder in 1. Hierdurch ist rekursive Beschreibung des minimalen Gesamtwegs offensichtlich.

Simaknoc Rundreiseproblem.png

Die in der Grafik dargestellten "leeren" Orte der Rundreise stellen beliebig viele Orte dar. Der gekennzeichnete Weg ist eine von vielen Möglichkeiten.

Sind bereits alle Städte besucht worden, kehrt man von der aktuellen Stadt i zurück zu 1.

Die Tabelle, die durch die iterative Herangehensweise entsteht, besitzt n Spalten für die Städte 2, 3, 4, ..., n und Zeilen für alle möglichen Städtemengen Letzteres entspricht der Potenzmenge .

Daraus folgt, dass die jeweilige Spalte der Tabelle oder Matrix das erste Argument ist und die jewels ausgewählte Zeile das zweite Argument von weg ist. Dies ist zwar entgegen der Gewohnheit, jedoch ist es auch eine Garantie dafür, dass alle zur Berechnung eines Tabellenfeldes gebrauchten Werte entweder in der Entfernungsmatrix oder bereits in der Tabelle stehen. Diese wird bei der traditionellen Berechnung zeilenweise gefüllt.

Die Anzahl der Tabellenfelder beträgt und der zur Berechnung jedes Feldes erforderliche Aufwand liegt - wegen der durch j bestimmten Anzahl von Summen in der Minimumbildung - in . Somit ergibt sich ein Aufwand in für das mit dynamischen Programmieren arbeitende Verfahren.

Verglichen ist dieser Aufwand zwar besser als der des naiven Algorithmus , bei dem alle Städte-Permutationen gebildet werden und aus den dazugehörigen Weglängen anschließend die kleinste Zahl gesucht wird. Der Aufwand ist in beiden Fällen jedoch ein exponentieller, welcher die Lösung des Problems für größere Städtezahlen n praktisch unmöglich macht.


Übungsaufgaben

Die Übungsaufgaben könnt ihr hier als PDF downloaden:

Simaknoc_Aufgaben_dynamisches_Programmieren.pdf (0.1 MB)

Quellen

Literatur

[1] Christian Wagenknecht
Algorithmen und Komplexität.- Fachbuchverlag Leipzig, 2003. - ISBN 3-446-22314-2
[2] Cormen, Th. H.; Leiserson, Ch. E.; Rivest, R.; Stein, C.
Algorithmen - Eine Einführung, 2. Auflage.- Oldenburg Wissensch. Vlg., 2007 - ISBN 978-3-486-58262-8
[3] Robert Sedgewick
Algorithmen, 3. unveränderte Auflage - Addison-Wesley, 1994 - ISBN 3-89319-402-9
Persönliche Werkzeuge