Dynamisches Programmieren WS15-16
Aus ProgrammingWiki
Leonard Mory, Frank Ehrlich, Alexander Preuss
Inhaltsverzeichnis |
Thematischer Einstieg und Motivation
Was ist dynamisches Programmieren?
- Kein Algorithmus, eher eine Lösungsstrategie
- Begriff kommt aus der Zeit, wo Programmieren Tabellenmethoden bezeichnete
- Optimierungsverfahren, kein Programmieren
- "Teile und Herrsche" dient als Grundlage
Vorgehensweise
- Darstellung der Struktur einer optimalen Lösung.
- Entwerfen einer rekursiven Methode, um den Wert der optimalen Lösung zu bestimmen.
- Berechnung des Wertes einer optimalen Lösung durch eine iterative Bottom-Up-Methode.
- Bestimmung einer optimalen Lösung aus den bereits berechneten Daten.
Dabei könnnen aber immer Schwierigkeiten auftreten:
- Lösungen kleiner Probleme können nicht immer so kombiniert werden, dass sich eine optimale Lösung für ein größeres Problem ergibt
- Menge der zu lösenden Teilproblemen kann unlösbar hoch werden
- Aufspaltung in eigenständige Teilprobleme ist oft nicht möglich
Bottom-up
Bei dem Dynamischen Programmieren wird ein Bottom-up-Ansatz verwendet
- Um ein umfangreiches Problem zu lösen, wird es in kleine Teilprobleme zerlegt
- Alle Teillösungen werden unabhängig von einander "von unten her" gelöst und in eine Tabelle gespeichert
- Durch die Speicherung in die Tabellen wird eine neue Berechnung vermieden
- Erwartung, dass eine optimale Lösung aus allen Teillösungen entsteht
- Lösung kann aber nicht immer als optimale Lösung betrachtet werden, da verschiedene Lösungen möglich sind mit dem optimalen Wert
- Berechnungsprozess wird iterativ abgewickelt
Berechnungsprozess
- wird iterativ organisiert
- das heißt, dass die entsprechende Tabelle nacheinander ausgefüllt wird
- für jedes Feld einer Tabelle oder einer Matrix mit der Form (z,s )muss genau ein Resultat ermittelt werden
- diese Berechnungsmethode könnte sozusagen aus Aufwandsgründen der rekursiven vorgezogen werden
- Bei Lösungen, welche rekursiv definiert sind und durch rekursive Prozeduren berechnet wurden, können Mehrfachberechnungen von Teilausdrücken vorkommen.
- Aufwand für wiederholte und damit hinfällige Berechnungen wird bei der dynamischen Programmierung vermieden
- das geht aber nicht so einfach, man spricht von so genannten "überlappenden Teilproblemen"
- um das zu bewirken werden alle Teillösungen berechnet
- auch die, welche für die optimale Gesamtlösung am Schluss unrelevant sind und somit eigentlich keine Bedeutung haben
- schwieriger ist es, den Top-Down-Ansatz in einen Bottom-Up-Algoritmus umzuformen
- Bottom-Up-Algorithmen durchlaufen zweidimensionale Tabellen mittels verschachtelter Schleifen
- daher kann die Umwandlung schwierig sein und einen hohen mentalen Zeitaufwand mit sich bringen
- zudem ist sie dadurch sehr fehleranfällig
- Durch "Memorizing" kann man diesem Problem aus dem Weg gehen. Die Idee besteht darin, rekursiv erzeugte Teilprobleme einmal zu berechnen und in eine Tabelle zu speichern. Vor jeder Berechnung wird dann geprüft, ob der Wert schon vorhanden ist. Wenn das der Fall ist, wird der Wert übernommen, ansonsten wird er berechnet und danach in die Tabelle eingetragen.
Dynamisches Programmieren vs Memoizing
- beide vermeiden wiederholte Berechnung durch Speichern
- ⇒Tradeoff: Speicher statt Zeit
Memoization | Dynamisches Programmieren |
---|---|
Top-Down, Depth-First Ansatz | Bottom-Up, Breadth-First Ansatz |
Beschreibung bleibt unverändert | Beschriebung wird verändert |
Vermeidet unnötige Berechnungen | Kann unnötige Berechnungen nicht vermeiden |
Kann Speicher leicht verschwenden | Kann Speicher einsparen, indem unnötige Resultate vermieden werden |
Muss prüfen ob Berechnung bereits vorliegt | keine Prüfung nötig durch neue Beschreibung |
Komplexität hängt von Schnelligkeit des "Nachschlagens" ab | Komplexität hängt von Speichermethode ab |
Vergleich anhand Fibonacciberechnung
Rekursive Berechnung, naiver Ansatz
Rekursive Berechnung mit Memoizing
Berechnung mit dynamischem Programmieren
Schritte zum Algorithmus mit dynamischer Programmierung
1. Struktur einer optimalen Lösung analysieren: Problem zerlegen, Teilprobleme formulieren 2. Rekursionsgleichung für die optimale Lösung suchen 3. Rekursive Lösung mit Memoizing formulieren 4. (Umwandlung in Bottom-Up-Ansatz) 5. Lösungswege aus Berechnungen konstruieren Problem: Bottom-Up Ansatz kann schwer zu finden sein
Bierproblem
Informatikertreffen → Fachdiskussion
Problemstellung:
- Wieviele Möglichkeiten gibt es 3 Flaschen Bier dem Sixpack zu entnehmen?
- Wie löst man das als Informatiker?
- Mathematik: Binomialkoeffizient
- ${n \choose k} = \frac{n!}{(n-k)! k!}$ also ${6 \choose 3} = \frac{6!}{(6-3)! 3!}$
- Rekursion!
- ${n \choose k} = {n-1 \choose k-1} + {n-1 \choose k}$
- Pascalsches Dreieck
- Ergebnis in Zeile[n+1], Spalte [k]
- Antwort: es gibt 20 Möglichkeiten (Zeile 7, Spalte 3)
- Wir können das Problem mit einer Dreiecksmatrix lösen
- Wir berechnen unnötige Werte
- Für $Wert[i][j]$ werden nur $Wert[i-1]j-1]$ und $Wert[i-1][j]$ benötigt
- Alle Werte mit $j>n$ werden nicht benötigt, Matrix braucht in jeder Zeile nur bis Spalte $n$ ausgefüllt werden
Rucksackproblem
- ein Rucksack soll so gefüllt werden, dass die Wertsumme der eingepackten Gegenstände unter Beachtung seiner Kapazitätsschranke maximal ist
- 0/1 Rucksackproblem: jeder Gegenstand wird entweder vollständig in den Rucksack aufgenommen (1) oder nicht eingepackt (0)
Iterative Berechnung
Instanz eines 0/1-Rucksackproblems mit K = 5
$i$ | 1 | 2 | 3 | 4 |
$g_i$ | 2 | 3 | 4 | 5 |
$w_i$ | 3 | 7 | 2 | 9 |
Lösung
- eine Zeile 0 für den Anfangs leeren Rucksack
- Spaltenköpfe für alle möglichen Gewichtsumen von 0 bis K
- bei Gegenstand 1 darf nur dieser in betracht gezogen werden
- bei Gegenstand 2 darf der 2. und der 1. Gegenstand in betracht gezogen werden
- bei Gegenstand 3 alle 3
- bei Gegenstand 4 alle
$n/K$ | $0$ | $1$ | $2$ | $3$ | $4$ | $5$ |
$0$ | 0 | 0 | 0 | 0 | 0 | 0 |
$1:(g_i=2; w_i=3)$ | 0 | 0 | 3 | 3 | 3 | 3 |
---|---|---|---|---|---|---|
$2:(g_i=3; w_i=7)$ | 0 | 0 | 3 | 7 | 7 | 10 |
$3:(g_i=4; w_i=2)$ | 0 | 0 | 3 | 7 | 7 | 10 |
$4:(g_i=5; w_i=9)$ | 0 | 0 | 3 | 7 | 7 | 10 |
Berechnung zur Tabelle
Jeder Gegenstand darf nur einmal in den Rucksack
Gegenstand 0:
- für den Anfangs leeren Rucksack
Gegenstand 1:
- nur der 1. Gegenstand darf in den Rucksack -> daher 0 oder 3
Gegenstand 2:
- (Zeile:Spalte) 2:2 -> Wert 3, da der 1. Gegenstand Wert 3 hat;
- 2:3 -> Wert 7, da der 2. Gegenstand Wert 7 hat;
- 2:4 -> Wert 7, da 4 kg - 3 kg = 1 kg (Verlust)-> ich gucke bei 1:1 -> Wert 0 -> 7 + 0 = 7
- 2:5 -> Wert 10, 3 kg hat den Wert 7, 5 kg - 3 kg = 2 kg den Wert 3 in 1:2
Gegenstand 3:
- fängt bei 4 kg an -> vorige Werte können daher übernommen werden
- 3:4 -> Wert wäre 2, aber 2 < darüberliegende Wert 7 -> daher wird 7 genommen
- 3:5 -> g3 Wert 2, 5 kg - 4 kg = 1 kg Verlust -> bei 2:1 Wert 0 -> 2 + 0 = 2 -> 2 < 10 -> geht nicht -> Wert 10 eintragen
Gegenstand 4:
- fängt bei 5 kg an -> vorige Werte können daher übernommen werden
- 4:5 -> Wert wäre 9, aber 9 < darüber liegende Wert 10 -> Wert 10 wird eingetragen
Der folgende Code berechnet iterativ den gesuchten Maximalwert aus 10 Gegenständen.
Dieser Code kann hier nicht ausgeführt werden! Daher laden Sie sich bitte das kostenlose Tool "DrRacket" (https://download.racket-lang.org/) herunter, wählen die Sprache "#lang racket", fügen den unten stehen Code in das Definitionsfenster ein, betätigen oben rechts "Start", geben im Iterationsfenster "(gesamtwert-iterativ 10 120)" ein und betätigen "Start" erneut.
Rekursive Berechnung ohne Memoizing
Bottom-up-Ansatz: Die optimale Gesamtlösung wird durch optimalen Teillösungen aufgebaut. Dies gilt aufgrund folgender Überlegungen: Gegenstand $i$ wird in den optimal gepackten Rucksack (zunächst noch ohne $i$) gesteckt. Für den Gesamtwert $wert (n,K)$ des Rucksacks gilt folgende rekursive Beziehung:
$i=\text{ Gegenstand }$
$g=\text{ Gewicht }$
$w=\text{ Wert des Gegenstands }$
$n = \text { Anzahl der Gegenstände }$
$K = \text{ Kapazität des Rucksacks }$
$wert(i,g) = \text{ Optimaler Wert für die Gegenstände }$
$wert(n,K)=\text{ Optimaler Gesamtwert }$
$wert(i,g) = \begin{cases} 0, & wenn \ i =0 \\ wert(i-1, g), & wenn \ i > 0 \ und \ g-g_{i} < 0\\ max(wert(i-1,g), wert(i-1, g-g_{i})+w_{i}), & sonst \\ \end{cases}$
$wert (n,K)$ bezeichnet den größtmöglichen Wert des Rucksackinhalts, wobei anfangs die volle Restkapazität $K$ zur Verfügung steht. Die Gegenstände werden mit 1,2,...,n durchnummeriert.
Der Fall $wert(i,g) = wert(i-1,g)$ beschreibt, dass der $i$-te Gegenstand nicht in den Rucksack gepackt wird. $wert(i-1,g)$ ist der durch Aufnahme von Gegenständen aus 1,2,...,$i$-1 erziehlte Maximalwert unter Berücksichtigung der gegebenen Kapazität. Es gibt keinen Wertzuwachs, wenn Gegenstand $i$ nicht eingepackt wird.
Der dritte Fall in der Definition von $wert$ beschreibt die Aufnahme von $i$, wonach eine Restkapazität von $g-g_{i}$ verbleibt. Der Gesamtwert steigt in diesem Fall um $w_{i}$. Es ist aber nicht ausgeschlossen, dass sich ein höherer Gesamtwert einstellt, wenn man den Gegenstand $i$ nicht in den Rucksack packt. Deshalb ist die in der Definition angegebene Maximumbestimmung aus $wert(i-1, g)$ und $wert(i-1, g-g_{i})+w_{i})$ erforderlich.
Eine direkte Implementation dieser Formel erledigt die folgende rekursive Prozedur (zunächst) ohne memoizing). Es wird dafür gesorgt, dass die Anzahl der rekursiven Aufrufe ermittelt wird. Um die rekursive Prozedur mit memoizing zu implementieren, benötigt es nur wenige Änderungen im bereits vorhandenen Quellcode.
Damit dieser Code ausgeführt werden kann, benutzen Sie bitte "DrRacket" (siehe oben).
- das Ergebnis ist wie bei der iterativen Berechnung ebenfalls 183
- die Anzahl der rekursiven Aufrufe bestimmt die Zahl der zu lösenden Teilprobleme
- Deren Bearbeitungsreihenfolge wird durch den rekursiven Prozess bestimmt
- Anzahl der rekursiven Aufrufe: 2026 > bei Iterativ: 1200 (10 * 120)
- -> einige Tabellenwerte werden mehrfach berechnet
- Lösung des Problems: memoizing
Rekursive Berechnung mit Memoizing
- bevor eine Berechnung durchgeführt wird, wird überprüft, ob dieser Wert bereits existiert; wenn ja, dann wird dieser genommen; wenn nein, dann wird dieser berechnet und gespeichert
Um die rekursive Prozedur mit memoizing zu implementieren, benötigt es nur wenige Änderungen im bereits vorhandenen Quellcode. Damit dieser Code ausgeführt werden kann, benutzen Sie bitte "DrRacket" (siehe oben).
Aus dem Aufrufbeispiel
> (gesamtwert-rekursiv-memo 10 120)
'(183 502 501)
wird einiges deutlich:
- Das Ergebnis (183) stimmt mit den Resultaten überein, die von gesamtwert-iterativ und gesamtwert-rekursiv ermittelt wurden.
- Zahl der rekursiven Aufrufe 502 < 2026 (rekursive Berechnung ohne memoizing) und < 1200 bei iterativen Verfahren). Es werden nicht alle Tabelleninhalte gebraucht und mit der rekursiven Prozedur (mit und ohnememoizing) auch nicht berechnet.
- Die Länge (501) von memoliste stimmt (beinahe) mit der Anzahl der rekursiver Aufrufe überein. Der erste kommt hinzu und sorgt für die Zahl 502.
Fazit
- bei einer geringen Anzahl an Gegenständen, wie hier dargestellt, ist der unterschied zwischen den Lösungsansätzen nicht signifikant
- die rekursive Berechnung ohne memoizing ist untauglich, da unnötige Mehrfachberechnung
- die memoizing- Methode ist mindestens so schnell wie die iterative Methode geben, ermöglicht eine direkte Ableitung der rekursiven Regeln und vermeidet die fehleranfällige Transformation in einen iterativen Bottom-up-Algorithmus -> rekursive Berechnung mit memoizing ist die beste Wahl
Rundreiseproblem
- Gegeben
- $n$ Städte, Entfernungsmatrix $M=(m_{ ij }), m_{ ij }$
- Entfernung von Stadt $i$ nach Stadt $j$
- Gesucht
- Rundreise über alle Städte mit minimaler Länge, also Permutation $π = \{1,...,n\} \rightarrow \{1,...,n\}$ sodass $c(p)=\sum\limits_{ i=1 }^{ n-1 } m_{ \pi(i), \pi(i+1) } + m_{ \pi(n), \pi(1) }$ minimal ist
- Nun aus der Sicht der dynamischen Programmierung
- Es sei $g(i,S)$ die Länge des kürzesten Weges von $i$ über jede Stadt in $S$ mit genau einem Besuch
- Lösung des TSP $g(1,\{ 2,...,n \} )$
- Stadt 1 kann nach Belieben gewählt werden da eine Rundreise gesucht wird
- Es gilt
Algorithmus
1 $for (i=2; i=n; i++) g[i,{}]= m_{i1}$ 2 $for (k=1; k=n-2; k++)$ 3 $for(S, |S|=k, 1 \notin S)$ 4 $for(i \in \{2,...,n\} -S)$ 5 $Berechne g[i, S] gemäß der Formel$ 6 $Berechne g[1,\{1,...,n\}] gemäß der Formel$
- Komplexität der Tabelle
- Tabellengröße mal den Aufwand des Tabelleneintrages
- Anzahl der Tabellenfelder
- $<n \cdot 2^{n-1}$
- Anzahl der i's mal der Anzahl der betrachteten Teilmengen
- Tabelleneintrag
- Suche nach dem Minimum unter $j$ aus $S: \mathcal{O}\left(n\right)$
- Laufzeit
- $\mathcal{O}\left(n^{2}2^{n}\right)$, läuft deutlich besser als der naive Algorithmus mit der Laufzeit$(n-1)!$
Beispiel
- Vier Städte mit deren Entfernung
01 | 02 | 03 | 04 | |
---|---|---|---|---|
01 | - | 4 | 9 | 8 |
02 | 4 | - | 12 | 2 |
03 | 9 | 12 | - | 10 |
04 | 8 | 2 | 10 | - |
- Tabelleneinträge
$g[2,{}]=4$
$g[3,{}]=9$
$g[4,{}]=8$
$g[2,\{3\}]=12+9=21$
$g[2,\{4\}]=2+8=10$
$g[3,\{2\}]=12+4=16$
$g[3,\{4\}]=10+9=19$
$g[4,\{2\}]=2+4=6$
$g[4,\{3\}]=10+9=19$
$g[2,\{3,4\}]=min(m_{23}+g[3,\{4\}], m_{24}+g[4,\{3\}])=21$
$g[3,\{2,4\}]=min(m_{32}+g[2,\{4\}], m_{34}+g[4,\{2\}])=16$
$g[4,\{2,3\}]=min(m_{42}+g[2,\{3\}], m_{43}+g[3,\{2\}])=23$
$g[1,\{2,3,4\}]=min(m_{12}+g[2,\{3,4\}], m_{13}+g[3,\{2,4\}], m_{14}+g[4,\{2,3\}])=25$
- Per Hand dieses Problem zu lösen ist sehr verwirrend und nach einer Weile wird man die Existenz korrekter Programme schätzen.
- Die Lösung ist
- 1, 2, 4, 3, 1
Anwendung
- Bioinformatik
- Sequenzierung von Genen und Proteinen
- Linguistik
Berechnung der Levenshtein Distanz (Unterschiede zwischen zwei Sätzen)
Quellen
- Wagenknecht, 2003, Algorithmen und Komplexität
- http://www.theory.informatik.uni-kassel.de/veranstaltungen/EntwurfWS2013-14/vorlesung/EAvAKap3.pdf
- http://www.mathe.tu-freiberg.de/~ernst/Lehre/AD/Folien/adKapitel11.pdf
- http://blog.racket-lang.org/2012/08/dynamic-programming-versus-memoization.html
- http://people.cs.clemson.edu/~bcdean/dp_practice/
- http://20bits.com/article/introduction-to-dynamic-programming
- https://www2.cs.fau.de/teaching/SS2010/HalloWelt/DP_2010.pdf
- https://www2.informatik.uni-erlangen.de/teaching/SS2005/HalloWelt/dyn_programming.beamer.pdf
- http://www.informatik.uni-leipzig.de/lehre/Heyer0001/AD2-Vorl2/sld016.htm