Markov-Ketten Tutorial: Übungsblatt 4 Ingenieurmathematik 2

Einführung in Markov-Ketten für Ingenieure

Markov-Ketten sind ein fundamentales Werkzeug in der Ingenieurmathematik, um Systeme mit zufälligen Zustandsübergängen zu modellieren. In diesem Tutorial zu Übungsblatt 4 des Kurses 29650 Engineering Mathematics 2 lernst du, wie du Zustandswahrscheinlichkeiten berechnest, Sequenzwahrscheinlichkeiten bestimmst und Modellparameter aus Daten schätzt. Diese Konzepte sind nicht nur für die Klausur wichtig, sondern auch in Bereichen wie KI-Sprachmodellen oder Finanzmarktprognosen relevant.

Grundlagen: Zustandsvektoren und Übergangsmatrizen

Ein Markov-Modell besteht aus einer Menge von Zuständen S = {s1, s2, ..., sn}, einem anfänglichen Zustandsvektor P0 und einer Übergangsmatrix A. Jeder Eintrag aij gibt die Wahrscheinlichkeit an, von Zustand i zu Zustand j zu wechseln. Die Zustandswahrscheinlichkeiten zum Zeitpunkt t berechnen sich mit Pt = P0 * At. Dies ähnelt der Berechnung von Wahrscheinlichkeiten in viralen Social-Media-Trends, bei denen sich der „Zustand“ eines Beitrags (z. B. viral, normal, tot) nach bestimmten Regeln ändert.

Beispiel: Vier-Zustands-Markov-Kette

Betrachten wir ein System mit den Zuständen s1, s2, s3, s4 und gegebenem P0 und A. Um die Wahrscheinlichkeit der Sequenz s = s1 s1 s3 s2 s4 s4 zu berechnen, multiplizieren wir die Anfangswahrscheinlichkeit für s1 mit den Übergangswahrscheinlichkeiten entlang der Sequenz. Formal: P(s) = P0(s1) * a11 * a13 * a32 * a24 * a44. Dies ist analog zur Berechnung der Wahrscheinlichkeit einer bestimmten Spielzugfolge in einem E-Sport-Turnier, bei dem jeder Zug vom vorherigen abhängt.

Bayes-Theorem und Sequenzklassifikation

In Aufgabe 2 geht es darum, zu entscheiden, welcher Generator (X oder Y) eine beobachtete Sequenz a, b, c am wahrscheinlichsten erzeugt hat. Dazu verwenden wir den Satz von Bayes: Die Wahrscheinlichkeit, dass Generator X die Sequenz erzeugt hat, ist proportional zur Wahrscheinlichkeit der Sequenz unter X mal der Prior-Wahrscheinlichkeit von X. Da X dreimal häufiger sendet als Y, setzen wir P(X) = 0,75 und P(Y) = 0,25. Berechne dann die Sequenzwahrscheinlichkeiten für beide Modelle und wähle das Modell mit dem höheren Wert. Dieses Prinzip wird auch bei der Fehlerkorrektur in der Datenübertragung oder bei der Identifikation von KI-generierten Texten angewendet.

Parameterschätzung aus beobachteten Sequenzen

In Aufgabe 3 müssen die Parameter P0 und A einer 2-Zustands-Markov-Kette aus gegebenen Sequenzen geschätzt werden. Dazu zählst du, wie oft jeder Zustand als erster auftritt (für P0) und wie oft Übergänge von einem Zustand zu einem anderen vorkommen (für A). Die Übergangswahrscheinlichkeit aij ergibt sich aus Anzahl der Übergänge i→j / Anzahl aller Übergänge ausgehend von i. Stell dir vor, du analysierst die Klickpfade auf einer Website: Die Zustände sind die Seiten, und die Übergänge sind die Klicks. Die geschätzte Matrix beschreibt dann das typische Surfverhalten.

Stationäre Verteilung und Grenzwert

Für große t konvergiert der Zustandsvektor gegen die stationäre Verteilung π, die die Gleichung π = π A erfüllt. Diese kann durch Lösen des linearen Gleichungssystems oder über die Eigenvektoren von AT gefunden werden. Die stationäre Verteilung gibt an, mit welcher Wahrscheinlichkeit sich das System langfristig in jedem Zustand befindet – ähnlich wie die langfristige Popularität von Hashtags auf Social Media.

Absorbierende Zustände und Sequenzlängen

In Aufgabe 4 gibt es einen absorbierenden Zustand (Zustand 3), der das Ende einer Sequenz markiert. Die Wahrscheinlichkeit, eine Sequenz genau der Länge 2 zu erzeugen, berechnet sich über alle Pfade, die nach zwei Schritten im absorbierenden Zustand enden, ohne vorher zu absorbieren. Dies ist nützlich für die Modellierung von Prozessen mit definiertem Ende, wie z. B. Warteschlangen oder Spielrunden.

Monte-Carlo-Simulation

Mit einer gegebenen Liste von Zufallszahlen kannst du Sequenzen gemäß den Modellparametern generieren. Dabei wird für jeden Schritt eine Zufallszahl mit den kumulativen Wahrscheinlichkeiten der Übergangsmatrix verglichen. Aus den erzeugten Sequenzen kannst du dann erneut die Modellparameter schätzen und mit den ursprünglichen vergleichen. Dies zeigt die Variabilität der Schätzung bei begrenzter Datenmenge – ein häufiges Problem in der Praxis, z. B. bei der Analyse von Aktienkursbewegungen.

Fazit

Markov-Ketten sind ein mächtiges Werkzeug, um stochastische Prozesse zu verstehen. Mit den Techniken aus diesem Tutorial – Berechnung von Sequenzwahrscheinlichkeiten, Bayes-Klassifikation, Parameterschätzung und Simulation – bist du gut gerüstet für Übungsblatt 4 und darüber hinaus. Diese Konzepte finden Anwendung in der Sprachverarbeitung, Bioinformatik und Finanzmathematik. Übe weiter mit den Aufgaben, um ein sicheres Verständnis zu entwickeln.