Extremwerttheorie: Reguläre Variation und Hall-Welsh Klasse mit Kumaraswamy

Einleitung: Warum Extremwerttheorie heute wichtiger ist denn je

In einer Welt voller Daten – von Klimamodellen über Börsencrashs bis hin zu Gaming-Highscores – geht es oft nicht um den Durchschnitt, sondern um die Extreme: den heißesten Tag des Jahres, den höchsten Aktienkurs oder den Rekord-Score in einem Battle-Royale-Spiel. Die Extremwerttheorie (EVT) hilft uns, solche seltenen Ereignisse zu modellieren und vorherzusagen. In diesem Tutorial beleuchten wir die statistischen Konzepte der regulären Variation, der erweiterten regulären Variation und der Hall-Welsh Klasse – allesamt zentral für die EVT. Als Beispiel dient die Kumaraswamy-Verteilung, eine flexible Verteilung auf dem Intervall (0,1), die in der Hydrologie und Finanzmathematik Anwendung findet. Der Stoff orientiert sich an typischen Aufgaben aus dem Modul STAT5611 Statistical Methodology und eignet sich hervorragend zur Prüfungsvorbereitung.

Die Kumaraswamy-Verteilung: Definition und Eigenschaften

Die Kumaraswamy-Verteilung mit Parametern c > 0 und d > 0 hat die Verteilungsfunktion (CDF):

F(x; c, d) = 1 - (1 - x^c)^d,  0 < x < 1

Für x ≤ 0 ist F(x)=0, für x ≥ 1 ist F(x)=1. Diese Verteilung ähnelt der Beta-Verteilung, hat aber eine einfachere Form für die Quantilfunktion – ein großer Vorteil für Simulationen und Extremwertanalysen. Stellen Sie sich vor, Sie analysieren die Erfolgsquote von KI-Modellen bei der Bilderkennung: Die Werte liegen zwischen 0 und 1, und Sie interessieren sich für die besten 1% der Modelle – genau hier kommt die EVT ins Spiel.

Quantilfunktion und reguläre Variation

Herleitung des Hochquantils

Das 1-1/n-Quantil U(n) = F^{-1}(1-1/n) ist ein zentraler Baustein der EVT. Für die Kumaraswamy-Verteilung lösen wir:

1 - (1 - U^c)^d = 1 - 1/n
(1 - U^c)^d = 1/n
1 - U^c = n^{-1/d}
U^c = 1 - n^{-1/d}
U(n) = (1 - n^{-1/d})^{1/c}

Dieses Quantil wächst mit n und nähert sich 1 an – je größer n, desto näher am Maximum.

Reguläre Variation der Quantilfunktion

Eine Funktion U(t) heißt regulär variierend mit Index ρ, wenn für jedes feste x>0 gilt:

lim_{t→∞} U(tx)/U(t) = x^ρ

Für ρ=0 spricht man von langsamer Variation. Setzen wir unsere Quantilfunktion ein:

U(tx)/U(t) = (1 - (tx)^{-1/d})^{1/c} / (1 - t^{-1/d})^{1/c} → 1

Da Zähler und Nenner gegen 1 streben, ist U(t) langsam variierend (Index 0). Das bedeutet, dass die relativen Änderungen des Quantils für große t verschwinden – ähnlich wie bei den Highscores in einem Online-Spiel: Die Verbesserungen werden immer kleiner, je näher man am theoretischen Maximum ist.

Erweiterte reguläre Variation und die Extremwerttypen

Definition und Herleitung

Eine Funktion U ist von erweiterter regulärer Variation, wenn es eine positive Funktion a(t) gibt, so dass für alle x>0:

lim_{t→∞} (U(tx) - U(t)) / a(t) = H_γ(x)

mit H_γ(x) = (x^γ - 1)/γ für γ ≠ 0 und H_0(x) = log x. Für die Kumaraswamy-Verteilung entwickeln wir U(n) für große n:

U(n) = 1 - n^{-1/d}/c + o(n^{-1/d})

Dann gilt mit a(n) = n^{-1/d}/(cd):

U(nx) - U(n) = -n^{-1/d}/c * (x^{-1/d} - 1) + o(n^{-1/d})
⇒ (U(nx)-U(n))/a(n) → -d (x^{-1/d} - 1) = H_{-1/d}(x)

Also ist U von erweiterter regulärer Variation mit Exponent γ = -1/d. Dies klassifiziert die Verteilung als zum GEVD-Typ Weibull gehörig – die Maxima konvergieren gegen eine Verteilung mit endlicher oberer Grenze (hier 1).

Normalisierung der Maxima

Für i.i.d. Zufallsvariablen X_1,...,X_n mit Verteilung F suchen wir Konstanten a_n>0, b_n, so dass (M_n - b_n)/a_n in Verteilung konvergiert. Ein mögliches Paar ist b_n = 1 und a_n = n^{-1/d}. Dann gilt für x < 0:

P(M_n ≤ 1 + n^{-1/d}x) → exp(-(-c x)^d)

Das ist eine skalierte reversierte Weibull-Verteilung – ein Spezialfall der generalisierten Extremwertverteilung (GEV) mit γ = -1/d.

Die Hall-Welsh Klasse: Eine Feinanalyse der Tail-Heavyness

Definition und Beispiel

Eine Verteilung gehört zur Hall-Welsh Klasse, wenn ihre Tail-Wahrscheinlichkeit für große x die Darstellung

1 - F(x) = C x^{-1/γ} (1 + D x^{-β} + o(x^{-β}))

mit γ>0, β>0, C>0, D ∈ ℝ besitzt. Für die Kumaraswamy-Verteilung gilt:

1 - F(x) = 1/(1 + x^c) = x^{-c} (1 + x^{-c})^{-1} = x^{-c} (1 - x^{-c} + o(x^{-c}))

Also:

γ = 1/c (Extremwertindex)
β = c (Tail-Parameter)
C = 1
D = -1

Die Hall-Welsh Klasse erlaubt eine präzise Schätzung des Extremwertindex γ – zum Beispiel mit dem Hill-Schätzer, der auf den oberen Ordnungsstatistiken basiert. In der Praxis nutzen Versicherungen solche Modelle, um Risiken für seltene Großschäden zu kalkulieren.

Zusammenfassung und Ausblick

In diesem Tutorial haben Sie gelernt:

Die Quantilfunktion der Kumaraswamy-Verteilung und ihre reguläre Variation.
Das Konzept der erweiterten regulären Variation und seine Bedeutung für die Extremwerttypen.
Die Hall-Welsh Klasse als Werkzeug zur Feinklassifikation von Tail-Verhalten.

Diese Konzepte sind nicht nur für die Klausur in STAT5611 relevant, sondern auch für aktuelle Anwendungen wie die Analyse von KI-Modell-Performanz, Finanzmarkt-Risiken oder Gaming-Leaderboards. Wenn Sie tiefer einsteigen möchten, empfehle ich die Lektüre von Extreme Value Theory: An Introduction von de Haan und Ferreira.

Merksatz: Die Extremwerttheorie ist der Schlüssel, um aus seltenen Ereignissen statistische Gesetzmäßigkeiten zu destillieren – und die Kumaraswamy-Verteilung ist ein ideales Übungsfeld, um die Methoden zu verstehen.