ECON3173 Querschnitts- und Paneldatenanalyse: Stata-Tutorial für Ihr Projekt

Einführung in die Querschnitts- und Paneldatenanalyse

Die Querschnitts- und Paneldatenanalyse ist ein zentrales Werkzeug der empirischen Wirtschaftsforschung. In Ihrem ECON3173-Projekt untersuchen Sie den Zusammenhang zwischen Zugang zu externer Finanzierung und Unternehmensleistung mithilfe der World Bank Enterprise Survey Data (WBESD). Diese Anleitung führt Sie durch die wichtigsten Schritte: von der Datenaufbereitung über die logistische Regression bis hin zur Panel-Schätzung. Dabei nutzen wir aktuelle Beispiele – etwa den Einfluss von Fintech-Krediten auf Start-ups in Schwellenländern – um die Relevanz der Methoden zu verdeutlichen.

1. Datenaufbereitung mit Stata

Bevor Sie mit der Analyse beginnen, müssen Sie die Rohdaten aus der WBESD in ein einheitliches Panel-Format bringen. Gehen Sie wie folgt vor:

1.1 Daten zusammenführen

Verwenden Sie den Befehl append, um die Daten aller Jahre und Länder zu einer einzigen Stata-Datei zu kombinieren. Achten Sie darauf, dass die Variablenstruktur identisch ist.

use "land1_2005.dta", clear
append using "land1_2009.dta"
append using "land2_2006.dta"
...
save "combined_panel.dta", replace

1.2 Variablen umbenennen und generieren

Laut Aufgabenstellung müssen Sie folgende Variablen erstellen:

creditdum: Dummy-Variable, die angibt, ob ein Unternehmen einen Kredit oder eine Kreditlinie hat (1 = ja, 0 = nein).
Femaledum: Dummy-Variable für weibliche Beteiligung am Eigentum.
ln_sales: Natürlicher Logarithmus des Jahresumsatzes.

gen creditdum = (k8 == 1) if !missing(k8)
gen Femaledum = (b4 == 1) if !missing(b4)
gen ln_sales = ln(sales)

1.3 Panel-Struktur definieren

Kennzeichnen Sie die Daten als Panel mit xtset:

xtset firmid year

2. Querschnittsanalyse: Determinanten des Kreditzugangs

Im ersten Teil der Analyse modellieren Sie die Wahrscheinlichkeit, dass ein Unternehmen Zugang zu Krediten hat. Dies geschieht mit einer logistischen Regression (Logit-Modell).

2.1 Modellspezifikation

Ein typisches Modell könnte so aussehen:

logit creditdum i.size i.ownership i.sector ln_sales Femaledum, or

Die Odds Ratios (Option or) erleichtern die Interpretation: Ein Wert über 1 bedeutet, dass die Variable die Wahrscheinlichkeit eines Kredits erhöht.

2.2 Interpretation der Ergebnisse

Angenommen, die Variable size (Unternehmensgröße) zeigt einen signifikanten positiven Effekt. Das bedeutet, dass größere Unternehmen eher einen Kredit erhalten – ein bekanntes Phänomen in Entwicklungsländern. Ähnlich wie bei der aktuellen Diskussion um Fintech-Kredite für KMU in Indien: Kleinere Unternehmen haben oft weniger Zugang zu traditionellen Bankkrediten, aber neue digitale Plattformen könnten diese Lücke schließen.

3. Paneldatenanalyse: Kausale Wirkung von Kreditzugang auf Umsatz

Im zweiten Teil testen Sie, ob der Zugang zu Krediten tatsächlich zu höheren Umsätzen führt. Hierfür eignen sich Fixed-Effects-Modelle, da sie unbeobachtete, zeitkonstante Heterogenität kontrollieren.

3.1 Fixed-Effects-Schätzung

xtreg ln_sales creditdum i.year, fe robust

Der Koeffizient von creditdum zeigt den durchschnittlichen Effekt des Kreditzugangs auf den Log-Umsatz. Ein positiver Wert deutet auf eine kausale Wirkung hin – vorausgesetzt, die Annahme der Parallel Trends ist erfüllt.

3.2 Endogenitätsprobleme

Ein häufiges Problem ist die Endogenität: Unternehmen mit höheren Umsätzen könnten leichter Kredite erhalten (umgekehrte Kausalität). Mit Panel-Daten und Fixed Effects können Sie zumindest zeitkonstante Störfaktoren eliminieren. Für eine robustere Kausalität wären Instrumentenvariablen oder Difference-in-Differences nötig – fortgeschrittene Methoden, die über dieses Tutorial hinausgehen.

4. Praktische Tipps für Ihr Projekt

Dokumentieren Sie jeden Schritt in Ihren Do-Files (PartA.do und PartB.do), damit Ihre Ergebnisse reproduzierbar sind.
Überprüfen Sie die Datenqualität: Fehlende Werte, Ausreißer und Kodierungsfehler können die Ergebnisse verzerren.
Nutzen Sie grafische Darstellungen: Ein Streudiagramm von Umsatz über die Zeit nach Kreditzugang kann Muster sichtbar machen.

5. Fazit

Die Kombination aus Querschnitts- und Paneldatenanalyse ermöglicht es Ihnen, sowohl die Determinanten des Kreditzugangs als auch dessen kausale Wirkung auf die Unternehmensleistung zu untersuchen. Mit den gezeigten Stata-Befehlen und einer sorgfältigen Datenaufbereitung sind Sie gut gerüstet für Ihr ECON3173-Projekt. Denken Sie daran: Die Qualität Ihrer Analyse hängt maßgeblich von der Sauberkeit Ihrer Daten und der Angemessenheit Ihrer Modelle ab.

„In der empirischen Wirtschaftsforschung ist Reproduzierbarkeit das A und O. Ihre Do-Files sind der Schlüssel dazu.“