UseR!

Politikwissenschaft als empirische Sozialwissenschaft

Politikwissenschaft ist jene Wissenschaft, die die Verregelung menschlichen Zusammenlebens erforscht. Frei nach den Worten Harold Laswells, geht es Politikwissenschaft darum zu verstehen und zu erklären "Who gets what, when, how?“

Neben ganz zentralen theoretischen Fragen, die dieses Erkenntnisinteresse mit sich bringt, ist Politikwissenschaft aber unweigerlich auch (einige würden sogar behaupten vor allem) eine empirische Sozialwissenschaft. Politikwissenschaftliche Forschung gibt sich nicht damit zufrieden, über das Sein zu philosophieren und es normativ zu beschreiben. Politikwissenschaft will das Politische auch begreifbar machen. Politikwissenschaftliche Forschung muss sich daher die Frage stellen, wie sie zu Informationen (sprich Daten) kommt und wie sie mit diesen Daten umgeht, um Erkenntnisse daraus zu gewinnen.

Politikwissenschaft muss relevant sein, um als Wissenschaft ernst genommen zu werden. Dafür muss sie sich allerdings mit der sozialen Welt um uns herum auseinandersetzen und lernen sie zu verstehen und anderen zu erklären.

Wie in vielen Sozialwissenschaften, gibt es auch in der Politikwissenschaft die Diskussion, ob der richtige Weg zum Erkenntnisinteresse über qualitative oder quantitative Methoden führt. Ähnlich wie John Gerring halte ich wenig von einer Dichotomosierung in dieser Frage. Trotzdem gibt es Unterschiede zwischen qualitativ und quantiativ ausgerichteter Forschung. Gerring macht diese Unterschiede an zwei Faktoren fest: (1) an den Beobachtungen und (2) dem damit verbundenen Umgang mit diesen Beobachtungen.

Qualitative Forschung zeichnet sich laut Gerring durch 'noncomparable observations—observations that pertain to different aspects of of a causual or descriptive question' aus und erfordert damit zwangsläufig 'an idiographic style of analysis'.[1]

Quantitative Forschung hingegen, so Gerring weiter, arbeitet mit 'comparable observations', womit diese Art der Forschung unweigerlich 'a nomothetic style of analysis'[2] sei.

Diese Suche nach Gesetzmäßigkeiten und Mustern bzw. die Suche nach dem signal in the noise[3] in einer Vielzahl von Daten, zwingt Politikwissenschafter, sich mit Statistik auseinander zu setzen. Ein zumindest rudimentäres Verständnis von Statistik ist heutzutage unerlässlich, will man die aktuellesten politikwissenschaftlichen Forschungstrends und -ergebnisse rezipieren und in die eigene Forschung einfließen lassen.

Will man Statistik aber nicht nur verstehen, sondern auch aktiv anwenden, so führt kein Weg an guter Statistik-Literatur (ich werde dazu in den kommenden Wochen eine eigene Story mit Buchtipps veröffentlichen) und einem Statistikprogramm vorbei. Über lange Zeit dominierten kommerzielle Programme wie SPSS oder STATA die statistische Datenanalyse in der Politikwissenschaft. Auch wenn einige Kollegen sich schwer tun es zuzugeben, hat sich mittlerweile mit R eine freizugängliche Alternative durchgesetzt, hinter der eine unglaublich lebhafte und innovative Community steht.

Um meinen Studierenden (und auch allen anderen Interessierten) den Einstieg in R zu erleichtern, möchte ich in weiterer Folge kurz darlegen, was R ist, welche Vorteile R bringt, wie man R installiert und welche Tutorials einem dabei helfen, das Programmieren in R rasch und effektiv zu erlernen.

R als Umgebung zur statistischen Datenanalyse

R ist eine freie und objektorientierte Programmiersprache basierend auf S, die Anfang der 1990er-Jahre von Statistikern der Universität Auckland (Neuseeland) entwickelt wurde. Während R in den Anfangsjahren noch als Geheimtipp galt, steht mittlerweile eine weltweite Community hinter diesem Projekt, die unweigerlich am raschen Aufstieg und der rasanten Weiterentwicklung dieser Programmiersprache großen Anteil hat.

R versteht sich als eine Umgebung, in der sowohl statistische Datenanalyse als auch die graphische Darstellung dieser Analyse durchgeführt werden kann. Mittlerweile hat sich R aber auch zu einem Tool weiterentwickelt, das sich von klassischen Statistikprogrammen abhebt und auch ausgefeilte Netzwerkanalysen und quantitative Textanalyse umsezten kann.

Die R Konsole in der sämtliche Befehle eingegeben und ausgeführt werden.

Für mich hat R drei Vorteile, die dieses Programm klar von allen anderen Statistikprogrammen abhebt und zu dem präferierten Instrument sozialwissenschaftlicher Analyse macht.

  • R ist open-source und plattformunabhängig. Es kann somit kostenlos über die Projektseite (R-Poject) heruntergeladen und einfach installiert werden.
  • R ist eine code-basierte Programmiersprache. Ähnlich wie bei STATA, muss in R erst ein Code geschrieben werden, um Operationen durchzuführen. Was viele Anfänger zunächst abschreckt, ist aber schlussendlich unendlich vorteilhaft. Der in R geschrieben Code ist reproduzierbar und kann daher sowohl vom Urheber als auch anderen wiederverwendet und weiterentwickelt werden. Zudem zwingt die Programmiersprache Anwender dazu, sich ein Grundverständnis der statistischen Analyse anzueigenen. Einfach nur auf Knöpfe zu drücken und zu hoffen das irgendetwas dabei herauskommt (wie bei Statistikprogrammen mit graphischer Oberfläche rein theoretisch möglich), ist hier also ausgeschlossen.
  • R lebt davon, durch Pakete in seinen Funktionen erweitert werden zu können. Hinter R steht eine lebhafte und höchst innovative Community, die immer mehr und immer ausgefeiltere Pakete entwickelt, die die Funktionweise von R noch weiter erhöhen.

Wer R lernen möchte, dem empfehle ich die folgenden beiden Bücher: (1) Roger Peng, R Programming for Data Science und Hadley Wickham, Advanced R. Beide Bücher sind online und frei verfügbar.

Daneben gibt es auch noch eine Community, die Anfängern und Fortgeschrittenen mit Rat und Tat zur Seite steht und die kreative Lösungen für die unterschiedlichsten Programmierfragen zur Verfügung stellen. Besonders empfehlen kann ich dabei die Plattform Stack Overflow, ohne die ich so manches Programmierproblem wohl bis heute nicht bewältigt hätte.

Um R noch besser nutzen zu können, empfiehlt sich nach der Installation der Umgebung auch die Installation von RStudio. RStudio ist eine open-source Software, mit der das Programmieren in R noch einfacher ist und die darüber hinaus eine Vielzahl weiterer nützlicher Tools (wie zum Beispiel Markdown, Shiny, Bookdown oder Notebook) für den Forschungsprozess bietet.

Mit RStudio kann noch mehr aus R herausgeholt werden. Zudem bietet RStudio eine Vielzahl an zusätzlichen Tools, die für den Forschungsprozess von großer Relevanz sind.

Einige dieser Tools werde ich in nächster Zeit in eigenen Stories vorstellen. Wer sich in RStudio einarbeiten will, dem empfehle ich die wirklich umfangreichen und gut gemachten Webinars, die RStudio auf seiner Seite allen Interessierten frei zur Verfügung stellt.

Ein Aufwandt der sich lohnt!

Wer Politikwissenschaft zu seiner Leidenschaft erwählt und vielleicht auch das Glück hat, diese Leidenschaft zum Beruf werden zu lassen, der kommt an der Analyse von Daten in jeglicher Form nicht vorbei. Ich kann Studierende daher nur ermutigen, sich gleich zu Beginn ihres Studiums jener Umgebung zuzuwenden, deren Potential weit über allen anderen liegt und hinter der eine lebhafte und engagierte Community steht. R mag am Beginn sicher herausfordernt sein. Sobald man aber die Grundelemente dieser Programmiersprache verstanden hat, öffnet sie ein Tor zu einer neuen Welt mit einzigartigen Instrumenten zum Verständnis der sozialen und politischen Welt um uns herum.


  1. John Gerring (2017), Qualitative Methods, Annual Review of Political Science 20, 15-36, doi 10.1146/annurev-polisci-092415-024158, 18. ↩︎

  2. Gerring (2017), 18. ↩︎

  3. Wer einen leicht zugänglichen und unterhaltsamen Einstieg in die Welt der Datenanalyse sucht, dem empfehle ich das folgende Buch: Nate Silver (2012), The Signal and the Noise: The Art and Science of Prediction, New York, NY: Penguin Books. ↩︎