Nane Kratzke

Thesis:

Interaktive Netzwerkanalysen am Beispiel von Twitter

Published: 05 Jun 2019 (latest update: 07 Jun 2019)
Type: Master (M. Sc.)
Author: Ferenc Beutel
State: ongoing
Study: Computer Science
Language: German
Institute: CoSA
Picture: pexels.com

Soziale Netzwerke wie bspw. Twitter erlangen eine zunehmend omnipräsente Verbreitung und werden daher auch im Rahmen von Kommunikationsstrategien von Unternehmen, Organisationen und politischen Akteuren immer systematischer als Medium genutzt. Die Analyse von Interaktionsströmen solcher Netzwerke ermöglicht es soziale Massenphänomene in digitalen sozialen Netzwerken zu untersuchen und so neue Einsichten zu unterschiedlichsten Fragestellungen zu gewinnen. Seien es Wahlen in Demokratien, Kundeneinschätzungen zu Produkten, Reichenweitenanalysen von Marketingmaßnahmen und vieles mehr.

Twitter stellt hierzu eine kostenfreie Stichprobe aller Twitterinteraktionen auf seiner Streaming API zur Verfügung. Diese Stichprobe kann von jedermann gestreamt, gespeichert und hinsichtlich eigener Fragestellungen analysiert werden. Ein öffentlich verfügbarer und monatlich aktualisierter Datensatz aller deutschsprachigen Tweets findet sich als Open Access Datensatz auf Zenodo. Für entsprechende Voranalysen ist es jedoch häufig hilfreich sich solche Massendaten erst einmal interaktiv und in Ausschnitten zu betrachten.

Diese Arbeit soll für den genannten Datensatz (DOI: 10.5281/zenodo.2783954) untersuchen, wie sich solche Massensequenzen von Twitter Interaktionen (von Millionen von Nutzern und Abermillionen von Tweets) interaktiv erfassbar erschließen und darstellen lassen. Ergänzend ist zu untersuchen wie sich innerhalb solcher Massendaten interaktiv und intuitiv navigieren lässt, um sich Zusammenhänge schrittweise zu erschließen. Die Funktionalität sollte folgende Aspekte umfassen:

  • Suchmaschinenfunktionalität (z.B. Suche nach Tweets, Hashtags oder Usern von Interesse, etc.)
  • Geeignete Visualisierung von Netzwerkstrukturen ausgehend von identifizierten Knoten oder Tweets (z.B. Retweetnetze, Verbreitungs- und Interaktionsgraphen, etc.)
  • Geeignete Visualisierung quantitativer Aspekte (z.B. Häufigkeiten, Vergleiche mit der “Ground-Truth”, zeitliche Entwicklungen, Interaktionshäufigkeiten von Akteuren, Nähe und Distanz von Akteuren, etc.)

Hierzu ist ein Prototyp zu konzipieren, zu implementieren und dessen Gebrauchstauglichkeit zu validieren. Dies umfasst u.a.

  • Literaturrecherche zur Social Network Analyse
  • Literaturrecherche zur Thematik wie sich Large Scale Graphen anschaulich visualisieren lassen
  • Analyse geeigneter Darstellungs- und Visualisierungsformen solcher Massendaten
  • Entwicklung einer geeigneten Architektur aus Graph-/NoSQL-Datenbanken, Analysekomponenten und Webfrontend
  • Prototypische Implementierung dieser Komponenten und Integration zu einem System

Die Lösung ist nicht nur als Quelltext, sondern auch als standardisierte Deployment Unit in Form von OCI/Docker-konformen Containern bereitzustellen. Es sind dabei die 12-Factor App Prinzipien zu berücksichtigen. Das System soll auf der THL-eigenen Kubernetes Plattform deployt und betrieben werden können.