GIScience (GIS) Forschungsprojekt
Quantifizierung der räumlichen Korrelationsstrukturen in georeferenzierten Twitter Feeds
- Förderung: DFG, SPP 1894/1 – Volunteered Geographic Information
- Project Lead: Prof. Dr. Alexander Zipf
- Wiss. Mitarbeiter: René Westerholt
Über das Projekt
Soziale Medien erwiesen sich als ergiebige und reichhaltige VGI Datenquelle für unterschiedliche Forschungsgebiete. Der vorliegende Antrag zielt auf die Erweiterung der wissenschaftlichen Methoden zur Identifikation räumlicher Zusammenhänge v.a. aus Twitter Daten. Für deren Analyse müssen raumstatistische Methoden geeignet angepasst und erweitert werden, um die inhärenten Charakteristika der Tweets und der sie abbildenden geographischen Phänomene besser zu repräsentieren. Theoretisch bauen die Ansätze auf die Theorie räumlicher Autokorrelation auf, der traditionelle Ansatz zur Quantifizierung räumlicher Strukturen.
Die erste Forschungsfrage befasst sich mit der Integration räumlicher Autokorrelation und der stochastischen Geometrie von Tweets. Letztere Eigenschaft wird traditionell über Methoden der Punktmusteranalyse untersucht. Die vorgeschlagenen Ansätze verbinden Prinzipien beider Theoriegebäude. In einer initialen empirischen Untersuchung werden zunächst die Einflüsse der geometrischen Stochastizität auf Ergebnisse konventioneller Maße räumlicher Autokorrelation ermittelt. Dies umfasst die Modellierung lokaler Punktmustern sowie eine Monte Carlo Simulation. Damit sind Rückschlüsse auf die räumliche Variation der Interaktion in realweltlichen sozialen Aktivitäten möglich. Im Anschluss fließen die Ergebnisse in ein adaptiertes Maß zur Korrelationsermittlung ein. Dieses wird über den Einbezug von Prinzipien von Gibbs- und Cox Punktprozessen eine realistische Ermittlung von Korrelationsstrukturen erlauben.
Eine zweite Problemstellung fokussiert auf die Berücksichtigung sich gegenseitig überlagernder Prozessrepräsentationen. Diese entstehen durch die autonomen Nutzer, welche raumzeitlich überlagernde Prozessrepräsentationen erfassen. Zunächst müssen die für eine Analyse relevanten und irrelevanten Tweets getrennt werden. Ein zu untersuchender Ansatz basiert dabei auf der Dempster-Shafer Theorie und Dirichlet Prozessen und ist als Hypothesentest gestaltet. Dieses mündet Verfahren in eine Methodik zur Ableitung von entflochtenen Korrelationsstrukturen. Dieses gestaltet sich in Form einer partiellen räumlichen Autokorrelation und verhindert die Vermischung von potentiell beziehungslosen Phänomenen.
Im Gegensatz zu den ersten beiden Aspekten adressiert eine dritte Aufgabe die Analyse von zusammengesetzten sozialen Prozessen. Hierfür müssen geeignete Strategien für die Aggregation von Tweets erarbeitet werden. Hierzu sollen traditionelle Clusteringverfahren, ein Shrink-and-Grow Ansatz sowie eine Beschreibung über Indizes der Punktmusteranalyse untersucht werden. Zudem werden Zusammenhänge zwischen diesen aggregierten Prozessen sowie deren Einfluss auf ihre unmittelbare Umgebung untersucht.
Diese Ansätze erlauben eine detailliertere Analyse sozialer Phänomene und ihrer räumlichen Wirkmechanismen. Durch den Einbezug der Spezifika sozialer Medien werden zudem Methoden zur räumlichen Analyse soziotechnischer Systeme stark verbessert.