6. Oktober 2024
  • NET CHECK

Erkenntnisse aus Mobilfunkdaten

Das Data Science Team um Steven Schulz stellt auf der NetMob-Konferenz in Washington D.C. seine neuesten Forschungsergebnisse zum Nutzen von Mobilfunkdaten vor.

Von der EM bis zur Pandemie: Wie Mobilfunkdaten Einblicke in die Kontaktmuster der Bevölkerung liefern

 

Das Data Science Team von NET CHECK erforscht im Rahmen verschiedener Forschungsprojekte, welche Erkenntnisse sich aus Mobilfunkdaten gewinnen lassen. Mit insgesamt vier Themen ist das Team um Machine-Learning-Teamleiter Steven Schulz nun auf die renommierte NetMob-Konferenz in Washington eingeladen.

 

Worum geht es bei der NetMob-Konferenz? 

S.Schulz: Die NetMob Konferenz bringt weltweit Akteure aus Industrie und Wissenschaft zusammen, die mit Mobilfunkdaten arbeiten. In Kurzvorträgen und Postern werden aktuelle Forschungsergebnisse vorgestellt, um den Austausch und die Vernetzung für neue Projekte zu fördern.

Seit 2010 findet die Konferenz alle zwei Jahre an verschiedenen Orten statt und hat sich als bedeutender Treffpunkt für alle Themen und Akteure rund um Mobilfunkdaten etabliert. Dieses Jahr wird sie in den Headquarters der Weltbank in Washington, D.C. abgehalten. Wir werden mit Ergebnissen der beiden Forschungsprojekte DAKI-FWS* und OptimAgent** sowie einem internen Projekt im Bereich der Telekommunikation vertreten sein.

Was ist die Datenbasis eurer Forschungen?

S.Schulz: Für unsere Analysen nutzen wir die Crowdsourcing-Daten von NET CHECK. Das sind Mobilfunkdaten, die auf einem Panel mit ca. 1,1 Millionen täglichen Nutzern basieren.  Die Daten enthalten anonymisierte Orts-und Zeitinformationen von Mobiltelefonen, von denen wir unter anderem ableiten, wie sich Menschen in der Stadt bewegen oder wie oft Handys bzw. Menschen aufeinandertreffen. Auf dieser Basis haben wir interessante Fragestellungen aus den Bereichen Mobilität und Kontaktverhalten untersucht.

Um welche Fragestellungen ging es im Bereich Mobilität?

S.Schulz: Wir haben unter anderem analysiert, welche Bewegungsmuster sich bei der Bevölkerung von Berlin beobachten lassen und welche Communities sich bilden. Wir zeigen auf, wie historische Entwicklungen der Stadt Berlin, insbesondere die Teilung zwischen Ost und West, den Alltag der Menschen auch heute noch unbewusst beeinflussen.

 

Wie beeinflusst denn die ehemalige Teilung Berlins die Stadt heute noch – die Mauer ist doch vor über 35 Jahren gefallen?

S.Schulz: Wir sehen klar eine weiterhin bestehende Trennung von Ost und West Communities, bedingt durch die historische Stadtteilung. Die ehemalige Teilung hat nämlich noch heute zur Folge, dass es weniger Verkehrsverbindungen zwischen dem Osten und Westen der Stadt gibt. Diese wenigen Verbindungen werden aber umso intensiver genutzt.

 

Solche Erkenntnisse können sehr interessant für die Infrastrukturplanung sein, denn sie deuten auf einen Bedarf hin, dass mehr Verbindungen zwischen den beiden Stadtseiten benötigt werden, die zum Beispiel durch zusätzliche Bus- und Bahnverbindungen hergestellt werden könnten.

 

Und welche Fragestellungen habt ihr zum Kontaktverhalten bearbeitet?

S. Schulz: Zum einen haben wir ein Vorhersagetool für Infektionszahlen entwickelt, das den Kontaktindex aus Mobilfunkdaten mit Bayesian Mixed Media-Modellen kombiniert, die ursprünglich von Google zur Vorhersage von Verkaufszahlen entwickelt wurden. Der Kontaktindex zeigt an, wie viele Kontaktpunkte es in der Bevölkerung gibt und bildet das epidemisch relevante Kontaktverhalten ab.

 

Wir erinnern uns an die Reproduktionszahl (R-Wert) während der COVID-19-Pandemie, mit dem abgeschätzt wird, wie viele Menschen eine infizierte Person im Mittel ansteckt. Der Kontaktindex ermöglicht, die Entwicklung des R-Werts vorherzusagen und damit die Veränderung der Infektionszahlen in einem bestimmten Zeitraum.

 

Außerdem stellen wir eine Studie vor, in der wir das Kontaktverhalten von Fußballfans während der Fußball-EM 2024 in Deutschland analysiert haben.

 

Was genau habt ihr hinsichtlich der Fußball-EM untersucht?

Schulz: Wir haben auf Bundesebene, Stadtebene und Stadion-Ebene ermittelt, wie viele Kontaktpunkte es gab und dabei insbesondere Points of Interests untersucht wie Bars, Restaurants und Fanmeilen in der Nähe von Fußballspielen.

 

Hier haben wir gesehen, dass die Kontaktdichte bei schlechtem Wetter gestiegen ist. Zudem war die Kontaktdichte bei Spielen, die hierzulande viele Fans oder eine besondere Relevanz hatten, höher. Das konnten wir nicht nur in den Städten beobachten, wo die Spiele ausgetragen wurden, sondern in ganz Deutschland. Die Menschen sind also im ganzen Land bei schlechtem Wetter und bei interessanten Spielen stärker zusammengerückt. Die Ergebnisse sind für den epidemiologischen Kontext sehr interessant, da sich in diesen Situationen auch die Ansteckungsgefahr erhöht.

 

 

„Die wirtschaftliche Verwertbarkeit als auch die gesamtgesellschaftliche Relevanz von Mobilfunkdaten, wie sie bei NET CHECK generiert werden, gehen weit über den Telekommunikationsbereich hinaus.

(Steven Schulz, Leiter Machine Learning bei NET CHECK)

Worin besteht die Relevanz eurer Forschungsergebnisse?

S. Schulz: Die Projekte zeigen, dass sowohl die wirtschaftliche Verwertbarkeit als auch die gesamtgesellschaftliche Relevanz von Mobilfunkdaten, wie sie bei NET CHECK generiert werden, weit über den Telekommunikationsbereich hinausgehen. Die Anwendungsfälle betreffen Herausforderungen der öffentlichen Gesundheit, Infrastruktur und Städteplanung sowie der Katastrophenprävention.

 

Welchen Vorteil haben Mobilfunkdaten gegenüber anderen Methoden?

s. Schulz: Der Schlüssel liegt darin, über lange Zeiträume hinweg und in Quasi-Echtzeit ein genaues, statistisches Abbild der Bevölkerung zu erhalten und gleichzeitig die individuelle Anonymität zu wahren. Wir konnten durch den Crowdsourcing-Ansatz 1% der deutschen Bevölkerung abbilden und dadurch sehr repräsentative Ergebnisse erzielen.

 

Im Vergleich zu analogen Methoden wie Umfragen (z. B. zu Kontakten während der Pandemie) und Zähllisten (z. B. zur Ermittlung der Auslastung öffentlicher Verkehrsmittel) liegt der Vorteil darin, große Personenkreise über populäre Apps schnell zu erreichen, ohne dass eine aktive Dateneingabe erforderlich ist. Dieser Ansatz wird bei zukünftigen Virusvarianten sehr hilfreich in der Prognose von Infektionszahlen und der Verhinderung einer schnellen Verbreitung sein.

 

Welche Ergebnisse haben dich persönlich am meisten überrascht?

S. Schulz: Wir haben gezeigt, dass man das Auftauchen von neuen Virusvarianten ohne biologische Verfahren vorhersagen kann, einzig durch GPS-Daten. Das bedeutet, dass man dadurch in kommenden Pandemien schneller auf solche Veränderungen reagieren könnte. Durch den Crowdsourcing-Ansatz ist es zudem möglich, anonym eine sehr gute und repräsentative Stichprobe der Bevölkerung zu bekommen, ganz ohne Dateneingaben von Personen. Komponenten wie menschliche Fehlerquellen durch Erinnerungsdefizite oder falsche Eingaben fallen zudem weg.

 

 

* DAKI-FWS steht für Daten- und KI-gestütztes Frühwarnsystem zur Stabilisierung der deutschen Wirtschaft. Mehr Informationen: https://daki-fws.de/

** Das primäre Ziel von OptimAgent ist die Entwicklung eines agenten-basiertes Modells, welches speziell auf die deutsche Bevölkerung zugeschnitten ist und zur Entscheidungsunterstützung während Pandemien dienen soll. Diese Modell wird von Wissenschaftler:innen aus  13 verschiedenen Institutionen und 6 Teilprojekten entwickelt. Mehr Informationen: https://webszh.uk-halle.de/optimagent/