Das Forschungsteam um Prof. Dr. Achim Rettinger begleitet die Untersuchung mit einem Social–Media–Monitoring anhand von Daten („Tweets“) der Microblogging–Plattform Twitter, das zudem mit der Medienberichterstattung anhand von Daten des Media–Monitoring–Anbieters Event Registry abgeglichen wird.
Über den gesamten Untersuchungszeitraum werden anhand definierter Suchanfragen (über die Twitter-API) Daten zu sechs Aspekten erhoben, die den Schwerpunkten der repräsentativen Umfrage entsprechen.
Im Fokus stehen hierbei Aussagen zur wirtschaftlichen Situation, zum Migrationsdiskurs, zum Diskurs über die Unterstützung der Ukraine, zum Vertrauen gegenüber dem politischen System, zur Medienberichterstattung und zur Energiewende.
Ziel ist es, Veränderungen in der Einstellung (Social Sentiment) zu diesen Aspekten zu messen und mit den Daten der Panel-Befragung abzugleichen. Dazu wird ein Teilkorpus der erhobenen Daten mit Hilfe eines Annotationshandbuchs nach den sechs untersuchten Aspekten und der Sentiment-Polarität des jeweiligen Tweets (positiv / neutral / negativ) abgebildet.. Die Annotation erfolgt kollaborativ durch mehrere Annotator*innen über ein eigens hierzu entwickeltes Tool unter Beachtung des Inter-Annotator Agreement. Die aktuelle Datenbasis (Stand Anfang März 2023) umfasst 500.000 Tweets, von denen bereits 2.000 den untersuchten Aspekten manuell zugeordnet wurden.
Auf Basis dieser Daten konnten mit Hilfe vortrainierter, transformerbasierter Sprachmodelle (bert-base-german-cased) Klassifikationsmodelle trainiert werden, die im Zuge der manuellen Annotation laufend verbessert werden und schließlich die Annotation des Gesamtkorpus unterstützen. Basierend auf dem teils manuell, teils maschinell annotierten Korpus werden schließlich die erhobenen Sentiment-Polaritäten der Einzelaspekte mit Events des Medien–Monitorings (Ereignisse des Tagesgeschehens) und den Ergebnissen der Panel-Befragung abgeglichen.