Open Science in Corona-Zeiten

Joachim Gassen leitet das Open Science Data Center des TRR 266. Er spricht über drei Projekte, die das Zentrum kürzlich als Reaktion auf die COVID-19-Pandemie gestartet hat.

 

Das Kernziel des Open Science Data Centers des TRR 266 „Accounting for Transparency” ist es, die Vorteile von Open Science zu fördern. Wir sehen deutlich, wie sich das Interesse der akademischen Gemeinschaft und auch der Öffentlichkeit verschiebt –  hin zur COVID-19 Pandemie, den Auswirkungen staatlicher Interventionen sowie den Auswirkungen auf Wirtschaft und Gesellschaft im Allgemeinen. Die Rolle von Open Science besteht darin, Beiträge zu diesen Themen zu liefern – und zwar so, dass andere mitarbeiten und ihren Beitrag leisten können. Normalerweise handelt es sich bei diesen Anderen meist um Wissenschaftler*innen. Angesichts des allgemeinen Interesses an diesem Thema ist derzeit jedoch ein breites Publikum daran interessiert, COVID-19 bezogene Daten zu verstehen und zu bewerten. Diese Situation bietet Open Science eine wichtige Gelegenheit zu glänzen.

Also: Wie gehen wir auf dieses Bedarf ein, wenn wir hauptsächlich damit beschäftigt sind, die Dateninfrastruktur für den TRR 266 einzurichten und mit den Daten zu Offenlegungen von Unternehmen zu ringen? Angesichts des Fachwissens des TRR 266 über regulatorische Eingriffe, Datenverarbeitung und Visualisierung haben wir beschlossen, dass das Open Science Data Center des TRR 266 am besten helfen kann, indem es diese drei miteinander verbundenen Projekte in Angriff nimmt:

  1. Die Bereitstellung einer code-basierten und gewarteten Infrastruktur, die es ermöglicht öffentlich zugängliche Daten auf Länderebene über die Ausbreitung der COVID-19 Pandemie abzurufen sowie über damit zusammenhängende staatliche Interventionen und über die Auswirkungen dieser Intervention auf das Verhalten.
  2. Die Bewertung und der Vergleich der Datenqualität öffentlich zugänglicher Datenquellen für staatliche Interventionen.
  3. Die Bereitstellung eines Visualisierungstools für die breite Öffentlichkeit, das es jedem ermöglicht, die Entwicklung der Pandemie unabhängig zu beurteilen, und das zeigt, wie Designentscheidungen  die Aussage von Datenvisualisierungen beeinflusst.

Die Ergebnisse dieser Projekte unterscheiden sich von „traditionellen“ Forschungsergebnissen in Papierform, da die Idee von Open Science darin besteht, Forschung verfügbar und wiederverwendbar zu machen. Außerdem wollten wir schnell handeln, damit andere Forscher*innen von unseren Anstrengungen bei der Durchführung eigner Projekte profitieren können.

 

PROJEKT 1: R-Paket “tidycovid19”

Für das erste Projekt haben wir das R-Paket „tidycovid19“ veröffentlicht. Damit lassen sich  COVID-19 bezogene Daten aus verschiedenen Quellen ganz einfach herunterladen. Die Daten umfassen unter anderem tagesaktuelle Länderdaten zur Ausbreitung der Pandemie sowie die beiden Hauptquellen für staatliche Interventionsdaten und Mobilitätsdaten, die von Google und Apple zur Verfügung gestellt werden. Einige dieser Daten liegen in bereits gut strukturierten Formaten vor, andere Daten müssen etwas genauer betrachtet werden bis sie verwendet werden können. Und dann gibt es Daten, die im PDF-Format zur Verfügung gestellt wurden, wobei die wichtigsten Daten in Liniendiagrammen versteckt waren. Das Paket bietet Funktionen zum Herunterladen, Bereinigen und Zusammenführen all dieser Datenquellen zu einem kombinierten und einsatzbereiten Datensatz auf Land-Tag-Ebene. In einer Reihe von Blogeinträgen auf meiner persönlichen Website wird der Daten- und Kodierungsansatz diskutiert, sodass andere das Paket nicht nur nutzen, sondern sich auch von seiner Code-Basis inspirieren lassen können:

Weitere Informationen zum R-Paket

Die vollständige Code-Basis des Pakets ist auf GitHub verfügbar  

 

PROJEKT 2: Bewertung öffentlich zugänglicher Datenquellen für Regierungsinterventionen

Da der TRR 266 nachweislich über Fachwissen verfügt, das für die Untersuchung regulatorischer Interventionen erforderlich ist, liegt unser Hauptaugenmerkt bei COVID-19 darauf, regulatorische Interventionen und ihre Wirkung zu dokumentieren. Glücklicherweise gibt es mehrere Initiativen, die systematisch Interventionsdaten auf globaler Ebene sammeln. Die beiden größten sind:

  • der Datenspeicher, der von ACAPS zur Verfügung gestellt wird – h einer NGO, die sich auf die Bereitstellung unabhängiger Informationen zu humanitären Fragen konzentriert, und
  • ein  sogenannter Government Response Tracker, der von der Blavatnik School of Government an der Universität Oxford eingerichtet wurde.

Die Bewertung und der Vergleich der Datenquellen von ACAPS und der Blavatnik School of Government sind aufschlussreich, da sie ihre Daten jeweils anders organisieren, was zu unterschiedlichen Niveaus in der Datenqualität führt. Die Sicherung der Datenqualität ist ein zentrales Forschungsthema in Open Science und angesichts der Aktualität und fundamentalen Bedeutung dieser Datenbestände im Rahmen von COVID-19 von zentralem Interesse. Auch hier haben wir unsere Arbeit in einem Blogbeitrag dokumentiert, der auf meiner persönlichen Website zu finden ist. Der Post enthält einen Code zur Überprüfung unserer Analysen. Wir arbeiten derzeit aktiv mit den Datenlieferanten zusammen, um die Entwicklungen der Dateninfrastruktur zu Regierungsinterventionen im Zusammenhang mit Covid-19 zu unterstützen.

 

PROJEKT 3: Visualisierungswerkzeuge

Während sich die ersten beiden Projekte an ein wissenschaftliches Publikum richten, um Forschung zu unterstützen, die sich auf die Rolle staatlicher Interventionen bei der COVID-19-Pandemie konzentriert, richtet sich das letzte Projekt an ein breiteres Publikum. Es ist beruhigend zu sehen, dass akademische Forschung, Daten und Fachwissen in der Öffentlichkeit in diesen Zeiten hochgeschätzt werden. Datengestützte Bewertungen erfordern jedoch Erfahrung. Die Verbreitung des Virus wird oft durch visuelle Darstellungen kommuniziert (siehe die Berichterstattung der Financial Times als zentrales Beispiel). Diese Darstellungen haben jedoch erstaunliche Freiheitsgrade.

Folglich kann ein*e Analytiker*in, wenn er/sie diese Darstellungen strategisch einsetzt, sehr unterschiedliche Botschaften vermitteln. Um einen Einblick in diese Sachverhalte zu geben und dem interessierten Publikum die Möglichkeit zu gewähren, sich selbst ein Bild von der Ausbreitung der Pandemie zu machen, haben wir als Teil des oben erwähnten R-Pakets ein interaktives Display entwickelt. Es ermöglicht den Nutzern, die Ausbreitung der COVID-19-Pandemie in verschiedenen Dimensionen zu erforschen. Ein verwandter Blogbeitrag auf meiner persönlichen Website behandelt das Thema „Freiheitsgrade der Visualisierung“: Sie zeigt einige Beispiele dafür, wie man auf der Grundlage der gleichen zugrundeliegenden Daten sehr unterschiedlich kommunizieren kann.

Verwenden Sie das Display

 

In Kombination tragen diese drei Projekte zu der schnellwachsenden, offenen Wissenschaftsgemeinschaft bei, die sich mit der COVID-19-Pandemie befasst. Es ist beruhigend und ermutigend zu sehen, dass die Forschung schnell handeln kann, um dringende Probleme anzugehen. Wir im Open Science Data Center des TRR 266 freuen uns, unsere kleinen Teile zu einem großen und herausfordernden Puzzle beizutragen.

 

Antworten

Ihre E-Mail-Adresse ist erforderlich, um einen Kommentar hinterlassen zu können. Diese Adresse wird selbstverständlich NICHT veröffentlicht, nur Ihr Name ist für andere sichtbar. Bitte beachten Sie, dass der Kommentarbereich moderiert wird – dies ist notwendig, um Spam und Netzmissbrauch zu verhindern.

Mehr zum Thema

Transparente Forschung

Prof. Dr. Joachim Gassen
Prof. Dr. Caren Sureth-Sloane

Die Initiatoren und Sprecher des TRR 266, Caren Sureth-Sloane und Joachim Gassen, blicken auf die Entstehung des Projekts zurück und erklären, warum Transparenz nicht nur Gegenstand ihrer Forschung, sondern auch zentraler Bestandteil ihrer Arbeitsphilosophie ist. Weiterlesen