Datenanalyse für das Gemeinwohl

Daniel Kirsch
DSSG Berlin Blog
Published in
6 min readMar 25, 2015

--

Anwendungsfälle

Dieser Artikel bietet eine Übersicht von Anwendungsfällen und Beispielen, wie zivilgesellschaftliche Organisationen moderne Datenanalyse (“Data Science”) nutzen können.

“Big Data” und “Data Science” — das sind Begriffe, die in der deutschen Zivilgesellschaft nicht unbedingt positiv besetzt sind. In den großen Zeitungen wird in der Regel über die (zugegeben wichtigen) Themen Datenschutz und Algorithmenethik gesprochen. Das Potential mit Datenanalyse gemeinnützige Anwendungen zu schaffen wird hierzulande aber bislang kaum aufgegriffen.

DataKind’s Gründer Jake Porway bei TEDxMontreal

Das ist schade, denn in anderen Teilen der Welt sorgen Organisationen wie DataKind, BayesImpact und die “Data Science for Social Good” Stipendien in Chicago und Atlanta für soziale Innovationen. Diese Organisationen stellen gemeinnützigen Organisationen Prognoseverfahren zur Verfügung, wie sie sonst in der Online-Werbung und beim algorithmischen Handeln an der Börse eingesetzt werden. Sie schaffen für hochausgebildete Datenanalysten eine attraktive Umgebung, um zivilgesellschaftliche Probleme anzugehen. Beispielsweise analysieren und visualisieren diese “Data Scientists” Erfolge von Programmen gegen Obdachlosigkeit oder helfen knappe Ressourcen für Brandschutzkontrollen effizienter einzusetzen.

Seit Anfang des Jahres arbeiten wir — Data Science for Social Good Berlin — daran, dieses Konzept nach Deutschland zu bringen. Wir wollen auch hier zivilgesellschaftliche Organisationen mit Data Science unterstützen. Wie wir das tun wollen steht unten im Fazit.

Ein Beispiel aus Chicago — Bleibelastungen vorhersagen

Aber was genau ist Data Science? Und bei welchen Problemen können Data Scientists helfen? In den Gesprächen mit möglichen Partnern fällt immer wieder auf: Data Science ist ein sehr abstrakter und schwammiger Begriff. Die Organisationen, die wir unterstützen wollen, wissen damit nicht viel anzufangen und somit auch nicht, wie moderne Datenanalyse sie bei ihrer täglichen Arbeit unterstützen kann. Aus diesem Grund habe ich Beispiele zusammengetragen und kategorisiert. Ich hoffe, dass Leser aus zivilgesellschaftlichen Organisationen dadurch ein besseres Verständnis der Materie bekommen.

Und wenn Sie sich in einem der Beispiele wiederfinden, dann treten Sie bitte mit uns in Kontakt! Wir würden Sie gerne unterstützen.

Anwendungsfälle

Die Anwendungsfälle sind nach folgender Struktur aufgebaut: Problemstellung, Lösung, Beispiel. Im Anschluss folgt dann eine Liste von Links zu weiteren Beispielen — viele davon von DataKind oder Data Science for Social Good Chicago. Ich gehe dabei jeweils vom allgemeinen Fall aus, dass eine zivilgesellschaftliche Organisation einen gemeinnützigen Dienst zur Verfügung stellt. Das kann z.B. Drogenberatung für Süchtige oder eine warme Mahlzeit für Obdachlose sein.

Bedarfsanalyse/-vorhersage

Problem

Sie wollen herausfinden, wie Sie ihre Zielgruppe erreichen, aber Sie verfügen nicht über die benötigten Daten, um potentielle Leistungsempfänger zu identifizieren.

Lösung

Data Science hilft alternative Datensätze zu finden, die stark mit den unsichtbaren Eigenschaften der Zielgruppe korrelieren. Ein Modell sagt vorher, wie der Bedarf innerhalb einer Personengruppe/Region/etc. statistisch sein müsste.

Beispiel

GiveDirectly wollte Informationen über Armutsverhältnisse in Kenia haben. Es gab jedoch keine amtlichen Statistiken. Data Scientists haben geholfen ein System zu erstellen, das automatisch den Typ des Hausdaches auf Satellitenbildern erkennt, so dass die Armutsverhältnisse automatisch geschätzt werden konnten.

http://www.datakind.org/projects/using-the-simple-to-be-radical/

Weitere Beispiele

Wirkungsvorhersage

Problem

Sie müssen ihre begrenzten Ressourcen priorisieren, um eine große Anzahl von Fällen bearbeiten zu können.

Lösung

Data Science hilft die Wirkung ihrer Dienstleistung für jeden einzelnen Fall abzuschätzen. Sie können die Fälle so nach Wirkung oder Dringlichkeit priorisieren. Das gewonnene Modell kann auch darüber informieren, welche Gegebenheiten am stärksten zu einer großen Wirkung beisteuern.

Beispiel

Amnesty International bekämpft Menschenrechtsverletzungen. In Hilfsanfragen, die über das Urgent Action Network eingingen, konnten Data Scientists Muster identifizieren. Diese Muster deuteten darauf hin, welche Fälle in der Vergangenheit zu Krisen eskaliert sind. Jetzt kann anhand der Muster für neu eingehende Fälle eine Dringlichkeitsstufe geschätzt werden.

http://www.datakind.org/projects/using-predictive-analytics-to-prevent-human-rights-abuses/

Weitere Beispele

Wirksamkeitsanalyse

Problem

Sie wollen herausfinden, ob Ihr Programm / Ihre Kampagne / etc. die gewünschte Wirkung erzielt.

Lösung

Data Scientists können statistische Analysen anhand vorhandener Datensätze durchführen, um die Wirkung zu analysieren und zu visualisieren. Sie können auch beraten, welche zusätzlichen Datensätze für die Analyse verwendet werden können, falls Daten über die Zielgrößen nicht verfügbar sind.

Die Bestätigung der Wirksamkeit von Maßnahmen kann außerdem potentielle Geldgeber überzeugen.

Beispiel

Die Chicago Alliance to End Homelessness wollte herausfinden, welches ihrer Programme die größten Erfolge bewirkt. Data Scientists definierten zuerst Erfolgsmetriken und visualisierten dann die Ergebnisse.

http://dssg.uchicago.edu/2014/08/20/paths-homelessness.html

Links

Frühwarnsysteme

Problem

Sie wollen herausfinden, warum Leistungsempfänger/Freiwillige ein Programm unerwartet verlassen.

Lösung

Data Science hilft Muster in diesem Verhalten zu erkennen und die gefährdeten Personen wieder in das Programm einzugliedern.

Beispiel

DC Central Kitchen bietet u.a. Fortbildungen für sozial schwache Bürger an. Durch die Analyse ihrer Daten konnte aufgedeckt werden, dass Teilnehmer oft kurz vor Ende des Trainings aus dem Programm ausscheiden. Weitere Analysen zeigten, dass Teilnehmer mit bestimmten Eigenschaften mit höherer Wahrscheinlichkeit aufgeben. Mit diesem Wissen können sie jetzt proaktiv auf diese Teilnehmer zugehen und sie im Programm halten.

http://www.uschamberfoundation.org/food-data-great-opportunities

Weitere Beispiele

Betrugs-/Missbrauchserkennung

Problem

Sie wollen Betrug oder Missbrauch ihrer Dienstleistungen erkennen und verhindern.

Lösung

Die Analyse von Nutzungsdaten Ihrer Dienste deckt ungewöhnliches oder verdächtiges Verhalten auf, das auf Betrug, Verschwendung oder Missbrauch hindeutet.

Beispiel

Die Kommunalverwaltung von Los Angeles prüft Anträge auf Leistungsbezüge mit Hilfe von Datenanalyse auf ungewöhnliche Muster, um auszuwählen, wo Sonderprüfungen durchgeführt werden sollten.

http://www.govtech.com/health/Los-Angeles-County-Uses-Analytics-to-Stop-Child-Care-Fraud.html

Weitere Beispiele

Datenanreicherung

Problem

Ihre Organisation sammelt eine Menge Daten, die allerdings nur in unstrukturierter Form vorliegen (z.B. Word-Dokumente oder Fotos).

Lösung

Maschinelles Lernen oder Crowdsourcing (bzw. ein Mix aus beidem) wertet Ihre Daten auf, indem Fotos oder Textdokumente automatisch klassifiziert werden. Die gewonnenen Informationen werden dann für weitere Analysen (beispielsweise Wirkungsvorhersage) verwendet.

Beispiel

UN OCHA arbeitet in der Katastrophenbewältigung. Sie wollen im Fall einer Naturkatastrophe Bilder aus sozialen Medien kennzeichnen, wenn dort Infrastrukturschäden dargestellt werden. Sie können aufgrund begrenzter Ressourcen aber nur einen geringen Teil der Bilder kennzeichnen. Die Digital Humanitarians nutzten diesen Anteil z.B. 2012 beim Typhoon Bopha auf den Philippinen als Trainingsdaten für einen Algorithmus, der daraufhin eine viel größere Menge an Bildern in kürzerer Zeit automatisiert kennzeichnen konnte.

Weitere Beispiele

Fundraising

Ein Bereich in dem Data Science ebenfalls helfen kann ist Fundraising. Spender-Segmentierung und A/B-Tests sind nur zwei Beispiele.

Fazit

“Data Science” bietet auch für zivilgesellschaftliche Organisationen viel Potential — das derzeit oft ungenutzt bleibt. Die hier gezeigten Anwendungsfälle bringen hoffentlich mehr Klarheit, wie Datenanalyse für das Gemeinwohl eingesetzt werden kann.

Unsere Initiative ist auf der Suche nach Partner-Projekten, um zu zeigen, wie sich diese Chancen nutzen lassen.

Dabei wollen wir uns insbesondere an das Modell von DataKind anlehnen: DataKind fungiert als Pro-bono-Intermediär. Data Scientists gehen weiter ihren hoch bezahlten Tätigkeiten nach, aber bekommen durch DataKind die Möglichkeit, sich in ihrer Freizeit zivilgesellschaftlich zu engagieren — und zwar mit ihren besonderen mathematischen und informatischen Kenntnissen und Fähigkeiten. Dazu organisiert DataKind so genannte DataDives, bei denen ähnlich einem Hackathon an einem Wochenende die Daten von zwei oder drei Partner-Organisationen analysiert werden, um Antworten auf die Fragen der Partner-Organisationen zu finden. Denn sehr häufig sammeln zivilgesellschaftliche Organisationen alleine durch ihre tägliche Arbeit eine Vielzahl an Daten, aber lassen diese ungenutzt — häufig aus Mangel an Expertise. Und an Engagementpotenzial mangelt es nicht — DataKinds DataDives sind sehr gut besucht. Auch die Berliner Data Science Community zeigt reges Interesse.

Setzen Sie sich gerne mit uns in Verbindung!

http://dssg-berlin.github.io/

Hinweise und weitere Lektüre

Eine weitere Quelle für Beispiele ist http://datalook.io — ein Portal, auf dem datengetriebene Projekte mit Gemeinwohlabsicht gepostet und diskutiert werden können. Das Ziel ist es, die Besucher zur Replikation von Projekten zu inspirieren.

Ein Artikel im DataKind Blog teilt die Anwendungsfälle aus einem anderen Blickwinkel ein (descriptive insights, predictive insights, prescriptive insights).

Vom Nominet Trust gibt es einen Report zum Thema Big Data and social organisations, der eine gute Ergänzung zu diesem Artikel darstellt.

Bevor ich diese Initiative gestartet habe, war ich u.a. als Mitbegründer des OK Lab Münster bei Code for Germany aktiv. Code for Germany hat ähnliche Ideale, aber die Zielgruppe und Methoden unterscheiden sich leicht. Während Code for Germany in der Regel mit offenen Daten (Open Data — also meistens mit staatlichen Daten) arbeitet, geht es uns darum, zivilgesellschaftlichen Organisationen in direkter Zusammenarbeit ihre Datenpotentiale zugänglich zu machen. Dass staatliche Organisationen dieselben Potentiale besitzen, steht dabei außer Frage: Wir sind weiterhin eng mit Code for Germany in Kontakt.

Einen herzlichen Dank an Tobias Pfaff (Gründer von DataLook ) und Claudia Leißner (Proboneo) für das Korrekturlesen und für viel Inspiration für diesen Artikel.

--

--