Die „Daten-Kluft“ schliessen – Microsofts Engagement für eine Welt der offenen Daten

 |   Microsoft Schweiz

Microsoft hat heute seine Open-Data-Initiative gestartet, um der drohenden „Daten-Kluft“ entgegenzuwirken und Organisationen jeder Grössenordnung zu helfen, das Potenzial von Daten und datengetriebenen Technologien auszuschöpfen. Wir glauben fest, dass alle von der Nutzung und dem Austausch öffentlich zugänglicher Daten profitieren können, um fundierte Entscheidungen zu treffen, effizienter zu werden und sogar einige der weltweit drängendsten sozialen Herausforderungen zu bewältigen.

Wir hoffen, mit dieser Initiative die dringend notwendige Debatte über die Nutzung und den Austausch von Daten anzustossen und voranzubringen. Dazu kündigen wir heute die folgenden Schritte an:

  • Erstens veröffentlichen wir neue Prinzipien, die uns als Leitfaden für das Teilen von Daten mit anderen dienen werden.
  • Zweitens verpflichten wir uns, bis zum Jahr 2022 insgesamt 20 neue Datenpartnerschaften auf den Weg zu bringen. Dazu gehört die Zusammenarbeit mit einigen führenden Organisationen der Open-Data-Bewegung wie dem Open Data Institute (ODI) im Vereinigten Königreich und dem Governance Lab (GovLab) der New York University. Ausserdem wollen wir selbst mit gutem Beispiel vorangehen, indem wir Daten aus unseren eigenen sozialen Initiativen für die Öffentlichkeit zugänglich machen. Wir beginnen mit den Daten aus unserer Airband-Initiative: Indem wir diese mit den Daten anderer Organisationen kombinieren, helfen wir dabei, den Breitbandausbau zu beschleunigen.
  • Drittens werden wir in die notwendigen Voraussetzungen für das Teilen von Daten investieren, einschliesslich der erforderlichen Tools, Frameworks und Templates.

Gerade die letzten Monate haben gezeigt, dass Unternehmen und Organisationen von einem verbesserten Datenaustausch profitieren – und dadurch Herausforderungen effektiver bewältigen können. Daten tragen entscheidend dazu bei, dass wir Krisen – ob Klimawandel oder Corona-Pandemie – besser verstehen und überwinden können. Wir müssen den übergreifenden Informationsaustausch zwischen Unternehmen und Organisationen sicher und effizient zugleich gestalten. Die Förderung von Open Data war nie wichtiger als jetzt und die heute angekündigten Schritte sollen dazu beitragen. Wir bekennen uns zu den Zielen der Open-Data-Bewegung und wollen uns gemeinsam mit anderen Unternehmen und Organisationen dafür einsetzen.

YouTube Video

Was verstehen wir unter „Daten-Kluft“?

Obwohl die Datenmengen stark wachsen und sich KI-Technologien rasant weiterentwickeln, konzentrieren sich beide zunehmend in den Händen einer kleinen Minderheit: Es sind nicht einmal 100 Unternehmen, die mehr als die Hälfte aller durch Online-Interaktionen erzeugten Daten erfassen.[1] Rund die Hälfte aller KI-Experten sind im Technologiesektor beschäftigt.[2] Diese Firmen profitieren von den Vorteilen von Datenanalyse und KI, während andere leer ausgehen. Diese „Daten-Kluft“ stellt ein ernstes Problem für unsere Gesellschaft dar, denn eine enorme wirtschaftliche Macht konzentriert sich so auf einige wenige Länder und Unternehmen. So geht PWC auf Grundlage aktueller Trends davon aus, dass rund 70 Prozent des gesamten wirtschaftlichen Werts, der sich aus der Nutzung von KI ergibt, von zwei Ländern erwirtschaftet werden: den USA und China.[3]

Diese Daten-Kluft ist aber nicht unvermeidlich. Wenn Daten häufiger öffentlich zugänglich gemacht und geteilt werden, können Unternehmen von wertvollen Erkenntnissen profitieren, Fachwissen weitergeben und Daten nutzbringender für alle machen. Davon profitieren alle mehr, als wenn sie allein handeln.

Unsere Grundsätze

Bei der Arbeit an Open Data lassen wir uns von einer Reihe von Grundsätzen leiten, wie wir selbst Daten auf verantwortungsvolle Weise öffentlich zugänglich machen und teilen. Durch unsere Initiativen in den Bereichen Datenschutz, ethisch verantwortungsvolle KI und Nachhaltigkeit haben wir gelernt, wie bedeutend solche Prinzipien für die Beantwortung wichtiger und komplexer sozialer Fragen sind. Die folgenden fünf Prinzipen dienen uns als Orientierungshilfe beim Aufbau und bei der Förderung vertrauenswürdiger Datenpartnerschaften:

  • Offenheit – Microsoft wird sich dafür einsetzen, dass Daten, die für die Lösung wichtiger sozialer Probleme relevant sind, möglichst öffentlich verfügbar gemacht werden, und dafür auch eigene Daten bereitstellen.
  • Nutzbarkeit – Microsoft wird in die Entwicklung neuer Technologien und Tools, Steuerungsmechanismen und Richtlinien investieren, um jedermann die Möglichkeit zu geben, Daten einfacher und besser zu nutzen.
  • Unabhängigkeit – Microsoft wird Unternehmen und Organisationen dabei unterstützen, ihre eigenen Daten nach ihren Vorstellungen wertschöpfend zu nutzen und eigene KI-Experten einzusetzen und fortzubilden, um Daten effektiv und unabhängig zu verarbeiten.
  • Sicherheit – Microsoft wird Sicherheitsmassnahmen einführen, um dafür zu sorgen, dass der Datenaustausch operativ sicher erfolgt.
  • Datenschutz – Microsoft wird Unternehmen und Organisationen dabei unterstützen, den Schutz von personenbezogenen Daten in Datenpartnerschaften sicherzustellen.

Alle diese Prinzipien sind wichtig. Wie uns bei unserer Arbeit in diesem Bereich jedoch klar geworden ist, sticht eines als das herausforderndste hervor. Der entscheidende Schlüssel zum Erfolg ist: die Notwendigkeit, Daten besser nutzbar zu machen. Wenn Organisationen nicht in der Lage sind, Daten auf standardisierte Weise zu sammeln und zu kategorisieren, werden sie nicht in der Lage sein, sie so zu aggregieren und zu analysieren, dass der Datenaustausch zu einem optimalen Erkenntnisgewinn führt.

Neue Datenpartnerschaften

Neben der Entwicklung von Prinzipen ist vor allem die enge und weltweite Zusammenarbeit zwischen Unternehmen, Regierungen und Zivilgesellschaft erfolgsentscheidend. Um praktische Erfahrungen zu sammeln und die Herausforderungen und Lösungen beim Teilen von Daten noch besser zu verstehen, hat Microsoft es sich zum Ziel gesetzt, bis zum Jahr 2022 insgesamt 20 Datenpartnerschaften auf den Weg zu bringen. Um diese Partnerschaften zu fördern, wird Microsoft Daten aus seinen gesellschaftlichen Initiativen „standardisiert offen zugänglich“ machen und untersuchen, wo Daten aus Initiativen wie Airband, AI for Good und unserem Engagement zu Nachhaltigkeit und Teilhabe geteilt und zur Lösung realer Probleme genutzt werden können. In diesem Zusammenhang freuen wir uns, eine Partnerschaft mit dem Open Data Institute (ODI) bekannt geben zu können. Gemeinsam werden wir erste Kooperationen entwickeln und die Lehren, die wir daraus ziehen, mit anderen teilen, damit auch sie davon profitieren können. Der Fokus dieser Zusammenarbeit wird zunächst auf folgenden Bereichen liegen:

  • Förderung des Breitbandausbaus: Microsoft wird einen kleinen, aber wichtigen Datenbestand zur Breitbandnutzung in den USA zur Verfügung stellen. Diese Daten stammen aus der Airband-Initiative und werden unter einer freien Lizenz auf GitHub veröffentlicht. Gemeinsam mit dem ODI und BroadbandNow – einem Service, mit dem Verbraucher nach den verfügbaren Internetanbietern in ihrer Region suchen können – wollen wir diesen Datensatz ergänzen und so den Breitbandausbau voranbringen.
  • Kampf gegen die Corona-Krise: Die weltweite Ausbreitung des Coronavirus stellt eine der drängendsten Herausforderungen unserer Zeit dar. Deshalb wollen wir uns am datengestützten Kampf gegen diese Pandemie beteiligen. Dazu wird Microsoft seine Zusammenarbeit mit Adaptive Biotechnologies erweitern, um zu erforschen, wie das Immunsystem auf COVID-19 reagiert, und die Ergebnisse über eine öffentliche Datenbank für Forscher zugänglich machen, die sich an der Bekämpfung des Virus beteiligen. Damit bauen wir auf bestehenden Anstrengungen gegen die Ausbreitung der COVID-19-Erkrankung auf – etwa unserer Beteiligung am COVID-19 Open Research Dataset, das 47.000 wissenschaftliche Artikel zum Coronavirus in maschinell lesbarer Form öffentlich zugänglich macht.
  • Förderung kommunaler Datenkooperationen: Gemeinsam mit Arup und dem Oliver Wyman Forum wird Microsoft im Rahmen der London Data Commission zusammenarbeiten. Diese Open-Data-Initiative wurde von London First in Kooperation mit der Greater London Authority und anderen ins Leben gerufen, um den das Teilen von Daten und die datenbasierte Zusammenarbeit innerhalb Londons zu fördern und dadurch soziale und wirtschaftliche Probleme der Stadt zu lösen.
  • Förderung staatlicher Datenkooperationen: Um Regierungen dabei zu unterstützen, Daten öffentlich zugänglich zu machen und untereinander zu teilen, werden wir gemeinsam mit dem GovLab der New York University das Open Data Policy Lab aufbauen. Dieses Datenlabor stellt ein Echtzeit-Repository mit Best Practices und Ressourcen zur Verfügung; der Schwerpunkt liegt dabei auf 1) der Analyse in Form von vergleichender Erforschung von Dateninitiativen, die zur wirtschaftlichen Entwicklung beitragen; 2) Regelwerken, einschließlich von Toolkits, Frameworks und Best Practices zur Förderung des Datenaustauschs und der datengestützten Entscheidungsfindung; 3) dem Aufbau einer Gemeinschaft aus Data Stewards und anderen Daten-Stakeholdern im öffentlichen und privaten Sektor, sowie auf 4) Massnahmen zur Umsetzung von Proof-of-Concept-Initiativen.
  • Förderung der datenbasierten Gesundheitsversorgung: Mit dieser Arbeit ebnen wir den Weg für die erste globale Datenkooperation und fassen Daten aus zahlreichen Quellen zusammen, um eine der weltweit häufigsten Todesursachen zu bekämpfen: Herz-Kreislauf-Erkrankungen. Microsoft kooperiert mit der Novartis Foundation, Apollo Hospitals in Indien und Coala Life in Schweden, um deren Datenbestände zu solchen Erkrankungen aus Krankenhäusern und Einrichtungen der primären Gesundheitsversorgung weltweit zusammenzutragen. Ziel dieser Partnerschaft ist es, das führende KI-Tool zur Bestimmung des Herz-Kreislauf-Risikos – den von Apollo Hospitals entwickelten AICVD Risk Score – weiterzuentwickeln und zu nutzen, damit die medizinischen und gesundheitspolitischen Entscheidungen in diesem Bereich häufiger auf Daten basieren.

YouTube Video

Den Datenaustausch einfacher und sicherer machen

Daten sind wenig wert, wenn sie zwar offen, aber nicht nutzbar sind.  Deshalb setzt sich Microsoft dafür ein, den Mangel an benutzerfreundlichen Tools und Frameworks für den Datenaustausch zu beheben. Wie gross die Hürde uneinheitlicher Datenerhebung sein kann, haben wir bei unserem Engagement gegen die Corona-Krise festgestellt. Aktuell werden Daten in zahlreichen verschiedenen Formaten und Dokumenttypen erfasst, beispielsweise im Word- oder Excel-Format, als PDF-Datei oder sogar auf papierbasierten Formularen. Das macht es fast unmöglich, Daten nutzbringend zusammenzufassen und zu teilen. Mit unserer Initiative wollen wir zugleich weiter an der Entwicklung skalierbarer Tools arbeiten, die jede Organisation für einen reibungslosen Datenaustausch nutzen kann.

Für diese Arbeit lassen sich wertvolle Erkenntnisse aus der Welt der Open-Source-Software ableiten. Auch wenn es gewichtige Unterschiede zwischen Daten und Quelltexten gibt, vor allem was die Sicherheits- und Datenschutzanforderungen an die Datenverarbeitung angeht, können wir unsere Open-Source-Erfahrung für einen erfolgreichen Datenaustausch nutzen. Dabei werden wir uns weiterhin darauf konzentrieren, Datennutzungsvereinbarungen auszuarbeiten und Musterverträge bereitzustellen, die jeder für den einfachen freien Datenaustausch verwenden kann. Ein weiterer Schwerpunkt wird darin bestehen, die Lizenzen und rechtlichen Werkzeuge auf der Microsite zur Open-Data-Kampagne zu erweitern. Schließlich werden wir unsere Arbeit zur Differential Privacy in Zusammenarbeit mit dem Institute for Quantitative Social Science (IQSS) der Harvard University fortsetzen und der Allgemeinheit weitere Tools zur Verfügung stellen, um nützliche Informationen aus Datenbeständen zu gewinnen, ohne dass der Schutz personenbezogener Daten beeinträchtigt wird.

Das Schliessen der Daten-Kluft ist eine große Herausforderung. Die Chancen für Organisationen jeder Grössenordnung und für die Gesellschaft insgesamt sind jedoch erheblich. Wir bei Microsoft haben beschlossen, einen wesentlichen Beitrag dazu zu leisten, und freuen uns auf die Zusammenarbeit und den Wissensaustausch mit anderen, die sich ebenfalls dafür einsetzen, dass letztlich alle den Mehrwert von Daten realisieren können.

[1] Auf Basis der Analysen von similarweb.com, appfigures.com und alexa.com

[2] Auf Basis von LinkedIn-Daten

[3] https://www.pwc.com/gx/en/issues/data-and-analytics/publications/artificial-intelligence-study.html

 

Lesen Sie den Artikel von Jennifer Yokoyama, Chief IP Counsel von Microsoft (in Englisch)

Besuchen Sie die Microsite mit weiteren Informationen (in Englisch)