Ramy otwartych danych na rzecz wpływu społecznego

Wprowadzenie Jak najlepsze wykorzystanie otwartych danych i współpracy w zakresie danych

Notatka od Burtona Davisa

W firmie Microsoft wierzymy, że dane mają kluczowe znaczenie dla rozwiązywania ważnych problemów społecznych, przed którymi stoi dziś nasz świat. Globalna pandemia pokazała nam, jak ważną rolę odgrywają dane w zrozumieniu, ocenie i podjęciu działań w celu rozwiązania wyzwań, jakie stwarza COVID-19. Jednak prawie wszystkie organizacje, duże i małe, wciąż walczą o to, by dane były istotne dla ich pracy. Pomimo wartości, jaką niosą ze sobą dane, wiele organizacji nie potrafi wykorzystać ich potencjału do poprawy wyników.

Część tej walki wynika z "przepaści w danych" - luki, która istnieje między krajami i organizacjami, które mają skuteczny dostęp do danych, aby pomóc im w innowacji i rozwiązywaniu problemów, a tymi, które nie mają. Aby zniwelować tę przepaść, firma Microsoft rozpoczęła w 2020 roku Kampanię Otwartych Danych, która ma pomóc w realizacji obietnicy większej ilości otwartych danych i współpracy w zakresie danych, które napędzają innowacje.

Jedną z kluczowych lekcji, jakie wyciągnęliśmy z kampanii i pracy, jaką wykonaliśmy z naszymi partnerami, Open Data Institute i The GovLab, jest to, że zdolność do dostępu i wykorzystania danych w celu poprawy wyników obejmuje znacznie więcej niż narzędzia technologiczne i same dane. Ważne jest również, aby móc wykorzystać i dzielić się doświadczeniami i praktykami, które promują efektywną współpracę z danymi i podejmowanie decyzji. Jest to szczególnie prawdziwe w przypadku współpracy z rządami, organizacjami wielostronnymi, organizacjami non-profit, instytucjami badawczymi i innymi, które starają się otworzyć i ponownie wykorzystać dane w celu rozwiązania ważnych problemów społecznych, szczególnie tych, z którymi borykają się kraje rozwijające się.

Innymi słowy, sam dostęp do danych i technologii nie tworzy w magiczny sposób wartości i nie poprawia wyników. Maksymalne wykorzystanie otwartych danych i współpracy w zakresie danych wymaga zastanowienia się nad tym, w jaki sposób kierownictwo organizacji może zaangażować się w uczynienie danych użytecznymi w realizacji jej misji, zdefiniowania pytań, na które chce odpowiedzieć za pomocą danych, zidentyfikowania umiejętności, których zespół potrzebuje, aby korzystać z danych, a także określenia, w jaki sposób najlepiej rozwijać i budować zaufanie wśród współpracowników i społeczności, którym dane służą, aby uzyskać więcej wglądu i korzyści z danych.

Open Data for Social Impact Framework jest narzędziem, które liderzy mogą wykorzystać do rozwiązywania najważniejszych dla nich problemów. Uznając, że nie wszystkie dane mogą być publicznie dostępne, dostrzegamy ogromne korzyści, jakie mogą płynąć z rozwoju bardziej otwartych danych, niezależnie od tego, czy przybierają one formę zaufanej współpracy, czy też prawdziwie otwartych i publicznych danych. Wyrażenie "wpływ społeczny" oznacza pozytywną zmianę w kierunku rozwiązania problemu społecznego, takiego jak redukcja emisji dwutlenku węgla, likwidacja luki w dostępie do szerokopasmowego Internetu, budowanie umiejętności zawodowych oraz zwiększanie dostępności i integracji.

Wierzymy w nieograniczone możliwości, jakie daje otwieranie, udostępnianie i współpraca w zakresie danych, co pozwala wyciągać nowe wnioski, podejmować lepsze decyzje i zwiększać efektywność w rozwiązywaniu najbardziej palących problemów na świecie.

Burton Davis
Wiceprezes i zastępca głównego radcy prawnego grupy ds. własności intelektualnej w firmie Microsoft

 

Ta strona nie ma na celu dostarczenia wskazówek prawnych i nie powinna być traktowana jako taka. Ramy zawierają zasoby, które mają pomóc organizacjom w rozwoju otwartych danych i angażowaniu się we współpracę w zakresie danych dla dobra społecznego. Udostępnianie danych nie jest pozbawione ryzyka. Zaleca się uzyskanie niezależnej porady prawnej. Ta witryna zawiera łącza do zasobów stron trzecich. Microsoft nie ponosi odpowiedzialności za jakiekolwiek straty, obrażenia lub szkody wynikające z korzystania z łączy lub polegania na materiałach udostępnianych przez osoby trzecie.

Szybki start: Twoja mapa drogowa do otwartych danych Prosta mapa drogowa jak zacząć

Zapoznaj się z mapą drogową

Organizacje zainteresowane korzystaniem z otwartych danych mogą rozumieć ich korzyści i zastosowanie w konkretnych projektach, ale jak zrobić ten pierwszy krok może być niejasny. Poniżej znajduje się prosta mapa drogowa, którą można podążać, aby zacząć korzystać z większej ilości otwartych danych w celu sprostania wyzwaniom w swojej organizacji, społeczności i większym świecie. Tam, gdzie jest to wskazane, kliknij, aby dowiedzieć się więcej i przejść do odpowiednich sekcji w tym dokumencie.

1. Ustal, czy posiadasz odpowiednią infrastrukturę organizacyjną.

Dla wielu organizacji przyjęcie podejścia opartego na otwartych danych jest zmianą kulturową. Czy interesariusze są przekonani do tego rozwiązania? Czy oszacowano inwestycje niezbędne do wykorzystania danych w praktyce? Czy udało się zbudować zaufanie wśród interesariuszy? Upewnij się, że znasz te odpowiedzi, zanim podejmiesz kolejny krok.

Dowiedz się więcej w Przywództwo: Czy jesteś gotowy, aby wykorzystać dane do poprawy wyników społecznych?

2. Zrozum pytania, na które chcesz odpowiedzieć za pomocą danych.

Strategia pozyskiwania danych rozpoczyna się od określenia pytań, na które chcemy odpowiedzieć. Po zidentyfikowaniu tych pytań można określić, jakie zbiory danych są potrzebne i czy mamy do nich dostęp.

Dowiedz się więcej w Okazja: Na jakie pytania chcesz odpowiedzieć za pomocą danych?

3. Zgromadzić niezbędne talenty.

Potrzebujesz właściwej strategii i odpowiednich zbiorów danych. Ale potrzebujesz również odpowiednich ludzi, którzy zapewnią analizę i wgląd w przebieg projektu. Upewnij się, że ocenisz wymagane umiejętności w zakresie danych i że wszyscy członkowie zespołu rozumieją, że współpraca jest podstawą projektu.

Dowiedz się więcej w Talent: Czy masz talent potrzebny do analizy danych?

4. Budowanie zaufania w społeczności.

Stwórz dobre ramy zarządzania, aby zapewnić, że zarówno możliwości, jak i zagrożenia związane z danymi są uwzględnione. Upewnij się, że Twoja polityka zarządzania zapewnia przejrzystość wśród interesariuszy, integrację wśród członków społeczności, a także promuje rozwój, dzięki czemu rozumieją oni, dlaczego gromadzenie i wykorzystywanie otwartych danych leży w ich najlepszym interesie.

Dowiedz się więcej w Zarządzanie społecznością: Czy zbudowałeś zaufanie w swojej społeczności wokół wykorzystania danych?

5. Upewnij się, że masz odpowiednie zasoby danych.

Narzędzia do analizy i wizualizacji danych są niezbędne w przypadku pracy z szerokim zakresem zbiorów danych i dużą ilością danych. Podobnie, upewnienie się, że uwzględnione są wszelkie potrzeby związane z ochroną prywatności i bezpieczeństwem jest niezbędne do odpowiedzialnej współpracy w zakresie otwartych danych i udostępniania danych.

Dowiedz się więcej w Technologia i dane: Jakich rozwiązań i zasobów potrzebujesz, aby umożliwić i zwiększyć swój wpływ?

Tło i kontekst Wyzwania związane z otwartymi danymi wyjaśnione

Dlaczego dostęp do danych jest tak ważny?

Sztuczna inteligencja, czyli AI, jest podstawą cyfrowej transformacji, której obecnie doświadcza świat. Operacje przemysłowe, procesy biznesowe, zarządzanie klientami i inne są przekształcane przez uczenie maszynowe, które stwarza możliwość większego eksperymentowania, wydajności i szybkości. Usprawnienie zbierania, przechowywania i zarządzania dużymi ilościami danych tworzy bardziej wiarygodne spostrzeżenia, które organizacje mogą wykorzystać w procesie podejmowania decyzji.

Duże i zróżnicowane zbiory danych mogą pomóc wzmocnić te spostrzeżenia lub je uzupełnić. Otwarte dane, czyli takie, które są publikowane dla każdego, kto ma do nich dostęp, może z nich korzystać i dzielić się nimi bez ograniczeń, mogą pomóc użytkownikom rozwiązywać problemy z większą szybkością i przy większym autorytecie, co może prowadzić do szybszych przełomów, a ponieważ mogą być również predykcyjne, mogą generować prognozy z większą dokładnością. Z tych powodów wartość, jaką otwarte dane oferują w opiece zdrowotnej, nauce, edukacji, środowisku i innych dziedzinach, jest niezmierzona i może pomóc w rozwiązywaniu największych wyzwań społecznych.

Ale czy otwierając dane, nie stracą one na wartości?

W większości przypadków dane same w sobie nie stanowią wartości, wartość wynika z tego, co się z nimi robi. W tym kontekście warto również zwrócić uwagę na kilka ekonomicznych aspektów danych. Dane są nierywalizacyjne - mogą być wielokrotnie wykorzystywane przez wiele osób bez uszczuplania ich wartości, a także mogą być wykorzystywane do osiągnięcia efektów sieciowych - na przykład więcej danych może stworzyć lepszą sztuczną inteligencję, która może przyciągnąć więcej użytkowników i wygenerować więcej danych.

Otwarcie danych lub zwiększenie ich dostępności może potencjalnie wygenerować większą wartość niż utrzymywanie ich w izolacji i może uwolnić ogromną wartość publiczną. Użytkownicy, którzy łączą dane z innymi zbiorami danych lub pracują z nimi w nowym kontekście, mogą odkryć nowe spostrzeżenia, które nie były widoczne przy ich pierwotnym wykorzystaniu. Jak zauważa Open Data Policy Lab w swoich 9Rs Framework, bardziej otwarte dane mogą również umożliwić odtwarzalność, zwiększając zaufanie do wyników poprzez umożliwienie innym prowadzenia identycznych lub powiązanych prac.

Kluczem nie jest zwykłe przekazanie danych innym użytkownikom, ale współpraca z nimi w celu zrozumienia, w jaki sposób są one wykorzystywane i jak korzyści z tych zastosowań można przekazać społeczności. Wartość danych wynika z tego, w jaki sposób są one wykorzystywane, aby ułatwić nadawanie nowych znaczeń i rozwiązań. Otwarcie danych może pomóc w uniknięciu niewykorzystanych zastosowań i utraty wartości danych, jeśli pozostają one zamknięte. To jest właśnie duch współpracy w otwartych danych. Ich wartość jest nieskończona.

Więcej na temat wartości danych można znaleźć w raporcie Open Data Institute " The Value of Data".

Co z obawami o prywatność związanymi z otwarciem danych?

Obawą związaną z otwarciem danych może być ryzyko ujawnienia danych wrażliwych. Ochrona prywatności osób oraz ochrona poufnych lub komercyjnie wrażliwych informacji może być wymagana przez prawo lub regulowana przez umowę. Ponadto organizacje muszą brać pod uwagę ryzyko utraty reputacji, ryzyko etyczne i handlowe związane z udostępnianiem danych wrażliwych.

Aby chronić interesariuszy w ekosystemie udostępniania danych oraz wzbudzić zaufanie do udostępniania danych, ważne jest, aby chronić dane wrażliwe za pomocą odpowiednich środków prawnych, technicznych i organizacyjnych. Wymóg ten nie powinien jednak powstrzymywać organizacji przed realizacją skutecznej strategii w zakresie danych. Poziom ochrony można raczej osiągnąć poprzez wdrożenie odpowiednich ram zarządzania odpowiedzialnym udostępnianiem danych.

Na przykład narzędzia zwiększające prywatność mogą być stosowane w celu utrzymania informacji osobistych w tajemnicy. Technologie i techniki takie jak prywatność różnicowa, szyfrowanie homomorficzne, poufne przetwarzanie, anonimizacja i usuwanie tożsamości mogą być wykorzystane do ochrony prywatności osób fizycznych przy jednoczesnym zwiększeniu dostępu do danych dla organizacji, naukowców i społeczeństwa obywatelskiego. Chociaż technologie te mogą nie być odpowiednie dla wszystkich, mogą być przydatne w pewnych kontekstach.

Więcej na temat czynników sprzyjających i utrudniających, które często decydują o wpływie inicjatyw związanych z otwartymi danymi, można znaleźć w The GovLab's Periodic Table of Open Data's Impact Factors.

Korzyści z otwartych danych dla Twojej organizacji

Pozwala na podejmowanie bardziej świadomych decyzji

Otwarte dane mogą zapewnić zainteresowanym stronom nową wiedzę, która pomoże im podejmować bardziej świadome i obiektywne decyzje. Wartość dodatkowych zbiorów danych pochodzących z różnych źródeł może pomóc użytkownikom uzyskać większą jasność wokół zagadnień i odblokować nowe spostrzeżenia. Jak mówi dyktat, "nie wiesz, czego nie wiesz". Otwarte dane stanowią okazję do odkrycia nowych możliwości, których użytkownicy wcześniej nie brali pod uwagę.

Siłą napędową tego procesu jest sama natura otwartych danych. Na przykład, dane mogą być analizowane na wiele sposobów, aby ujawnić wzorce i uzyskać wieloaspektowy obraz problemu, który użytkownik próbuje rozwiązać. Wyniki te mogą być udostępnione szerszej publiczności, która może w ten sposób poprawić wyniki lub stworzyć nowe, jeszcze nie odkryte. Oprócz szerszej wymiany i świadomości, otwarte dane mogą zachęcić innych do odwzajemnienia się i przynieść korzyści wszystkim.

Na przykład The Nature Conservancy (TNC)-Indie i Microsoft wykorzystują istniejące otwarte zdjęcia satelitarne do stworzenia nowego otwartego zbioru danych na temat farm słonecznych w Indiach. Dane te pomogą zidentyfikować czynniki wpływające na przydatność gruntów pod projekty solarne, a ostatecznie pomogą agencjom publicznym lepiej planować rozwój energii słonecznej.

Podejmowanie decyzji nie musi więc być ściśle oparte na zbiorach danych, które znajdują się w jednej organizacji. Otwarte dane umożliwiają dostęp do danych, które są publikowane przez inne podmioty, a to może stworzyć możliwość dalszego wprowadzania danych do organizacji, co jeszcze bardziej wzbogaca wynik końcowy i proces decyzyjny.

Co stwarza nowe możliwości odkryć

Jak zasugerowano powyżej, otwarte dane pomagają użytkownikom zidentyfikować i rozwiązać różne problemy, które mogły nie być początkowo brane pod uwagę. Otwarte dane pomagają również organizacjom w identyfikacji powiązań z innymi zbiorami danych. Purdue Food and Agricultural Vulnerability Index wykorzystał bardzo różne otwarte zbiory danych, aby uzyskać nowy wgląd w wpływ COVID-19 na produkcję rolną oraz zdrowie rolników i pracowników rolnych.

Dzięki dostępowi do większej ilości danych, spostrzeżenia mogą być uzyskiwane szybciej. Daje to użytkownikom swobodę eksperymentowania z nowymi pomysłami, dostrzegania nieznanych wcześniej korelacji lub przedłużania fazy odkrywania. To ciągłe rozwijanie danych pozwala na nowe możliwości w sposób, który może być bardziej efektywny niż istniał wcześniej.

W rezultacie można przyspieszyć innowacje

Przełomowe odkrycia w nauce wykorzystujące otwarte dane pokazały nam, że stanowi to ważny model dla naukowców, który promuje dzielenie się protokołami, raportowanie i rozpowszechnianie wyników, dzielenie się kodem i wiele innych. Sama natura każdego rodzaju badań jest w istocie uzależniona od tego, czy dane są możliwe do przeszukiwania, dostępne i możliwe do ponownego wykorzystania, co umożliwia kontrolę ze strony osób trzecich.

Obietnica otwartych danych polega na tym, że otwierają one te drzwi i przyspieszają badania i innowacje z korzyścią dla społeczeństwa. Na przykład udostępnienie lub upublicznienie niektórych danych dotyczących zdrowia pomogło przyspieszyć rozwój terapii medycznych, takich jak szczepionki wyprodukowane w celu zwalczania wirusa COVID-19. Wnioski wyciągnięte z tego doświadczenia skłoniły Stany Zjednoczone do przeznaczenia miliardów dolarów na wsparcie bardziej terminowych badań. Narodowe Instytuty Zdrowia przekazały do tej pory fundusze w wysokości prawie 4,9 miliarda dolarów na wsparcie projektów badawczych dotyczących COVID-19. Włączenie zasad otwartych danych do tych programów może pomóc w przyspieszeniu badań, co przyniesie korzyści zarówno w przypadku obecnej pandemii, jak i kryzysów, które są przed nami.

Wartość otwartych danych - w liczbach

  • W raporcie McKinsey Global Institute z 2013 roku rynek otwartych danych, wyceniany na 3 biliony dolarów rocznie, koncentruje się na wartości połączenia otwartych danych rządowych ze współdzielonymi danymi posiadanymi przez przedsiębiorstwa.
  • W 2014 r. firma Lateral Economics oszacowała, że potencjalna wartość otwartych danych dla G20 wyniesie ok. 2,6 bln USD rocznie, przyczyniając się do zagregowanego produktu krajowego brutto (PKB) krajów G20 w wysokości ok. 1,1% w latach 2014-2019, czyli 55% celu G20 w zakresie dodatkowego wzrostu na poziomie 2%.
  • W 2020 r. europejski portal danych oszacował, że wartość otwartych danych dla UE28+ wyniosła 184,45 mld euro w 2019 r. i prognozował, że do 2025 r. osiągnie od 199,51 do 334,20 mld euro. W raporcie przyjrzano się również danym dotyczącym zatrudnienia - w 2019 r. było 1,09 mln pracowników zajmujących się otwartymi danymi, a do 2025 r. prognozowano od 1,12 do 1,97 mln pracowników zajmujących się otwartymi danymi.
  • Transport for London poinformował, że wykorzystanie jego otwartych danych pozwoliło firmom z sektora prywatnego wnieść do londyńskiej gospodarki od 12 do 15 milionów funtów rocznie.

Dodatkowe spostrzeżenia i studia przypadków dotyczące tego, dlaczego firmy zaczynają dzielić się danymi, można znaleźć na stronie Open Data Institute "Siedem powodów, dla których firmy powinny dzielić się danymi".

Więcej na temat uzasadnienia biznesowego dla współpracy w zakresie danych i ponownego wykorzystania danych w interesie publicznym można znaleźć w dokumencie Open Data Policy Lab' s 9Rs Framework.

Open Data for Social Impact Framework Narzędzie, którego mogą używać liderzy

O ramie

Open Data for Social Impact Framework jest narzędziem, które liderzy mogą wykorzystać do rozwiązywania ważnych problemów społecznych, takich jak redukcja emisji dwutlenku węgla, likwidacja różnic w dostępie do szerokopasmowego Internetu, podnoszenie kwalifikacji zawodowych oraz zwiększanie dostępności i integracji społecznej. Poniższe ramy zostały opracowane, aby pomóc liderom organizacji w całym ekosystemie danych - rządom, organizacjom non-profit i organizacjom wielostronnym - w uzyskaniu wiedzy i rozwiązań, które mogą wykorzystać do rozwiązania ważnych problemów społecznych.

Strona ta identyfikuje pięć obszarów tematycznych, które organizacje powinny rozważyć, chcąc wykorzystać dane do poprawy wyników społecznych: przywództwo, możliwości, umiejętności, zarządzanie społecznością oraz technologia i dane. Proponuje pytania, które należy zadać i oferuje zasoby, które mogą pomóc w odpowiedzi na nie. Koncepcje te są urzeczywistniane poprzez przykłady z rzeczywistych projektów związanych z otwartymi danymi. Znajduje się tam również mapa drogowa do otwartych danych, którą liderzy organizacji mogą wykorzystać, aby rozpocząć pracę.

Te ramy mogą służyć jako narzędzie pomocne w tworzeniu podstaw dla otwartych danych i współpracy w zakresie danych. Istnieje jednak wiele innych doskonałych zasobów, z których można czerpać, a które mogą pomóc osobom pragnącym wykorzystać dane do celów społecznych.

Ramy te promują kulturę otwartych danych i współpracy w zakresie danych, prowadząc liderów organizacji przez następujące pytania:

1. Przywództwo: Czy jesteś gotowy, aby wykorzystać dane do pracy w celu poprawy wyników społecznych?

2. Możliwości: Na jakie pytania chcesz odpowiedzieć za pomocą danych?

3. Umiejętności: Czy masz talent potrzebny do analizy danych?

4. Zarządzanie społecznością: Czy zbudowałeś zaufanie w swojej społeczności wokół wykorzystania danych?

5. Technologia i dane: Jakich rozwiązań i zasobów potrzebujesz, aby mierzyć, umożliwiać i zwiększać swój wpływ?

1. Przywództwo Przywództwo: Czy jesteś gotowy, aby wykorzystać dane do pracy w celu poprawy wyników społecznych?

Przyjęcie otwartego podejścia to zmiana kulturowa

Liderzy organizacji mogą napotkać szereg obaw lub oporów przy wykorzystywaniu danych do rozwiązywania trudnych wyzwań. W niektórych z tych przypadków brakuje talentów - od naukowców i analityków danych po kierowników programów i badaczy - do pozyskiwania i analizowania danych. W innych przypadkach długi czas potrzebny na stworzenie struktury zarządzania współdzieleniem danych z innymi organizacjami może spowodować, że współpraca zostanie zarzucona zanim zacznie przynosić korzyści.

Ostatecznie, dla większości organizacji, przyjęcie podejścia opartego na otwartych danych jest zmianą kulturową.

W tym miejscu należy zauważyć, że organizacje znajdują się na spektrum dojrzałości w zakresie danych - od wczesnego zaangażowania w wykorzystanie danych do innowacji do kultury, w której innowacje w zakresie danych są wbudowane na każdym poziomie. Niezależnie od tego, w którym miejscu tego spektrum znajduje się organizacja, podejście oparte na otwartych danych wymaga lidera, który jest zaangażowany w wykorzystanie danych organizacji do pracy. To zaangażowanie może przybierać różne formy, takie jak:

  • Orędownictwo i publiczne mówienie o znaczeniu udostępniania danych.
  • Wyciąganie wniosków z danych.
  • Zachęcanie do współpracy i angażowania społeczności.
  • Budowanie relacji z kluczowymi beneficjentami i potencjalnymi użytkownikami danych.
  • Ustalenie ram odpowiedzialnego korzystania z danych.

Są to wszystkie działania, które pomagają budować godne zaufania podejście do udostępniania danych, które może wzbudzić zaufanie wśród zainteresowanych stron.

Kroki do rozważenia

Rozważ następujące kroki, aby lepiej przygotować swoją organizację do innowacyjnego wykorzystania danych w celu rozwiązania priorytetowych problemów:

  • Jakie inwestycje są potrzebne, aby wykorzystać dane do pracy?
  • Jakie bodźce są potrzebne, aby wykorzystać dane w praktyce?
  • Jak budujesz zaufanie wewnętrzne i zewnętrzne? Kim są twoi partnerzy/interesariusze?
  • Jak można zbudować impet w organizacji, aby uznać innowacje z danymi za długoterminowy priorytet, a nie krótkoterminowy projekt?

Wymagane jest silne przywództwo

Nie dziwi więc, że organizacje, które traktują dane priorytetowo jako istotny zasób, wymagają silnego przywództwa. Według badania opublikowanego w lipcu 2021 roku przez Data Orchard, 63% respondentów twierdzi, że przywództwo w ich organizacji nie jest przekonane o wartości danych. Tylko jedna trzecia twierdzi, że ich przywództwo jest zaangażowane i wspierające, zadaje właściwe pytania dotyczące danych i jest aktywne w wykorzystaniu ich wartości. Obietnica wykorzystania danych stwarza istotną szansę dla liderów na poprawę ich zdolności do wykorzystania danych z korzyścią dla ich organizacji.

GovLab w NYU jest gospodarzem Data Stewards Academy, która obejmuje program samokształcenia. Kurs przeznaczony jest dla osób, które w różnym stopniu pełnią funkcję zarządców danych na całym świecie - funkcję, która ma na celu udzielenie odpowiedzi na powyższe pytania w sposób umożliwiający systemową, zrównoważoną i odpowiedzialną współpracę w zakresie danych.

Profil: Jak kierownictwo Światowej Organizacji Zdrowia przekształciło swoją kulturę, aby była oparta na danych

Zmiany kulturowe, strategiczne i operacyjne są niezbędne do wdrożenia inicjatyw związanych z otwartymi danymi i ich udostępnianiem. Aby wykorzystać potencjał tych korzyści - w tym odpowiedzialność za wyniki, zaufanie, przejrzystość i bezpieczeństwo - liderzy muszą najpierw zająć się wewnętrznymi barierami i innymi rodzajami oporu organizacyjnego. Może to obejmować zakwestionowanie status quo, wdrożenie reform na dużą skalę lub podjęcie nowego zestawu ryzyk - dla wszystkich tych zmian, a zwłaszcza w dużej organizacji, niezbędne jest silne przywództwo i zaangażowanie.

Światowa Organizacja Zdrowia (WHO) nieustannie udowadnia tę konieczność podczas przekształcania kultury organizacyjnej w kierunku bardziej zorientowanym na dane. Zatrudniając ponad 8000 pracowników na całym świecie i odpowiadając przed 194 państwami członkowskimi w sześciu regionach, wdrożenie inicjatywy transformacji cyfrowej mogło nastąpić tylko dzięki silnemu przywództwu i działaniom na każdym poziomie.

Jako organizacja wielostronna, WHO ma wyjątkowy status podmiotu opartego na nauce i dowodach, który ustanawia globalnie obowiązujące normy i standardy z misją promowania zdrowia, utrzymywania bezpieczeństwa na świecie i służenia słabszym. Kiedy dr Tedros Adhanom Ghebreyesus został mianowany Dyrektorem Generalnym WHO w 2017 r., uznał, że dane są krytycznym elementem realizacji tej misji i spełnienia celów "potrójnego miliarda", czyli miliarda osób więcej cieszących się lepszym zdrowiem i dobrostanem, miliarda osób więcej z dostępem do przystępnej cenowo powszechnej ochrony zdrowia i miliarda osób więcej lepiej chronionych przed sytuacjami kryzysowymi w zakresie zdrowia.

W 2019 roku dr Tedros zademonstrował swoje zaangażowanie w przekształcenie WHO w nowoczesną, opartą na danych organizację, publicznie ogłaszając swoją wizję i ustanawiając nowy Wydział Danych, Analityki i Dostarczania na rzecz Wpływu (DDI). Wydział ten został utworzony, aby pilnie zająć się lukami w danych, zmniejszyć fragmentację danych i zwiększyć wydajność w kompleksowych procesach danych WHO. Szczególny nacisk położono na konsolidację danych i zasobów dotyczących zdrowia dla użytkowników zewnętrznych i wewnętrznych, a także na wykorzystanie nowoczesnych technologii, w tym zabezpieczeń danych prywatnych i wrażliwych, przejrzystej analityki i zaawansowanych metod wizualizacji.

Od samego początku kierownictwo WHO postawiło sobie za cel zbudowanie zaufania i ciągłości zarówno wśród wewnętrznych, jak i zewnętrznych interesariuszy poprzez promowanie strategicznego i spójnego podejścia do zarządzania danymi. Zarządzania Danymi, w skład którego wchodziło kierownictwo wyższego szczebla, w celu wyznaczenia kierunku strategii i polityki w zakresie danych. Utworzono również Data Hub and Spoke Collaborative, aby ułatwić wdrożenie zasad zarządzania danymi w całej WHO, przy czym reprezentowane były wszystkie odpowiednie programy i każdy region. Zadaniem kierownictwa wyższego szczebla było regularne wspieranie spotkań grupy w celu udzielania wskazówek, a tym samym zachęcanie do postępu i zapewnienie bardzo potrzebnego wsparcia w celu zinstytucjonalizowania nowego mechanizmu zarządzania danymi.

W ramach działań zewnętrznych WHO zwróciła się o pomoc do doradców zewnętrznych i nawiązała współpracę z organizacjami spoza ONZ, w tym z sektorem prywatnym, w celu zwiększenia swoich możliwości w zakresie danych i analiz. W czerwcu i wrześniu 2021 r. zwołała dwa szczyty dotyczące zarządzania danymi dotyczącymi zdrowia, aby zgromadzić WHO, państwa członkowskie, partnerów i opinię publiczną w celu dokonania przeglądu najlepszych praktyk i podkreślenia potrzeby posiadania danych dotyczących zdrowia jako globalnego dobra publicznego.

Dodatkowo, we współpracy z Microsoftem, Avanade i innymi podmiotami, kierownictwo WHO dokonało długoterminowej inwestycji w rozwój i utrzymanie systemów technicznych niezbędnych do podejmowania decyzji dzięki aktualnym, wiarygodnym i możliwym do wykorzystania danym. Inwestycja ta zaowocowała stworzeniem World Health Data Hub (WHDH). WHDH jest pierwszym na świecie kompleksowym, całościowym rozwiązaniem dla globalnej służby zdrowia i ma na celu usprawnienie procesów oraz zapewnienie dostępności, możliwości wyszukiwania i wykorzystania danych przez wszystkich interesariuszy.

W trakcie całego procesu transformacji kierownictwo WHO zademonstrowało to zaangażowanie, wypowiadając się publicznie, będąc widocznym i zaangażowanym zarówno wewnętrznie, jak i zewnętrznie, a także dokonując długoterminowych inwestycji w praktyczne narzędzia (takie jak WHDH) i zmianę zachowań (takie jak zaktualizowana karta wartości), które są niezbędne do wdrożenia. Ta zakrojona na szeroką skalę zmiana kulturowa na organizację opartą na danych byłaby niemożliwa bez zaangażowania liderów, a WHO może służyć za przykład dla innych organizacji, które chcą dokonać podobnej zmiany.

2. Okazja Opportunity: Na jakie pytania chcesz odpowiedzieć za pomocą danych?

Zrozumienie "dlaczego" jest niezbędne do rozpoczęcia projektu

Zrozumienie, dlaczego chcesz rozwiązać problem, wydaje się dość prostym zadaniem. W rzeczywistości, pytanie "dlaczego" może wydawać się tak proste, że ten krok może być często pomijany. Jednak pytanie "dlaczego" jest niezbędne do zainicjowania projektu, a także do utrzymania trwałego rozwiązania. Jest ono wymagane w całym cyklu życia innowacji, począwszy od budowania rozmachu w organizacji, informowania o zaangażowaniu interesariuszy, napędzania postępu w projekcie, wyprowadzania właściwego podejścia do zarządzania, zapewnienia, że dane są odpowiednie do celu, aż do wdrożenia rozwiązania technicznego.

Określenie pytań, na które musisz odpowiedzieć, aby rozwiązać swój problem

Zidentyfikowanie pytań, na które chcesz odpowiedzieć, jest pierwszym kluczowym krokiem. Po zidentyfikowaniu pytań, można zacząć myśleć o rozwiązaniach potrzebnych do ich realizacji i pomóc w rozwiązaniu problemu.

Przykłady problemów, w których rozwiązaniu mogą pomóc otwarte dane to:

  • Moja organizacja posiada dane, które mogą przyczynić się do poprawy planowania mobilności w moim regionie. Jak mogę podzielić się tymi danymi w znaczący i odpowiedzialny sposób?
  • Moja organizacja opublikowała otwarte dane dotyczące nierówności rasowych. Jak możemy zachęcić do korzystania z tych danych?
  • Jakie są najbardziej opłacalne i sprawiedliwe interwencje w celu poprawy jakości powietrza w każdym regionie, w szczególności w odniesieniu do źródeł zanieczyszczeń mających wpływ na kraje o niskich i średnich dochodach?

Aby zapoznać się z tym ostatnim przykładem oraz z innymi pilnymi pytaniami o dużym znaczeniu, które mogłyby zostać rozwiązane, gdyby odpowiednie zbiory danych były wykorzystywane w odpowiedzialny sposób, odwiedź inicjatywę The GovLab's The 100 Questions Initiative.

Zrozumieć, jak dane mogą pomóc w odpowiedzi na te pytania

Teraz, gdy zidentyfikowałeś pytania, następnym krokiem jest zrozumienie, gdzie Twoja organizacja jest na drodze do uzyskania tych odpowiedzi. Aby to zrobić, pomocne może być zmapowanie obecnego ekosystemu danych. Mapowanie ekosystemu danych może być wykorzystane do zbadania nowych źródeł danych, wykorzystania istniejących przepływów danych, zidentyfikowania miejsc, w których potrzebne są zmiany oraz zidentyfikowania innych interesariuszy, którzy również pracują nad rozwiązaniem tego samego lub podobnego problemu.

Jednym ze sposobów na rozpoczęcie pracy jest zmapowanie aktorów w ekosystemie danych i sposobu wymiany wartości w nim. Na przykład, wartość może być w postaci danych, ale może to być również wymiana informacji zwrotnej lub wiedzy.

Aby wykonać ćwiczenie z zakresu mapowania ekosystemu danych, odwiedź stronę Open Data Institute's Data Ecosystem Mapping : Tool and Guidance.

Określenie wartości dla interesariuszy

Zapewnienie dostępu do danych może być krytyczną częścią tego zadania, ale nie jest to jedyny element, który należy wziąć pod uwagę. Ważne jest również, aby rozważyć szerzej, jak wszyscy interesariusze w całym ekosystemie danych będą realizować wartość.

Wewnętrznie, liderzy wyższego szczebla będą musieli uzyskać poparcie interesariuszy i zbudować impet w organizacji, aby stawić czoła wyzwaniu. Zewnętrzni interesariusze będą musieli zrozumieć zgodność z ich interesami i mieć motywację do zaangażowania się. Innymi słowy, będą potrzebowali odpowiedzi na pytanie: "co z tego będę miał?".

Uwzględnienie interesów interesariuszy pomoże ostatecznie zbudować zaufanie. Może to obejmować zaangażowanie interesariuszy w dyskusję na temat wymiany wartości, np. poprzez udział w grupowej sesji mapowania ekosystemu danych.

Określenie, które zbiory danych będą pomocne

Próba oceny krajobrazu danych jest zadaniem zniechęcającym. Po jasnym zdefiniowaniu pytań, na które chcemy odpowiedzieć, etap identyfikacji zbiorów danych staje się zadaniem łatwiejszym do wykonania. Oceńcie posiadane dane i określcie, które otwarte i współdzielone dane są potrzebne do rozwiązania problemu. Możesz to osiągnąć poprzez:

  • Korzystanie z listy kontrolnej określenie danych, które posiadasz i co możesz z nimi zrobić, np:
    • Z czego składa się zbiór danych?
    • Jakie aspekty trzeba chronić i jak wrażliwe są dane?
    • Skąd pochodzą dane? Zrozumienie rodowodu danych jest kluczowym elementem sprzyjającym wiarygodnemu wykorzystaniu danych. Rodowód" odnosi się do jakości zbioru danych i jest oparty na kilku czynnikach, w tym na pochodzeniu zbioru danych (w tym na metrykach szacowanej wiarygodności, zaufania i ryzyka).
    • Gdzie przechowywane są dane?
    • Do jakich celów będzie wykorzystywany?
    • Czy istnieją jakieś ograniczenia w dostępie lub użytkowaniu?
  • Identyfikacja luk w danych i określenie partnerów, którzy mogą wnieść wkład w projekt lub zasoby do uzyskania otwartych danych.
  • Wykorzystanie otwarcie dostępnych zbiorów danych, takich jak te udostępnione na zasadach otwartych danych na Azure Open Datasets, GitHub i Microsoft Research Open Data.
  • Przygotowanie wewnętrznych zbiorów danych do udostępniania na zewnątrz. W przypadku danych, które mogą być udostępniane jako otwarte, zaleca się stosowanie Community Data License Agreement - Permissive, Version 2.0 (CDLA-Permissive-2.0) lub innej licencji na udostępnianie danych. Warunki pomagają użytkownikom zrozumieć warunki i ograniczenia regulujące korzystanie z danych. Dołączenie odpowiednich warunków identyfikuje dane jako otwarte, daje jasność co do ich ponownego wykorzystania i sprzyja innowacyjności. Organizacje pozarządowe mogą uzyskać dostęp do Microsoft Nonprofit Innovation Hub, który zawiera lekki szablon prawny do nawiązania współpracy w zakresie danych.
  • Partnerstwo z innymi organizacjami lub interesariuszami, którzy próbują rozwiązać ten sam problem.

Profil: Dbanie o równość poprzez współpracę w zakresie danych

Na początku 2021 roku Open Data Institute i Microsoft uruchomiły sieć Peer Learning Network, której celem jest pomoc organizacjom współpracującym wokół danych w skuteczniejszym radzeniu sobie z wyzwaniami, przed którymi stają. Obejmowało to zbadanie kwestii związanych z zaufaniem i wiarygodnością między uczestnikami i innymi interesariuszami.

W pierwszym warsztacie uczestnicy zostali zapoznani z narzędziem Data Ecosystem Mapping, aby zbadać przepływy danych i wartości w ich ekosystemach. Obejmowało to pokonywanie barier w dzieleniu się danymi poprzez opracowanie mapy ekosystemu zaufania, aby zrozumieć, gdzie zaufanie - lub jego brak - wpływa na wartość tworzoną przez przepływy danych.

Jeden z projektów sieci Peer Learning Network, Caring for Equality, realizowany przez rząd miasta Buenos Aires w Argentynie, Center for Global Development oraz Open Data Charter, miał na celu rozwiązanie problemu nierówności w zakresie zadań związanych z opieką, które ograniczają autonomię ekonomiczną kobiet. Wykorzystując dane z wielu prywatnych i publicznych źródeł, zespoły stworzyły "System Wskaźników Opieki", który miał zająć się sytuacją w Buenos Aires i dostarczyć informacji w celu poprawy tworzenia polityki i odpowiedzialności wobec obywateli miasta.

W ramach współpracy wykorzystano ćwiczenie Data Ecosystem Mapping w celu zidentyfikowania dostawców i źródeł danych, sposobu, w jaki można uzyskać dostęp do danych i wykorzystać je, a także sposobu uwzględnienia wyzwań związanych z zaufaniem w zakresie udostępniania danych z rządem i w jego obrębie. Ćwiczenie to doprowadziło do podjęcia ważnych decyzji, które pomogą poprowadzić inicjatywę do przodu ze wspólnym zrozumieniem wartości budowanego systemu opieki.

Więcej informacji na temat Caring for Equality można znaleźć tutaj.

Profil: Jak Londyn wykorzystał otwarte dane do lepszego zrozumienia możliwości ładowania samochodów elektrycznych

Kiedy Londyn ogłosił swój plan stania się miastem o zerowej emisji dwutlenku węgla do 2030 roku, zaistniała potrzeba rozważenia bardziej ekologicznych metod transportu w całym mieście i na okolicznych przedmieściach. Biorąc pod uwagę, że przejście z pojazdów napędzanych benzyną i olejem napędowym na pojazdy elektryczne może pomóc w zmniejszeniu emisji dwutlenku węgla, miasto musiało lepiej zrozumieć możliwości stworzenia lepszej infrastruktury do ładowania elektrycznego. Wymagało to umożliwienia deweloperom i operatorom punktów ładowania współpracy w celu stworzenia bogatszych zbiorów danych, aby zrozumieć zapotrzebowanie właścicieli pojazdów elektrycznych (EV).

Stworzono pilotażowy program udostępniania danych, aby zrozumieć, jak można poprawić infrastrukturę ładowania EV w Londynie. W ramach publiczno-prywatnego programu udostępniania danych opracowano spostrzeżenia, które pozwoliły określić potencjalne lokalizacje dla stacji ładowania EV. Program pilotażowy pokazał potencjał dzielenia się danymi, współpracy w zakresie danych i otwartych danych, aby pomóc w rozwoju infrastruktury ładowania EV w Londynie i ostatecznie wesprzeć cel Londynu, jakim jest osiągnięcie neutralności węglowej do 2030 roku.

Zbiory danych, w tym dane dotyczące zachowań komunikacyjnych, dane dotyczące pojemności ładunków oraz dane z rejestru gruntów, pomogły zidentyfikować ponad 2 000 działek publicznych w mieście, które powinny być dalej rozważane jako miejsca kandydujące do lokalizacji punktów ładowania pojazdów elektrycznych.

Przejrzystość danych umożliwia miastu przedstawienie podstaw analizy, co pomaga wzbudzić zaufanie wśród sceptyków i motywację wśród inwestorów w infrastrukturę ładowania EV. Osoby trzecie mogą przeanalizować analizę, aby zastanowić się, czy wyciągnięte wnioski są wiarygodne i dokładne. Ogólnie rzecz biorąc, wykorzystanie otwartych danych w projekcie pokazało, że dzięki wymianie danych pokonanie barier infrastrukturalnych jest możliwe w przypadku przedsięwzięcia na tak dużą skalę.

Więcej informacji na temat pilotażu EV Charging Infrastructure można znaleźć tutaj.

3. Talent Talent: Czy masz talent potrzebny do analizy danych?

Posiadanie umiejętności niezbędnych do pracy z danymi jest kluczowe dla każdej organizacji

Tak jak dostęp do danych jest kluczowy dla organizacji w rozwiązywaniu problemów i wprowadzaniu innowacji, tak posiadanie umiejętności niezbędnych do pracy z tymi danymi jest kluczowe dla każdej organizacji. Jednak według danych LinkedIn, około połowa osób posiadających techniczne umiejętności w zakresie AI pracuje w sektorze technologicznym i często brakuje ich w innych organizacjach i sektorach.

Kiedy starasz się wykorzystać dane do pracy w swojej organizacji, ważne jest, aby upewnić się, że Twoja organizacja ma talent niezbędny do stworzenia i realizacji planu, który pozwoli Ci uzyskać wgląd w dane i odpowiedzi, które chcesz uzyskać. Nie oznacza to, że trzeba zatrudniać zespoły informatyków. Przeciwnie, wiele zawodów i zestawów umiejętności pracuje z danymi w różnych formach, w tym analitycy danych, naukowcy zajmujący się danymi, inżynierowie oprogramowania i badacze. Talent, którego potrzebujesz, będzie wynikał z umiejętności w zakresie danych potrzebnych do realizacji Twojej inicjatywy.

Ocena potrzebnych umiejętności w zakresie danych

Lista kontrolna pytań dla Twojej organizacji do wykorzystania przy tej ocenie może obejmować:

  • Jakie krytyczne umiejętności w zakresie danych są potrzebne do rozwiązania zidentyfikowanego wyzwania? Na przykład umiejętności techniczne mogą obejmować zarządzanie systemami i infrastrukturą do przetwarzania danych, wdrażanie potoków danych i analiz oraz wizualizację lub raportowanie danych. Potrzebne umiejętności nietechniczne mogą obejmować konsultacyjne zbieranie wymagań, zarządzanie interesariuszami i zarządzanie programem.
  • Jakie umiejętności w zakresie danych posiada dziś Twoja organizacja?
  • Gdzie masz krytyczną lukę w umiejętnościach?
  • Czy możesz współpracować z inną organizacją, aby wypełnić tę lukę, czy też będziesz potrzebował talentu we własnej organizacji?
  • Czy musisz zatrudnić nowe talenty? Czy istnieje możliwość podniesienia kwalifikacji obecnych talentów?
  • Czy oferujecie dziś programy szkoleniowe, które pomagają rozwijać umiejętności w zakresie danych? Jakie programy szkoleniowe mogą być potrzebne?

Szczegółowe opisy kluczowych ról technicznych i biznesowych dla zespołu interdyscyplinarnego można znaleźć w "The AI playbook", do pobrania tutaj.

Dodatkowe zasoby można znaleźć w dokumencie Open Data Institute's Data Skills Framework.

Profil: Korzyści z Crowdsourcingu z wykorzystaniem Open Data

Crowdsourcing z wykorzystaniem otwartych danych pomaga organizacjom w rozwiązywaniu trudnych problemów, ponieważ może prowadzić do nieoczekiwanych rozwiązań, szybszego rozwiązywania problemów i zmniejszenia obciążenia użytkowników. Crowdsourcing działa poprzez wykorzystanie ochotników (lub płatnych) zbierających dane, którzy mogą, ale nie muszą mieć bezpośrednich powiązań z organizacją prowadzącą badania. Ich pomoc może ostatecznie zredukować koszty i czas poprzez rozszerzenie obecnych umiejętności i systemów. Postępy w technologii mobilnej przyczyniły się do wzrostu popularności crowdsourcingu, ponieważ więcej osób ma obecnie większy dostęp do danych i szerokiej gamy społeczności na całym świecie.

Do korzyści płynących z crowdsourcingu należą:

  • Zróżnicowane dane. Ponieważ osoby biorące udział w badaniu mogą reprezentować różne grupy użytkowników z całego świata, ich wkład prawdopodobnie będzie odzwierciedlał różnorodność potrzebną do uzyskania najbardziej wiarygodnych wyników.
  • Obniżone koszty. Poprzez outsourcing zbierania danych, organizacje mogą być w stanie zredukować koszty i mniej zasobów może być potrzebnych do pozyskiwania, czyszczenia i strukturyzowania zbiorów danych wewnątrz organizacji.
  • Większe zaufanie. Już sama nazwa "crowdsourcing" sugeruje, że dane są pozyskiwane spoza jednej organizacji i sięgają do szerokiego grona współpracowników. Dzięki temu proces ten może zyskać na wiarygodności. Większe zaufanie może przyczynić się do zwiększenia udziału społeczeństwa w badaniach.

Dobrym przykładem crowdsourcingu w dziedzinie medycyny jest m.in. Folding@home, organizacja i platforma internetowa, która wykorzystuje crowdsourcing do przyspieszenia symulacji, takich jak te, które składają się na koronawirus odpowiedzialny za COVID-19, oraz do opracowania nowych terapii.

Dzięki współpracy z Microsoft AI for Health, dr Greg Bowman, biofizyk molekularny z Washington University School of Medicine w St. Louis, zaprosił ochotników z całego świata do wykorzystania ich osobistych mocy obliczeniowych do przeprowadzenia symulacji białek i przesłania wygenerowanych danych z powrotem na swoje serwery. Zbiorowa pasja do rozwiązania globalnej pandemii sprawiła, że liczba urządzeń uruchamiających Folding@home wzrosła z około 10 000 do 1 miliona w ciągu zaledwie dwóch miesięcy. Bowman widzi metodę crowdsourcingu polegającą na wykorzystaniu otwartych danych jako model do walki zarówno z istniejącymi, jak i przyszłymi chorobami.

"Możemy wziąć problem, który zająłby 500 lat na pojedynczym komputerze stacjonarnym i rozwiązać go w ciągu sześciu miesięcy" - powiedział.

Dowiedz się więcej o Folding@home i dr Gregu Bowmanie.

Więcej informacji na temat programu i projektów Microsoft AI for Health można znaleźć tutaj.

4. Zarządzanie wspólnotowe Zarządzanie społecznością: Czy zbudowałeś zaufanie w swojej społeczności wokół wykorzystania danych?

Ustanowienie ram dobrego zarządzania

Wykorzystanie danych w celu rozwiązania problemów społecznych często wiąże się z istotnymi kwestiami dotyczącymi zarządzania i zgodności. Ważne jest, aby umieścić te kwestie w kontekście społeczności interesariuszy zainteresowanych danymi i ich wykorzystaniem. Budowanie silnych relacji z tą społecznością pomoże promować dobre zarządzanie i zidentyfikować nowe i dopuszczalne zastosowania, które mogą prowadzić do nieoczekiwanych korzyści ze współpracy w zakresie danych lub powiązanej inicjatywy. Jeśli społeczność zaufa tym możliwościom, mogą one zwiększyć korzyści z inicjatywy dotyczącej danych dla wszystkich zaangażowanych lub dotkniętych organizacji, osób i społeczności.

Dobre ramy nadzoru mogą pomóc w ograniczeniu ryzyka. Ryzyko to może mieć charakter prawny i regulacyjny, ale istotne znaczenie dla organizacji ma również ryzyko związane z zaufaniem publicznym i reputacją. Należy je zrównoważyć z ryzykiem nieudostępnienia danych do celów związanych z interesem publicznym. GovLab, jak i inni, określają ten proces jako poszukiwanie sposobów uniknięcia zarówno niewłaściwego wykorzystania danych, takiego jak nieautoryzowane wykorzystanie danych, które szkodzi osobom, których dane dotyczą, jak i niewykorzystanych szans na poprawę życia ludzi poprzez ponowne wykorzystanie danych. Poniżej przedstawiono przykłady rozwiązań w zakresie zarządzania, które, jeśli zostaną rozważone i zastosowane na wczesnym etapie, mogą być wykorzystane zarówno do zmniejszenia ryzyka, jak i zwiększenia możliwości wykorzystania danych.

Zarządzanie zapewniające przejrzystość i zgodność z przepisami

Co by było, gdybyśmy mogli umożliwić korzystanie z danych, które każdy może zrozumieć? Mogłoby to obejmować opracowanie inicjatywy, w którą od początku wbudowana jest jedna z poniższych uwag:

  • Przejrzystość w zarządzaniu inicjatywą i w radach zarządzających
  • Przejrzystość w zakresie celu inicjatywy
  • Przejrzystość w zakresie gromadzonych, udostępnianych lub tworzonych danych
  • Przejrzystość w zakresie zgodności wykorzystania danych z prawem i przepisami
  • Określenie osoby odpowiedzialnej za dane
  • Bezpieczne przechowywanie i udostępnianie danych
  • Zapewnienie dostępu lub udostępnianie danych w sposób chroniący prywatność i wrażliwe informacje handlowe
  • Dostarczanie wiedzy szerokiemu gronu interesariuszy, gdzie korzyści są wspólne
  • Stosowanie podejść, które dają osobom i organizacjom możliwość wypowiedzenia się na temat tego, jak dane są gromadzone, wykorzystywane, przechowywane i udostępniane

Zarządzanie, które tworzy wsparcie społeczności

A gdybyśmy mogli zbierać dane, które pomagają lokalnym społecznościom rozwiązywać lokalne problemy? Co by było, gdybyśmy wykorzystali dane do usuwania barier w integracji? Odpowiedzi na takie pytania pomogą pokazać społeczeństwu, że wykorzystywanie danych w nowy i odpowiedzialny sposób leży w jego interesie i może mieć pozytywne skutki w dłuższej perspektywie.

Zarządzanie, które umożliwia otwarte wykorzystanie

Jakie mechanizmy są stosowane w celu zapewnienia, że dane mogą być udostępniane i wykorzystywane? Rozważania mogą obejmować:

  • Jak uczynić dane "tak otwartymi, jak to tylko możliwe", aby wspomóc innowacyjność i wykorzystać oraz połączyć dane w nowy i interesujący sposób. Czy dane mogą być otwarte lub udostępnione w zaufany sposób, np. poprzez anonimizację?
  • Jak można zapewnić interoperacyjność danych przy użyciu wspólnych modeli danych, standardów lub stabilnych identyfikatorów? Na przykład zasady FAIR zawierają wskazówki dotyczące poprawy możliwości wyszukiwania, dostępności, interoperacyjności i ponownego wykorzystania danych badawczych.

Przedstawienie tych celów może być bardzo pomocne w opracowaniu ram zarządzania uczciwym, otwartym i godnym zaufania ekosystemem danych. Przydatnym narzędziem do opracowania i oceny sposobu wykorzystania danych jest Data Ethics Canvas Instytutu Open Data.

Przez cały cykl życia inicjatywy, ramy zarządzania powinny być weryfikowane w celu stworzenia pętli informacji zwrotnej, aby zapewnić, że cele są stale oceniane, zwłaszcza jeśli te cele ulegają zmianie. Można zdecydować, że decyzje dotyczące zarządzania najlepiej przekazać grupie interesariuszy lub niezależnemu organowi, na przykład radzie nadzorczej lub niezależnemu administratorowi danych. W przypadku delegowania decyzji szczególnie ważne może być posiadanie wytycznych lub uzgodnionego podejścia opartego na zasadach, które umożliwi podejmowanie tych decyzji w sposób zgodny z duchem inicjatywy.

Dodatkowo współtworzenie zasad i warunków, na jakich dane są udostępniane i ponownie wykorzystywane w drodze bezpośrednich deliberacji, takich jak model przedstawiony przez The GovLab's The Data Assembly, może stanowić dodatkową społeczną licencję na współpracę w zakresie danych.

Podejście oparte na zasadach

Zasadnicze podejście do zarządzania pomoże Ci stworzyć ramy zarządzania, które wykraczają poza kwestie prawne i zgodności z przepisami. Może to być pomocne, gdy w inicjatywę innowacji w zakresie danych zaangażowanych jest wiele organizacji. Dzięki wstępnemu uzgodnieniu zasad, według których chcemy gromadzić, przechowywać, wykorzystywać i udostępniać dane, grupa będzie miała uprawnienia do podejmowania decyzji w przyszłości. Zasady te mogą być w niektórych przypadkach zapisane w karcie danych.

Jako punkt wyjścia do oceny i ewaluacji polityki i zasad udostępniania danych, firma Microsoft opublikowała pięć zasad, które stanowią podstawę naszego wkładu i zobowiązań do współpracy w zakresie zaufanych danych. Mamy nadzieję, że zasady te wpłyną na szerszą dyskusję na temat otwartych danych i że inni będą mogli się na nich opierać i je ulepszać. Te pięć zasad to:

  • Otwarte - Będziemy pracować nad tym, aby dane dotyczące ważnych problemów społecznych były jak najbardziej otwarte, w tym poprzez samodzielne udostępnianie otwartych danych.
  • Możliwość wykorzystania - będziemy inwestować w tworzenie nowych technologii i narzędzi, mechanizmów zarządzania i polityki, aby dane były bardziej użyteczne dla każdego.
  • Empowering - Pomożemy organizacjom generować wartość z danych zgodnie z ich wyborami i rozwijać talenty AI, aby efektywnie i niezależnie korzystać z danych
  • Bezpieczeństwo - będziemy stosować środki kontroli bezpieczeństwa, aby zapewnić operacyjną współpracę danych tam, gdzie jest ona pożądana
  • Prywatność - Pomożemy organizacjom chronić prywatność osób fizycznych podczas współpracy w zakresie udostępniania danych, które dotyczą informacji umożliwiających identyfikację osób.

Profil: Partnerstwo publiczno-prywatne w zakresie danych w Londynie

Przykładem community governance jest opublikowana w 2021 roku Karta Danych, powstała w wyniku zaleceń Londyńskiej Komisji Danych.

Uwolnienie rozwiązań opartych na danych ma kluczowe znaczenie dla rozwiązania problemów wpływających na przyszły rozwój miasta. Bez synergii między władzami lokalnymi i prywatnymi interesami znalezienie rozwiązań pilnych problemów, takich jak poprawa jakości powietrza, skrócenie czasu dojazdu do pracy, poprawa tranzytu i zmniejszenie zatłoczenia byłoby niemożliwe. Pod koniec 2019 roku grupa biznesowa London First zwołała grupę organizacji publicznych i prywatnych jako członków London Data Commission. Komisja Danych, kierowana przez zespół projektowy złożony z partnerów realizacyjnych, w tym London First, Arup, Oliver Wyman Forum i Microsoft, zgromadziła władze lokalne i firmy prywatne wokół dzielenia się danymi w sposób jak najbardziej otwarty. Zadaniem Komisji Danych było pełnienie roli autorytatywnego głosu biznesu w sprawie danych miejskich oraz pomoc w uruchomieniu ekosystemu wymiany danych poprzez stworzenie standardów jakości danych i zajęcie się takimi kwestiami jak prywatność, etyka i zaufanie. We wrześniu 2020 r. londyńska Komisja Danych opracowała propozycje dotyczące ram Data for London. Ramy te zalecały dostarczenie London Data Board i London Data Charter.

W związku z zaleceniami London Data Commission, London First stworzył grupę roboczą, aby zrealizować te zalecenia i kontynuować współpracę z Chief Digital Officer for London w celu realizacji London Data Board i opracowania London Data Charter.

Londyńska Karta Danych opiera się na siedmiu zasadach: Deliver benefit for Londoners; Drive inclusive innovation; Protect privacy and security; Promote trust; Share learnings with others; Create scalable and sustainable solutions; and Be as open as possible. Szerokie grono firm zobowiązało się do przestrzegania zasad, a karta rozważa obecnie kamienie milowe dla Londynu w zakresie współpracy ze środowiskiem biznesowym miasta w celu zabezpieczenia danych na rzecz projektów publicznych.

Dowiedz się więcej o London Data Commission tutaj, a o London Data Charter tutaj.

5. Technologia i dane Technologia i dane: Jakich rozwiązań i zasobów potrzebujesz, aby mierzyć, umożliwiać i zwiększać swój wpływ?

Czynniki wpływające na określenie właściwej infrastruktury technicznej

Podstawą otwartych danych jest infrastruktura techniczna potrzebna do pracy z tymi danymi i wspierania ich wymiany. Obejmuje ona narzędzia do analizy i wizualizacji danych, a także technologie i platformy umożliwiające łatwy i bezpieczny dostęp do danych oraz ich wymianę w obrębie organizacji i pomiędzy nimi.

Aby określić potrzeby technologiczne i platformowe inicjatywy w zakresie danych, należy wziąć pod uwagę ważne czynniki:

  • Czy dane są wrażliwe?
  • Co trzeba chronić i w jakim standardzie prawnym lub umownym?
  • Co powinieneś chronić, biorąc pod uwagę względy etyczne, reputacyjne i handlowe?
  • W jakim celu udostępniane są dane?
  • Komu udostępniane są dane?
  • Jaki poziom użyteczności jest wymagany do pracy z danymi?
  • Czy wymagany poziom użyteczności można osiągnąć poprzez zastosowanie technologii zwiększających prywatność?
  • Jakie platformy istnieją w celu ułatwienia wymiany danych i dostępu do nich, zgodnie z wymaganymi normami?
  • W przypadku danych wrażliwych, jakie ramy zarządzania obowiązują w celu kontroli dostępu i udostępniania?

The GovLab's Data Responsibility Journey to narzędzie oceny, które ma na celu umożliwienie przeglądu takich pytań w sposób interaktywny.

Każdy z tych czynników może wskazywać na szereg potrzeb technologicznych. Na przykład narzędzia do analizy danych mogą pomóc w śledzeniu trendów, identyfikacji problemów i efektywności, a także w dokonywaniu prognoz. Narzędzia do wizualizacji danych pozwalają na wizualizację danych, z którymi pracujesz, i wizualne manipulowanie nimi.

W scenariuszach wymagających ochrony prywatności należy rozważyć szereg technik ochrony prywatności, takich jak anonimizacja i deidentyfikacja. Zróżnicowana ochrona prywatności jest techniką opracowaną przez przemysł, umożliwiającą większą otwartość danych w sposób, który nie zagraża ochronie danych. Koncepcyjnie, zróżnicowana prywatność wykorzystuje dwa etapy w celu osiągnięcia korzyści w zakresie prywatności:

  • Po pierwsze, do każdego wyniku dodawany jest szum, aby zamaskować wkład poszczególnych punktów danych. Szum jest wystarczająco znaczący, aby chronić prywatność jednostki, ale z celem, aby nie wpływać istotnie na dokładność odpowiedzi wyodrębnionych przez analityków i badaczy.
  • Po drugie, ilość informacji ujawnionych z każdego zapytania jest obliczana i odejmowana od ogólnego budżetu utraty prywatności. Gdy budżet prywatności zostanie w pełni wykorzystany, dane są wycofywane i nie są dozwolone żadne dodatkowe zapytania, aby uniknąć naruszenia prywatności. Można o tym myśleć jak o wbudowanym wyłączniku, który zapobiega wyświetlaniu przez system danych, gdy mogą one zacząć naruszać czyjąś prywatność.

Jeśli chodzi o bezpieczeństwo, ważne jest, aby rozważyć politykę lub stan cyklu życia danych, który ma być egzekwowany, a także odpowiednie mechanizmy do osiągnięcia celów bezpieczeństwa organizacji. Kontrola dostępu do danych i zapewnienie, że osoby, którym przyznano dostęp są upoważnione i odpowiednio uwierzytelnione jest kluczowe, ale dodatkowe środki techniczne mogą być potrzebne w zależności od danych i sposobu ich wykorzystania. Poufne przetwarzanie pomaga chronić wrażliwe dane w chmurze, oferując bezpieczeństwo poprzez szyfrowanie danych w użyciu, które zapewnia dodatkową ochronę danych podczas ich przetwarzania i umożliwia lepszą współpracę między organizacjami.

Profil: Jak technologie zwiększające prywatność pomogły ocenić wpływ zdalnego nauczania na edukację młodych uczniów

Osiem miesięcy po wybuchu pandemii COVID-19, Open Data Institute i Microsoft zainicjowały Education Open Data Challenge, aby przyjrzeć się wpływowi przejścia na zdalne nauczanie na edukację młodych uczniów.

Aby umożliwić uczestnikom konkursu dostęp do nowych i istotnych zbiorów danych, Microsoft opublikował dane dotyczące procentowego wykorzystania łączy szerokopasmowych w Stanach Zjednoczonych, zarówno na poziomie hrabstwa, jak i kodu ZIP, uzyskane z anonimowych danych, które zbieramy w ramach naszej bieżącej pracy nad poprawą wydajności i bezpieczeństwa naszego oprogramowania i usług. Zestaw danych na poziomie kodu ZIP zapewnia szczegółowy obraz procentowego wykorzystania łącza szerokopasmowego przez gospodarstwa domowe w obrębie kodu ZIP, dlatego podjęliśmy dodatkowy krok w celu zapewnienia gwarancji prywatności danych. Zastosowaliśmy zróżnicowaną prywatność, dodając szum do agregacji danych. W badaniu uczestniczyła również firma BroadbandNow, która po raz pierwszy udostępniła dane dotyczące cen i dostawców usług szerokopasmowych na poziomie okręgów.

Wyzwanie związane z otwartymi danymi edukacyjnymi przyniosło wiele wnikliwych zgłoszeń i analiz z kombinacjami i wizualizacjami danych. Wyzwanie to miało również na celu zwrócenie uwagi na to, jak można udostępnić więcej otwartych danych, chroniąc jednocześnie prywatność.

 

Przeczytaj więcej o Education Open Data Challenge.

 

Zasoby Przywództwo

Akademia Znawców Danych

Dla liderów, którzy szukają możliwości wykorzystania danych do innowacji społecznych, Open Data Policy Lab's Data Stewards Academy: Developing a Data Reuse Strategy for Solving Public Problems zapewnia program samodzielnej nauki.

Ocena dojrzałości danych

Organizacje sektora społecznego mogą skorzystać z narzędzia Data.org Data Maturity Assessment, które pomoże zmierzyć i zrozumieć, na jakim etapie znajduje się obecnie ich organizacja.

Opportunity

Mapowanie ekosystemu danych

Aby wykonać ćwiczenie z zakresu mapowania ekosystemu danych, odwiedź stronę Open Data Institute's Data Ecosystem Mapping : Tool and Guidance.

Podręcznik dotyczący krajobrazu danych

Więcej informacji na temat oceny krajobrazu danych i kontekstu, w którym działa inicjatywa w zakresie danych, w tym identyfikacji problemu, który inicjatywa chce rozwiązać, można znaleźć w podręczniku Open Data Institute's Data Landscape Playbook.

Talent

Programy szkoleniowe

Jeśli chodzi o programy szkoleniowe mające na celu podniesienie kwalifikacji obecnych talentów lub wyostrzenie ich umiejętności, istnieje wiele zasobów, z których można czerpać:

  • Kursy LinkedIn Learning i Microsoft Learn dla analityków danych. Samodzielne kursy LinkedIn Learning są prowadzone przez ekspertów branżowych, a kursy Microsoft Learn oferują krótkie samouczki krok po kroku, interaktywne środowiska kodowania i skryptów w przeglądarce oraz osiągnięcia oparte na zadaniach.
  • Certyfikaty Microsoft dotyczące danych i podstaw AI. Uznawane w branży certyfikaty Microsoft pomagają talentom potwierdzić swoje umiejętności i zdolność do pełnienia roli przy użyciu technologii Microsoft.
  • Centrum Umiejętności Cyfrowych Microsoft dla organizacji pozarządowych. Współpraca pomiędzy TechSoup Courses i Microsoft, specjalnie dla organizacji pozarządowych, w celu uzyskania dostępu do szkoleń dotyczących produktów Microsoft, w tym kursów koncentrujących się na programie Excel, Power BI i innych.
  • Warsztaty i szkolenia firmy Microsoft dostępne za pośrednictwem sklepu Microsoft Store. Te bezpłatne, prowadzone na żywo szkolenia dla biznesu i profesjonalistów obejmują sesje wprowadzające i pogłębione.
  • Microsoft Viva Learning. Szkolenie na żądanie jest dostępne w ramach Microsoft Viva Learning w Microsoft Teams.
  • Inicjatywa MySkills4Afrika. Poprzez MySkills4Afrika pracownicy Microsoftu z całego świata dobrowolnie poświęcają swój czas, talent i wiedzę, aby wspierać osoby i organizacje w całej Afryce.

Ramy umiejętności w zakresie danych

Dodatkowe zasoby można znaleźć w dokumencie Open Data Institute's Data Skills Framework.

Zarządzanie

Kanwa Etyki Danych

The Open Data Institute's Data Ethics Canvas to przydatne narzędzie do opracowania i oceny sposobu wykorzystania danych.

Zgromadzenie danych

The GovLab's The Data Assembly zapewnia model współtworzenia zasad i warunków, na jakich dane są udostępniane i ponownie wykorzystywane poprzez bezpośrednie deliberacje.

Londyńska Karta Danych

Londyńska Karta Danych, opublikowana pod koniec 2021 roku, jest przykładem community governance w działaniu.

Technologia i dane

Podróż po odpowiedzialności za dane

Podczas oceny potrzeb technologicznych i zasobów organizacji w zakresie współpracy lub inicjatywy dotyczącej danych, narzędzie Data Responsibility Journey firmy GovLab przedstawia możliwości i zagrożenia, które należy rozważyć na każdym etapie cyklu życia danych.

SmartNoise

Microsoft we współpracy z OpenDP Initiative, kierowaną przez Harvard, wydał SmartNoise, pierwszą w swoim rodzaju platformę open source do ochrony prywatności danych różnicowych. Każdy może zacząć korzystać z platformy, aby udostępnić swoje zbiory danych innym osobom na całym świecie. Kod open source i przykłady są dostępne na GitHub.

Poufne przetwarzanie danych

Poufne przetwarzanie pomaga chronić poufne dane w chmurze, oferując bezpieczeństwo poprzez szyfrowanie danych w użyciu, które zapewnia dodatkową ochronę danych podczas ich przetwarzania. Pomocne wprowadzenie do poufnych obliczeń można znaleźć tutaj, wraz z przykładowymi projektami tutaj.

Azure Data Share

Microsoft posiada kilka technologii, które wspierają bardziej otwarte dane w różnych przypadkach użycia, takich jak Azure Data Share, która umożliwia organizacjom proste i bezpieczne udostępnianie danych wielu klientom i partnerom oraz zapewnia możliwość łączenia danych wewnętrznych z danymi partnerów w celu uzyskania nowych spostrzeżeń.

GitHub

GitHub jest największą na świecie platformą do tworzenia oprogramowania i hostingu kodu. GitHub jest często używany do projektów związanych z danymi, szczególnie w przypadku mniejszych zbiorów danych, danych wersjonowanych w ramach współpracy, danych współlokowanych z kodem i przepływów pracy związanych z uczeniem maszynowym. GitHub obsługuje renderowanie danych i notatników w różnych formatach.