Quadro de Dados Abertos para o Impacto Social

Introdução Tirar o máximo partido dos dados abertos e da colaboração de dados

Uma nota de Burton Davis

Na Microsoft, acreditamos que os dados são fundamentais para abordar os importantes problemas sociais que o nosso mundo enfrenta actualmente. A pandemia global mostrou-nos o importante papel dos dados na compreensão, avaliação e acção para resolver os desafios criados pela COVID-19. No entanto, quase todas as organizações, grandes e pequenas, ainda lutam para tornar os dados relevantes para o seu trabalho. Apesar do valor que os dados fornecem, muitas organizações não conseguem aproveitar o seu poder para melhorar os resultados.

Parte desta luta decorre da "divisão de dados" - o fosso que existe entre países e organizações que têm acesso efectivo aos dados para os ajudar a inovar e a resolver problemas e aqueles que não o têm. Para colmatar esta divisão, a Microsoft lançou a Campanha de Dados Abertos em 2020 para ajudar a concretizar a promessa de dados mais abertos e colaborações de dados que impulsionem a inovação.

Uma das principais lições que aprendemos com a Campanha e o trabalho que temos vindo a fazer com os nossos parceiros, o Open Data Institute e The GovLab, é que a capacidade de aceder e utilizar dados para melhorar os resultados envolve muito mais do que ferramentas tecnológicas e os próprios dados. É também importante poder aproveitar e partilhar as experiências e práticas que promovem uma colaboração de dados eficaz e a tomada de decisões. Isto é especialmente verdade quando se trata de trabalhar com governos, organizações multilaterais, organizações sem fins lucrativos, instituições de investigação, e outras que procuram abrir e reutilizar dados para abordar questões sociais importantes, particularmente as enfrentadas pelos países em desenvolvimento.

Por outras palavras, ter apenas acesso a dados e tecnologia não cria magicamente valor e melhora os resultados. Aproveitar ao máximo os dados abertos e a colaboração de dados requer que se pense em como a liderança de uma organização pode empenhar-se em tornar os dados úteis para a sua missão, definir as questões que pretende responder com dados, identificar as competências de que a sua equipa necessita para utilizar dados, e determinar a melhor forma de desenvolver e estabelecer a confiança entre os colaboradores e as comunidades serviram para obter mais discernimento e beneficiar dos dados.

O Quadro de Dados Abertos para Impacto Social é uma ferramenta que os líderes podem utilizar para pôr os dados a trabalhar para resolver os desafios mais importantes para eles. Reconhecendo que nem todos os dados podem ser tornados acessíveis ao público, vemos os enormes benefícios que podem advir do avanço de dados mais abertos, quer estes assumam a forma de colaborações de dados de confiança, quer de dados verdadeiramente abertos e públicos. Usamos a frase "impacto social" para significar uma mudança positiva no sentido de abordar um problema da sociedade, como a redução das emissões de carbono, a eliminação dos desníveis em matéria de banda larga, a construção de competências para empregos, e o avanço da acessibilidade e inclusão.

Acreditamos nas oportunidades ilimitadas que a abertura, a partilha e a colaboração em torno dos dados pode criar para atrair novos conhecimentos, tomar melhores decisões, e melhorar a eficiência ao enfrentar alguns dos desafios mais prementes do mundo.

Burton Davis
Vice-presidente e Vice-Conselheiro Geral, Grupo de Propriedade Intelectual da Microsoft

 

Este site não se destina a fornecer orientação legal e não deve ser confiado como tal. O quadro fornece recursos para ajudar as organizações a avançar com dados abertos e a empenharem-se em colaborações de dados para o bem social. A partilha de dados não é isenta de riscos. Recomenda-se a obtenção de aconselhamento jurídico independente. Este sítio inclui links para recursos de terceiros. A Microsoft não é responsável por qualquer perda, dano ou prejuízo resultante da utilização das ligações ou da confiança em materiais disponibilizados por terceiros.

Início rápido: O seu Roteiro para abrir dados Um roteiro simples para começar

Explorar o roteiro

As organizações interessadas na utilização de dados abertos podem compreender os seus benefícios e como se podem aplicar a projectos específicos, mas como dar esse primeiro passo pode não ser claro. O seguinte é um roteiro simples que pode seguir para começar a utilizar dados mais abertos para enfrentar os desafios na sua organização, comunidade, e no mundo em geral. Onde indicado, clique para saber mais e salte para as secções correspondentes neste quadro.

1. Determinar se tem a infra-estrutura organizacional instalada.

Para muitas organizações, a adopção de uma abordagem de dados aberta é uma mudança cultural. Tem a adesão dos seus interessados? Avaliou algum investimento necessário para pôr os dados a funcionar? A confiança é estabelecida entre as partes interessadas? Certifique-se de que tem estas respostas antes de dar o passo seguinte.

Saiba mais em Liderança: Está pronto a colocar dados ao trabalho para melhorar os resultados sociais?

2. Compreender as perguntas que deseja responder com dados.

A sua estratégia de dados começa por identificar as questões que procura responder. Uma vez identificadas estas perguntas, pode determinar quais os conjuntos de dados necessários e se tem acesso aos mesmos.

Saiba mais em Oportunidade: Quais são as perguntas a que pretende responder com dados?

3. Reunir o talento necessário.

É necessária a estratégia certa e os conjuntos de dados correctos. Mas também precisa das pessoas certas para fornecer análises e insights ao longo do seu projecto. Certifique-se de que avalia as competências de dados necessárias e que todos os membros da sua equipa compreendem que a colaboração está no centro do projecto.

Saiba mais em Talento: Tem o talento necessário para a análise de dados?

4. Construir a confiança na comunidade.

Criar um quadro de boa governação para assegurar que tanto as oportunidades de dados como os riscos de dados sejam abordados. Certifique-se de que a sua política de governação assegura transparência entre as partes interessadas, inclusividade entre os membros da comunidade, e fomenta a capacitação, para que compreendam por que razão a recolha e utilização de dados abertos é do seu melhor interesse.

Saiba mais em Governação Comunitária: Construiu confiança na sua comunidade em torno da utilização de dados?

5. Certifique-se de que dispõe dos recursos de dados correctos.

A análise e as ferramentas de visualização de dados são essenciais se estiver a trabalhar numa vasta gama de conjuntos de dados e num volume profundo de dados. Do mesmo modo, é essencial assegurar que quaisquer necessidades de privacidade e segurança são tidas em conta para uma colaboração responsável de dados abertos e de partilha de dados.

Saiba mais em Tecnologia e Dados: De que soluções e recursos necessita para permitir e aumentar o seu impacto?

Antecedentes e Contexto Desafios dos dados abertos explicados

Porque é que o acesso aos dados é tão importante?

A inteligência artificial, ou IA, é a espinha dorsal da transformação digital que o mundo está actualmente a experimentar. Operações industriais, processos empresariais, gestão de clientes, e mais estão a ser transformados pela aprendizagem de máquinas que está a criar a oportunidade para uma maior experimentação, eficiência e rapidez. A racionalização da recolha, armazenamento e gestão de grandes quantidades de dados cria percepções mais fiáveis que as organizações podem utilizar nas suas tomadas de decisão.

Grandes e diversificados conjuntos de dados podem ajudar a reforçar esses conhecimentos ou a acrescentar-lhes mais. Dados abertos, que são dados publicados para qualquer pessoa aceder, utilizar e partilhar sem restrições, podem ajudar os utilizadores a resolver problemas a maior velocidade e com maior autoridade, o que pode levar a avanços mais rápidos e, porque também pode ser preditivo, pode gerar previsões com maior precisão. Por estas razões, o valor que os dados abertos oferecem nos cuidados de saúde, ciência, educação, ambiente, e muito mais, é imensurável para ajudar a resolver os maiores desafios da sociedade.

Mas ao abrir os dados, não irá perder valor?

Na maioria dos casos, os dados por si só não é onde reside o valor, o valor vem do que se faz com esses dados. Neste contexto, é também importante notar alguns aspectos económicos dos dados. Os dados não são rivais - podem ser utilizados repetidamente por muitos sem esgotar o valor, e podem ser utilizados para alcançar efeitos de rede - por exemplo, mais dados podem criar melhor IA, o que pode atrair mais utilização e gerar mais dados.

Abrir dados ou torná-los mais acessíveis tem o potencial de gerar mais valor do que mantê-los em silo e pode desbloquear um enorme valor público. Os utilizadores que combinam os dados com outros conjuntos de dados ou trabalham com eles num novo contexto podem descobrir novos conhecimentos que não eram aparentes na sua utilização original. Como o Laboratório de Política de Dados Abertos cita na sua estrutura de 9Rs, dados mais abertos podem também permitir a reprodutibilidade, melhorando a confiança nos resultados ao permitir que outros realizem trabalhos idênticos ou relacionados.

A chave não é simplesmente transferir dados para outros utilizadores, mas trabalhar com eles para compreender como estão a ser utilizados e como os benefícios dessas utilizações podem ser partilhados de volta com a comunidade. O seu valor vem de como é utilizada para facilitar novos significados e soluções. A abertura dos dados pode ajudar a evitar as utilizações perdidas - e o valor perdido dos dados se estes forem mantidos fechados. Este é o espírito de colaboração dos dados abertos. O seu valor é infinito.

Para mais informações sobre o valor dos dados, visite o relatório do Open Data Institute's The Value of Data.

E as preocupações de privacidade associadas à abertura de dados?

Uma preocupação com a abertura de dados pode ser o risco de divulgação de dados sensíveis. A salvaguarda da privacidade individual e a protecção de informações confidenciais ou comercialmente sensíveis pode ser exigida por lei ou regida por contrato. Além disso, as organizações devem também considerar os riscos reputacionais, éticos e comerciais da partilha de dados sensíveis.

Para proteger os intervenientes no ecossistema de partilha de dados, e para gerar confiança na partilha de dados, é importante proteger os dados sensíveis através dos meios legais, técnicos e organizacionais apropriados. Mas este requisito não deve impedir as organizações de prosseguirem uma estratégia de dados eficaz. Pelo contrário, o nível de protecção pode ser alcançado através da implementação de quadros de governação adequados para a partilha responsável de dados.

Por exemplo, podem ser utilizadas ferramentas de reforço da privacidade para ajudar a manter a informação pessoal privada. Tecnologias e técnicas como a privacidade diferencial, criptografia homomórfica, computação confidencial, anonimização e desidentificação podem ser aproveitadas para salvaguardar a privacidade individual ao mesmo tempo que se melhora o acesso aos dados por organizações, investigadores, e sociedade civil. Embora estas tecnologias possam não ser apropriadas para todos os contextos, podem ser úteis em certos contextos.

Para mais informações sobre as condições de habilitação e factores incapacitantes que muitas vezes determinam o impacto das iniciativas de dados abertos, visite The GovLab's Periodic Table of Open Data's Impact Factors.

Os benefícios dos dados abertos para a sua organização

Cria uma tomada de decisão mais informada

Dados abertos podem dar aos interessados novos conhecimentos que os ajudam a tomar decisões mais informadas e objectivas. O valor de conjuntos de dados adicionais de diferentes fontes pode ajudar os utilizadores a ganhar maior clareza em torno de questões e a desbloquear novos conhecimentos. Como diz o ditado, "não se sabe o que não se sabe". Os dados abertos apresentam uma oportunidade de descobrir novas possibilidades que os utilizadores nunca tinham considerado anteriormente.

A condução deste processo é a própria natureza dos dados abertos. Por exemplo, os dados podem ser analisados de inúmeras formas para revelar padrões para obter uma visão multifacetada do problema que o utilizador está a tentar resolver. Estas descobertas podem ser partilhadas com o público em geral, para que haja uma maior procura por parte de multidões, a fim de melhorar as descobertas ou criar novas descobertas ainda não descobertas. A par de uma partilha e sensibilização mais vastas, os dados abertos podem encorajar outros a retribuir e podem render contribuições que beneficiem todos.

Como exemplo, The Nature Conservancy (TNC)-India e Microsoft estão a utilizar imagens de satélite abertas existentes para criar um novo conjunto de dados aberto sobre explorações solares na Índia. Estes dados ajudarão a identificar os factores que determinam a adequação da terra a projectos solares e, em última análise, ajudarão as agências públicas a planear melhor o desenvolvimento da energia solar.

A tomada de decisões, portanto, não tem de ser estritamente baseada em conjuntos de dados que residem dentro de qualquer organização. Os dados abertos permitem o acesso a dados que são publicados por outros, e podem criar a oportunidade de mais entradas para os dados da sua organização, informando ainda mais o resultado final e a tomada de decisões.

Que Cria Novas Oportunidades para a Descoberta

Como sugerido acima, os dados abertos ajudam os utilizadores a identificar e resolver diferentes problemas que podem não ter sido inicialmente considerados. Os dados abertos também ajudam as organizações a identificar ligações com outros conjuntos de dados. O Índice de Vulnerabilidade Alimentar e Agrícola Purdue baseou-se em conjuntos de dados abertos muito diferentes para gerar novos conhecimentos sobre o impacto da COVID-19 na produção agrícola e na saúde dos agricultores e dos trabalhadores agrícolas.

Com o acesso a mais dados, os conhecimentos podem ser obtidos mais rapidamente. Isto dá aos utilizadores liberdade para experimentar novas ideias, para ver correlações não conhecidas anteriormente, ou para prolongar a fase de descoberta. Este desdobramento contínuo dos dados permite novas possibilidades de formas que podem ser mais eficientes do que as existentes anteriormente.

Como resultado, a inovação pode ser acelerada

Os avanços na ciência utilizando dados abertos já nos mostraram que representa um modelo importante para os investigadores, um modelo que promove protocolos de partilha, a comunicação e divulgação de resultados, a partilha de código, e muito mais. A própria natureza de qualquer tipo de investigação depende, de facto, de assegurar que os dados sejam pesquisáveis, acessíveis, e reutilizáveis para conduzir o escrutínio de terceiros.

A promessa de dados abertos é que abre essas portas e acelera a investigação e inovação para benefício público. Por exemplo, tornar certos dados de saúde partilhados ou públicos ajudou a acelerar o desenvolvimento de tratamentos médicos como as vacinas produzidas para combater o vírus COVID-19. As lições aprendidas com essa experiência motivaram os EUA a afectar milhares de milhões de dólares para apoiar uma investigação mais atempada. Os Institutos Nacionais de Saúde forneceram até à data fundos de quase 4,9 mil milhões de dólares para apoiar os projectos de investigação da COVID-19. A incorporação de princípios de dados abertos nestes programas pode ajudar a acelerar a investigação, o que beneficiará a actual pandemia, bem como as crises que se avizinham.

O Valor dos Dados Abertos - Pelos Números

  • Num relatório de 2013 do McKinsey Global Institute, o mercado de dados aberto, avaliado em 3 biliões de dólares por ano, está centrado no valor da combinação de dados governamentais abertos com dados partilhados detidos pelas empresas.
  • Em 2014, a Lateral Economics estimou que o valor potencial dos dados abertos ao G20 seria de cerca de 2,6 triliões de dólares por ano, contribuindo para um produto interno bruto (PIB) acumulado dos países do G20 de cerca de 1,1% a partir de 2014-2019, ou 55% do objectivo de crescimento adicional de 2% do G20.
  • Em 2020, o Portal Europeu de Dados estimou que o valor dos dados abertos para a UE28+ era de 184,45 mil milhões de euros em 2019, e previu que atingiria entre 199,51 e 334,20 mil milhões de euros em 2025. O relatório também analisou os números do emprego, com 1,09 milhões de trabalhadores com dados abertos em 2019 e 1,12 a 1,97 milhões de trabalhadores com dados abertos previstos até 2025.
  • Os transportes para Londres informaram que a utilização dos seus dados abertos permitiu às empresas do sector privado contribuir entre £12 milhões e £15 milhões por ano para a economia londrina.

Para mais informações e estudos de caso sobre as razões pelas quais as empresas estão a abraçar a partilha de dados, visite as "Sete razões pelas quais as empresas devem estar a partilhar dados" do Open Data Institute.

Para mais informações sobre os casos de colaboração de dados e reutilização de dados no interesse público, consulte o quadro de 9Rs do Open Data Policy Lab.

O Quadro de Dados Abertos para o Impacto Social Um líder de ferramentas pode utilizar

Sobre o quadro

O Quadro de Dados Abertos para Impacto Social é uma ferramenta que os líderes podem utilizar para pôr os dados a trabalhar para resolver questões sociais importantes, tais como a redução das emissões de carbono, a eliminação dos desníveis em matéria de banda larga, a construção de competências para empregos, e o avanço na acessibilidade e inclusão. O seguinte quadro foi concebido para orientar os líderes organizacionais em todo o ecossistema de dados - governos, organizações sem fins lucrativos, e organizações multilaterais - para percepções e soluções que podem utilizar para ajudar a resolver questões sociais importantes.

Este sítio identifica cinco áreas temáticas que as organizações devem considerar quando procuram utilizar dados para melhorar os resultados sociais: liderança, oportunidade, competências, governação comunitária, e tecnologia e dados. Propõe perguntas a fazer e oferece recursos que podem ajudar a responder a elas. Estes conceitos são trazidos à vida através de exemplos de projectos de dados abertos do mundo real. Há também um roteiro para abrir dados que os líderes organizacionais podem utilizar para começar.

Este quadro pode servir como uma ferramenta para ajudar a lançar as bases para dados abertos e colaboração de dados. No entanto, existem muitos outros excelentes recursos a utilizar que podem ajudar aqueles que pretendem utilizar dados para impacto social, alguns dos quais identificamos ao longo deste sítio.

O quadro promove uma cultura de dados abertos e colaboração de dados, orientando os líderes organizacionais através das seguintes perguntas:

1. Liderança: Está pronto a colocar dados ao trabalho para melhorar os resultados sociais?

2. Oportunidade: Quais são as perguntas a que quer responder com dados?

3. Habilidades: Tem o talento necessário para a análise de dados?

4. Governação Comunitária: Construiu confiança na sua comunidade em torno da utilização de dados?

5. Tecnologia e Dados: De que soluções e recursos necessita para medir, permitir e aumentar o seu impacto?

1. Liderança Liderança: Está pronto a colocar dados ao trabalho para melhorar os resultados sociais?

A adopção de uma abordagem aberta é uma mudança cultural

Os líderes das organizações podem enfrentar uma série de preocupações ou resistência quando colocam dados a trabalhar para resolver desafios difíceis. Em alguns destes casos, o talento - com papéis que vão desde cientistas e analistas de dados a gestores de programas e investigadores - não é interno para ingerir e analisar dados. Noutros casos, o longo tempo necessário para desenvolver uma estrutura de governação de partilha de dados com outras organizações pode resultar no abandono da colaboração antes que esta pague dividendos.

Em última análise, para a maioria das organizações, adoptar uma abordagem de dados aberta é uma mudança cultural.

Aqui, é importante reconhecer que as organizações se enquadram num espectro de maturidade de dados - desde um compromisso inicial de utilização de dados para a inovação até uma cultura onde a inovação de dados é incorporada a todos os níveis. Independentemente de onde uma organização esteja ao longo deste espectro, uma abordagem de dados aberta requer um líder que esteja empenhado em colocar os dados de uma organização a funcionar. Este compromisso pode assumir uma variedade de formas, como por exemplo:

  • Advogar e falar publicamente sobre a importância da partilha de dados.
  • Tirar conclusões a partir de dados.
  • Encorajar a colaboração e o envolvimento comunitário.
  • Construir relações com os principais beneficiários e potenciais utilizadores de dados.
  • Estabelecer um quadro para a utilização responsável dos dados.

Todas estas são acções que ajudam a construir uma abordagem de confiança na partilha de dados que pode incutir confiança entre as partes interessadas.

Passos a considerar

Considere os seguintes passos para melhor posicionar a sua organização para utilizar os dados de forma inovadora para resolver questões prioritárias:

  • Que investimentos são necessários para pôr os dados a funcionar?
  • Que incentivos são necessários para pôr os dados a funcionar?
  • Como se constrói confiança interna e externamente? Quem são os seus parceiros/participantes?
  • Como pode criar uma dinâmica dentro da sua organização para considerar a inovação com dados como uma prioridade a longo prazo, e não como um projecto a curto prazo?

É necessária uma liderança forte

Não surpreendentemente, as organizações que dão prioridade aos dados como um recurso vital requerem uma liderança forte. De acordo com um inquérito publicado em Julho de 2021 pela Data Orchard, 63% dos inquiridos dizem que a liderança na sua organização não está convencida sobre o valor dos dados. Apenas um terço diz que a sua liderança está empenhada e apoia, faz as perguntas certas sobre os dados, e está activa no aproveitamento do seu valor. A promessa de aproveitar os dados cria uma oportunidade significativa para os líderes melhorarem as suas capacidades de utilizar os dados em benefício das suas organizações.

O GovLab na NYU acolhe uma Data Stewards Academy, que inclui um programa de aprendizagem auto-dirigido. O curso foi concebido para indivíduos que servem como administradores de dados em diversas capacidades em todo o mundo - uma função que procura responder às questões acima enumeradas de uma forma que permita uma colaboração de dados sistémica, sustentável e responsável.

Perfil: Como a liderança da Organização Mundial de Saúde transformou a sua cultura para ser orientada pelos dados

Mudanças culturais, estratégicas e operacionais são todas necessárias para implementar iniciativas abertas de partilha de dados e dados. Para realizar o potencial destes benefícios - incluindo a responsabilização pelos resultados, confiança, transparência e segurança - a liderança deve primeiro abordar as barreiras internas e outros tipos de resistência organizacional. Isto pode incluir desafiar o status quo, implementar reformas em larga escala, ou assumir um novo conjunto de riscos - para todas estas mudanças, e especialmente numa grande organização, é vital uma liderança e um compromisso fortes.

Ao transformar a cultura de uma organização para ser mais orientada para os dados, a Organização Mundial de Saúde (OMS) demonstra continuamente esta necessidade. Com mais de 8.000 funcionários em todo o mundo e responsabilidade perante os seus 194 Estados-Membros em seis regiões, a implementação de uma iniciativa de transformação digital só poderia ser conseguida através de uma forte liderança e acção a todos os níveis.

Como organização multilateral, a OMS tem um estatuto único como entidade baseada na ciência e na evidência que estabelece normas e padrões globalmente aplicáveis com a missão de promover a saúde, manter o mundo seguro, e servir os vulneráveis. Quando o Dr. Tedros Adhanom Ghebreyesus foi nomeado Director-Geral da OMS em 2017, reconheceu que os dados eram uma componente crítica para alcançar esta missão e cumprir as metas de "três mil milhões " de mais mil milhões de pessoas com melhor saúde e bem-estar, mais mil milhões de pessoas com acesso a uma cobertura de saúde universal acessível, e mais mil milhões de pessoas mais bem protegidas de emergências de saúde.

Em 2019, o Dr. Tedros demonstrou o seu empenho em transformar a OMS numa organização moderna e orientada para os dados, anunciando publicamente a sua visão e estabelecendo uma nova Divisão de Dados, Análise e Entrega para Impacto (DDI). Esta divisão foi formada para resolver urgentemente as lacunas de dados, reduzir a fragmentação de dados e aumentar a eficiência dos processos de dados de ponta a ponta da OMS. Foi dada particular ênfase à consolidação de dados e activos de saúde para utilizadores externos e internos, bem como à utilização de tecnologias modernas, incluindo segurança para dados privados e sensíveis, análises transparentes, e métodos de visualização poderosos.

Desde o início, a liderança da OMS empenhou-se em criar confiança e continuidade com os seus intervenientes internos e externos, promovendo uma abordagem estratégica e coerente da governação dos dados. Internamente, foi formada uma Comissão de Governação de Dados, composta por líderes de alto nível, para definir a direcção da empresa em matéria de estratégia e política de dados. Foi também criado um Data Hub and Spoke Collaborative para facilitar a implementação de políticas de governação de dados em toda a OMS, com todos os programas relevantes e todas as regiões representadas. A liderança sénior foi encarregada de apoiar regularmente as reuniões da colaboração para fornecer orientação, encorajando assim o progresso e dando a muito necessária advocacia para institucionalizar um novo mecanismo de governação de dados.

A nível externo, a OMS procurou aconselhamento externo e estabeleceu parcerias com organizações não pertencentes à ONU, incluindo o sector privado, para fazer avançar os seus dados e capacidades analíticas. Em Junho e Setembro de 2021, convocaram duas Cimeiras de Governação de Dados de Saúde para reunir a OMS, os Estados Membros, os parceiros e o público em geral para analisar as melhores práticas e sublinhar a necessidade de dados de saúde como um bem público global.

Além disso, em parceria com a Microsoft e Avanade e outros, a liderança da OMS fez um investimento a longo prazo para desenvolver e manter os sistemas técnicos necessários para orientar as decisões através de dados oportunos, fiáveis e accionáveis. Este investimento resultou no desenvolvimento do Centro Mundial de Dados de Saúde (WHDH). O WHDH é a primeira solução abrangente e completa do mundo para a saúde global e visa racionalizar os processos e assegurar que os dados sejam acessíveis, encontráveis, e utilizáveis por todas as partes interessadas.

Ao longo deste processo de transformação, a liderança da OMS demonstrou este compromisso ao falar publicamente, sendo visível e empenhada tanto interna como externamente, e fazendo investimentos a longo prazo nos instrumentos práticos (como o WHDH) e na mudança de comportamento (como uma carta de valores actualizada) necessários para a implementação. Esta mudança cultural em grande escala para uma organização orientada por dados seria impossível sem um compromisso de liderança, e a OMS pode servir de exemplo para outras organizações que pretendam fazer uma mudança semelhante.

2. Oportunidade Oportunidade: Quais são as perguntas a que pretende responder com dados?

Compreender "porquê" é essencial para iniciar um projecto

Compreender porque quer resolver um problema parece ser uma tarefa simples o suficiente. Na verdade, perguntar "porquê" pode parecer tão simples que este passo pode muitas vezes ser ignorado. No entanto, perguntar "porquê" é essencial para iniciar um projecto e também para manter uma solução sustentável. É necessário ao longo de todo o ciclo de vida da inovação, desde construir um impulso dentro de uma organização, informar o envolvimento das partes interessadas, impulsionar a progressão no projecto, derivar a abordagem correcta da governação, assegurar que os dados são adequados à finalidade, até à implementação de uma solução técnica.

Identificar as questões que precisa de responder para resolver o seu problema

A identificação das questões que pretende responder é um primeiro passo crucial. Uma vez identificadas as perguntas, pode começar a pensar nas soluções necessárias para as abordar e ajudar a resolver o problema.

Exemplos de problemas que os dados abertos podem ajudar a resolver incluem:

  • A minha organização tem dados que poderiam contribuir para melhorar o planeamento da mobilidade na minha região. Como posso partilhar estes dados de uma forma significativa e responsável?
  • A minha organização publicou dados abertos sobre as desigualdades raciais. Como encorajamos a utilização destes dados?
  • Quais são as intervenções mais rentáveis e equitativas para melhorar a qualidade do ar em cada região, particularmente para as fontes de poluição que afectam os países de baixo e médio rendimento?

Para este último exemplo e outras questões urgentes e de alto impacto que poderiam ser abordadas se os conjuntos de dados relevantes fossem aproveitados de forma responsável, visite The GovLab's The 100 Questions Initiative.

Compreender como os dados o podem ajudar a responder a essas perguntas

Agora que identificou as perguntas, o passo seguinte é compreender onde a sua organização se encontra no caminho para obter essas respostas. Para o fazer, pode ser útil mapear o ecossistema de dados actual. O mapeamento do ecossistema de dados pode ser utilizado para explorar novas fontes de dados, explorar fluxos de dados existentes, identificar onde são necessárias alterações e identificar outros intervenientes que também estão a trabalhar para resolver o mesmo problema ou um problema semelhante.

Uma forma de começar é cartografar os actores de dados no seu ecossistema de dados e a forma como o valor é trocado através dele. Por exemplo, o valor pode vir sob a forma de dados, mas também pode ser a troca de feedback ou conhecimento.

Para um exercício de Mapeamento de Ecossistemas de Dados, visite o Mapeamento de Ecossistemas de Dados do Open Data Institute: Ferramenta e Orientação.

Determine o valor para as suas partes interessadas

Fornecer acesso aos dados pode ser uma parte crítica do exercício, mas não é o único elemento a considerar. É também importante considerar mais amplamente como todas as partes interessadas em todo o seu ecossistema de dados irão perceber o valor.

A nível interno, os líderes seniores terão de ganhar a adesão das partes interessadas e criar uma dinâmica dentro da organização para enfrentar o desafio. As partes interessadas externas terão de compreender o alinhamento com os seus interesses e ter incentivos para se empenharem. Por outras palavras, precisarão da resposta à pergunta: "o que é que eu ganho com isso?

A tomada em consideração dos interesses das partes interessadas acabará por ajudar a criar confiança. Isto pode incluir o envolvimento das partes interessadas como parte da discussão sobre a troca de valores, por exemplo, através da participação numa sessão de mapeamento do ecossistema de dados de grupo.

Identificar que conjuntos de dados irão ajudar

Tentar avaliar a paisagem de dados é uma tarefa assustadora. Uma vez claramente definidas as perguntas a que pretende responder, a etapa de identificação dos conjuntos de dados torna-se uma tarefa mais fácil de gerir. Avalie os dados que possui e identifique quais os dados abertos e partilhados que são necessários para ajudar a resolver o problema. Pode conseguir isto:

  • Usando uma lista de verificação para identificar os dados que possui e o que pode fazer com eles, por exemplo:
    • Em que consiste o conjunto de dados?
    • Que aspectos precisa de proteger e quão sensíveis são os dados?
    • Onde se encontram os dados? Compreender o pedigree dos dados é uma componente chave para fomentar uma utilização fiável dos dados. O "pedigree" refere-se à qualidade do conjunto de dados e baseia-se em vários factores, incluindo a proveniência do conjunto de dados (incluindo métricas de fiabilidade estimada, confiança, e risco).
    • Onde estão os dados armazenados?
    • Para que fim será utilizado?
    • Há alguma restrição de acesso ou utilização?
  • Identificar lacunas nos dados e identificar parceiros que possam contribuir para o projecto ou recursos para a obtenção de dados abertos.
  • Alavancando conjuntos de dados disponíveis abertamente, tais como os que são disponibilizados em termos de dados abertos em Azure Open Datasets, GitHub, e Microsoft Research Open Data.
  • Preparar os seus conjuntos de dados internos para partilha externa. Para dados que podem ser disponibilizados como abertos, recomenda-se a utilização do Contrato de Licença de Dados Comunitários - Permissivo, Versão 2.0 (CDLA-Permissive-2.0) ou outra licença de dados abertos para partilhar os seus dados. Os termos ajudam os utilizadores a compreender as condições e restrições que regem a utilização dos dados. A anexação de termos apropriados identifica os dados como abertos, cria clareza em torno da reutilização, e fomenta a inovação. As organizações sem fins lucrativos podem aceder ao Centro de Inovação Sem Fins Lucrativos da Microsoft, que inclui um modelo legal leve para estabelecer uma colaboração de dados.
  • Parcerias com outras organizações ou partes interessadas que estejam a tentar resolver o mesmo problema.

Perfil: Cuidar da Igualdade através da Colaboração de Dados

No início de 2021, o Open Data Institute e a Microsoft lançaram uma Rede de Aprendizagem entre Pares com o objectivo de ajudar as organizações que colaboram em torno de dados a enfrentar mais eficazmente os desafios que enfrentam. Isto incluiu a exploração de questões associadas à confiança e fiabilidade entre os participantes e outras partes interessadas.

No primeiro workshop, os participantes foram apresentados à ferramenta de Mapeamento do Ecossistema de Dados para explorar os fluxos de dados e o valor nos seus ecossistemas. Isto incluiu a superação de barreiras à partilha de dados através do desenvolvimento de um mapa do ecossistema digno de confiança para compreender onde a confiança - ou a falta dela - tem impacto no valor criado pelos fluxos de dados.

Um dos projectos de colaboração da Rede de Aprendizagem entre Pares, Cuidar da Igualdade, uma colaboração do Governo da Cidade de Buenos Aires na Argentina, o Centro para o Desenvolvimento Global, e a Carta de Dados Abertos, visava abordar as lacunas de desigualdade no que diz respeito às tarefas relacionadas com os cuidados que restringem a autonomia económica das mulheres. Utilizando dados de múltiplas fontes privadas e públicas, as equipas criaram um "Sistema de Indicadores de Cuidados" que abordaria a situação em Buenos Aires e forneceria informações para melhorar a elaboração de políticas e a responsabilização perante os cidadãos da cidade.

A colaboração utilizou o exercício de Mapeamento do Ecossistema de Dados para identificar os fornecedores e fontes de dados, como os dados poderiam ser acedidos e aproveitados, e como considerar os desafios de confiança para a partilha de dados com e dentro do governo. Este exercício levou a importantes pontos de decisão para ajudar a liderar a iniciativa com um entendimento comum do valor do Sistema de Cuidados que está a ser construído.

Mais informação sobre Cuidar da Igualdade pode ser encontrada aqui.

Perfil: Como Londres utilizou dados abertos para compreender melhor a capacidade de carregamento de automóveis eléctricos

Quando Londres anunciou o seu plano de ser uma cidade sem carbono até 2030, havia necessidade de considerar métodos de transporte mais ecológicos em toda a cidade e subúrbios circundantes. Dado que a mudança da utilização de veículos a gasolina e diesel para veículos eléctricos pode ajudar a reduzir as emissões de carbono, a cidade precisava de compreender melhor as oportunidades para criar uma melhor infra-estrutura de carregamento eléctrico. Isso implicava permitir aos promotores e operadores de pontos de carregamento trabalhar em conjunto para criar conjuntos de dados mais ricos para compreender a procura dos proprietários de veículos eléctricos (VE).

Foi criado um piloto de partilha de dados para compreender como se poderia melhorar a infra-estrutura de tarifação de VE dentro de Londres. O programa de partilha de dados público-privado desenvolveu conhecimentos para determinar potenciais localizações para estações de carregamento de VE. O piloto de partilha de dados demonstrou o potencial da partilha de dados, colaboração de dados, e dados abertos para ajudar a desenvolver a infra-estrutura de tarifação de VE em Londres e, em última análise, apoiar o objectivo de Londres de ser neutra em carbono até 2030.

Conjuntos de dados incluindo dados sobre o comportamento do tráfego, dados sobre a capacidade de cobrança, e dados do registo predial ajudaram a identificar mais de 2.000 parcelas públicas de terrenos públicos na cidade que devem ser consideradas como locais candidatos para pontos de cobrança de VE.

A transparência dos dados permite à cidade demonstrar a base de análise, ajudando assim a gerar confiança entre os cépticos e a motivação entre os investidores em infra-estruturas de tarifação de VE. Terceiros podem examinar a análise para considerar se as conclusões alcançadas são fiáveis e exactas. Globalmente, a utilização de dados abertos no projecto mostrou que, através da partilha de dados, foi possível ultrapassar as barreiras infra-estruturais para um esforço de tal envergadura.

Mais informações sobre o piloto da Infra-estrutura de Carregamento EV podem ser encontradas aqui.

3. Talento Talento: Tem o talento necessário para a análise de dados?

Ter as competências necessárias para trabalhar com dados é vital para qualquer organização

Tal como o acesso aos dados é fundamental para as organizações resolverem problemas e inovarem, ter as competências necessárias para trabalhar com esses dados é vital para qualquer organização. Contudo, de acordo com números do LinkedIn, cerca de metade de todas as pessoas com competências técnicas em IA trabalham no sector tecnológico e estão frequentemente em falta noutras organizações e sectores.

Quando procura colocar dados a trabalhar para a sua organização, é fundamental certificar-se de que a sua organização tem o talento necessário para arquitectar e executar num plano para alcançar os conhecimentos e as respostas que deseja alcançar. Isto não significa que tenha de empregar equipas de cientistas informáticos. Pelo contrário, uma variedade de profissões e conjuntos de competências trabalham com dados em diferentes formas, incluindo analistas de dados, cientistas de dados, engenheiros de software, e investigadores. O talento de que necessita será impulsionado pelas competências em matéria de dados necessárias à sua iniciativa.

Avaliar as competências necessárias em matéria de dados

Uma lista de verificação de perguntas para a sua organização utilizar para essa avaliação pode incluir:

  • Que competências de dados críticos são necessárias para enfrentar o desafio identificado? Por exemplo, as competências técnicas poderiam incluir a gestão de sistemas e infra-estruturas de processamento de dados, a implementação de condutas e análises de dados, e a visualização ou a elaboração de relatórios sobre dados. As competências não técnicas necessárias poderiam incluir a recolha de requisitos consultivos, gestão de partes interessadas, e gestão de programas.
  • Que conhecimentos de dados tem hoje em dia na sua organização?
  • Onde tem uma lacuna de competências críticas?
  • Pode estabelecer uma parceria com outra organização para preencher esta lacuna, ou vai precisar do talento dentro da sua própria organização?
  • Precisa de contratar novos talentos? Existe uma oportunidade para aumentar os actuais talentos?
  • Oferecem hoje programas de formação para ajudar a avançar as competências de dados? Que programas de formação podem ser necessários?

Descrições detalhadas das principais funções técnicas e comerciais para uma equipa interdisciplinar podem ser encontradas em "The AI playbook," que pode ser descarregado aqui.

Para recursos adicionais, consultar o Quadro de Competências de Dados do Open Data Institute.

Perfil: Os benefícios do Crowdsourcing utilizando dados abertos

O Crowdsourcing utilizando dados abertos ajuda as organizações a resolver problemas difíceis porque pode levar a soluções inesperadas, a uma resolução mais rápida de problemas e a uma redução da carga do utilizador. O Crowdsourcing trabalha utilizando agentes voluntários (ou pagos) de recolha de dados que podem ou não ter ligações directas com a organização que conduz a pesquisa. A sua ajuda pode, em última análise, reduzir custos e tempo, aumentando as actuais competências e sistemas. Os avanços na tecnologia móvel têm ajudado a impulsionar a popularidade do crowdsourcing porque mais pessoas têm agora maior acesso aos dados e uma grande variedade de comunidades em todo o mundo.

Os benefícios do crowdsourcing incluem:

  • Diversos dados. Como os contribuidores podem reflectir uma variedade de utilizadores de todo o mundo, é provável que a sua contribuição reflicta a diversidade necessária para criar os resultados mais fiáveis.
  • Redução de custos. Ao externalizar a recolha de dados, as organizações podem ser capazes de reduzir custos e menos recursos podem ser necessários para obter, limpar, e estruturar conjuntos de dados dentro da organização.
  • Maior confiança. O próprio nome "crowdsourcing" implica que os dados são provenientes de fora de qualquer organização e se encontram numa vasta gama de contribuintes. Devido a isto, o processo pode ganhar credibilidade. Esta maior confiança pode gerar uma maior participação entre o público para ajudar na investigação.

Um bom exemplo de crowdsourcing na área médica é Folding@home, uma organização e plataforma online que utiliza o crowdsourcing para acelerar simulações, como as que compõem o coronavírus responsável pela COVID-19, e para desenvolver novas terapias.

Através de uma parceria com a Microsoft AI for Health, o Dr. Greg Bowman, biofísico molecular da Escola de Medicina da Universidade de Washington em St. Louis, solicitou a voluntários de todo o mundo que utilizassem o seu poder de computação pessoal para executar simulações de proteínas e enviar os dados gerados de volta para os seus servidores. A paixão colectiva para resolver uma pandemia global resultou no número de dispositivos a funcionar Folding@home a crescer de cerca de 10.000 para 1 milhão em apenas dois meses. Bowman vê o método de crowdsourcing de utilizar dados abertos como um modelo para combater tanto doenças existentes como futuras.

"Podemos pegar num problema que teria demorado 500 anos a completar num único computador e resolvê-lo numa questão de seis meses", disse ele.

Saiba mais sobre o Folding@home e o Dr. Greg Bowman.

Mais informações sobre o programa e projectos de IA para a Saúde da Microsoft podem ser encontradas aqui.

4. Governação Comunitária Governação Comunitária: Construiu confiança na sua comunidade em torno da utilização de dados?

Estabelecimento de quadros de boa governação

A utilização de dados para abordar problemas sociais implicará muitas vezes questões importantes de governação e conformidade. É importante colocar também essas questões no contexto da comunidade de partes interessadas com interesses nos dados e na sua utilização. A construção de relações fortes com essa comunidade ajudará a promover a boa governação e a identificar utilizações novas e admissíveis que possam conduzir a benefícios inesperados de uma colaboração de dados ou iniciativa relacionada. Quando estas oportunidades são confiadas pela sua comunidade, podem amplificar os benefícios da sua iniciativa de dados para todas as organizações, indivíduos e comunidades envolvidas ou com impacto.

Os quadros de boa governação podem ajudar a mitigar os riscos. Estes riscos podem ser legais e regulamentares, mas os riscos para a confiança e reputação do público são também de importância significativa para as organizações. Estes têm de ser contrabalançados com os riscos de não facultar o acesso a dados para fins de interesse público. O GovLab, e outros, enquadram este processo como encontrando formas de evitar tanto a má utilização, tais como utilizações não autorizadas que prejudiquem as pessoas em causa, como utilizações perdidas, incluindo oportunidades falhadas de ter melhorado a vida das pessoas através da reutilização de dados. Seguem-se exemplos de considerações de governação que, quando deliberadas e aplicadas nas fases iniciais, podem ser utilizadas para alcançar tanto a atenuação do risco como maiores oportunidades de utilização de dados.

Uma governação que gera transparência e conformidade

E se pudéssemos permitir a utilização de dados que todos possam compreender? Isto poderia incluir o desenvolvimento de uma iniciativa com qualquer uma das seguintes considerações incorporadas desde o início:

  • Transparência na governação da iniciativa e nos conselhos de administração
  • Transparência no propósito da iniciativa
  • Transparência nos dados recolhidos, acedidos, ou criados
  • Transparência na forma como a utilização dos dados cumpre as leis e regulamentos
  • Identificação de um responsável pelos dados
  • Armazenamento e partilha de dados em segurança
  • Fornecer acesso ou partilhar dados de uma forma que preserve a privacidade e a informação comercialmente sensível
  • Proporcionar conhecimentos a uma vasta gama de intervenientes onde os benefícios são partilhados
  • Utilizando abordagens que dão aos indivíduos e organizações uma palavra a dizer em aspectos de como os dados são recolhidos, utilizados, armazenados e partilhados

Governação que cria apoio comunitário

E se pudéssemos recolher dados que ajudassem as comunidades locais a resolver problemas locais? E se utilizássemos dados para abordar as barreiras à inclusão? Respostas a perguntas como estas ajudarão a mostrar ao público que o aproveitamento de dados de formas novas e responsáveis é do seu interesse e pode ter efeitos positivos a longo prazo.

Uma governação que permite uma utilização aberta

Que mecanismos existem para assegurar que os dados possam ser partilhados e utilizados? As considerações podem incluir:

  • Como tornar os dados "tão abertos quanto possível" para ajudar à inovação e utilização e combinar os dados de formas novas e interessantes. Podem os dados ser tornados abertos ou partilhados de forma confiável, como por exemplo através da anonimização?
  • Como podem os dados ser tornados interoperáveis utilizando modelos de dados comuns, normas, ou identificadores estáveis? Por exemplo, os Princípios FAIR fornecem orientações para melhorar a capacidade de descoberta, acessibilidade, interoperabilidade e reutilização dos dados de investigação.

O levantamento destes objectivos pode ser muito útil no desenvolvimento de um quadro de governação para um ecossistema de dados justo, aberto e digno de confiança. Uma ferramenta útil para desenvolver e avaliar a forma como os dados são utilizados é a Tela de Ética em Dados do Open Data Institute.

Ao longo de todo o ciclo de vida da iniciativa, o quadro de governação deve ser reexaminado para criar um circuito de feedback para assegurar que os objectivos estão a ser constantemente reavaliados, particularmente se esses objectivos mudarem. Poderá decidir que as decisões de governação são melhor delegadas a um grupo de partes interessadas ou a um organismo independente, por exemplo, a um conselho de governação ou a um delegado de dados independente. Quando as decisões são delegadas, pode ser particularmente importante ter orientações ou uma abordagem de princípio acordada que permita que essas decisões se desenvolvam de uma forma que esteja de acordo com o espírito da iniciativa.

Além disso, a co-criação de princípios e condições sob as quais os dados são acedidos e reutilizados através de deliberações directas, tais como o modelo apresentado pela The GovLab's The Data Assembly, pode prever uma licença social adicional para colaboração de dados.

Uma abordagem baseada em princípios

Uma abordagem de princípio à governação ajudá-lo-á a desenvolver um quadro de governação que vá para além das considerações legais e de conformidade. Isto pode ser útil quando múltiplas organizações estão envolvidas numa iniciativa de inovação de dados. Ao concordar inicialmente com os princípios pelos quais pretende recolher, armazenar, utilizar e partilhar dados, o grupo estará habilitado a tomar decisões no futuro. Os princípios podem, em alguns casos, ser consagrados numa carta de dados.

Como ponto de partida para avaliar e avaliar as suas políticas e princípios de partilha de dados, a Microsoft publicou cinco princípios que informam as nossas contribuições e compromissos de colaboração de dados de confiança. Esperamos que estes princípios informem a conversa mais ampla sobre dados abertos e que outros possam desenvolvê-los e melhorá-los. Os cinco princípios são:

  • Abertos - Trabalharemos para tornar os dados relevantes para problemas sociais importantes tão abertos quanto possível, inclusive contribuindo nós próprios com dados abertos
  • Utilizável - Investiremos na criação de novas tecnologias e ferramentas, mecanismos e políticas de governação para tornar os dados mais utilizáveis para todos
  • Capacitação - Ajudaremos as organizações a gerar valor a partir dos seus dados de acordo com as suas escolhas, e a desenvolver o seu talento AI para utilizar os dados de forma eficaz e independente
  • Seguro - Utilizaremos controlos de segurança para garantir que a colaboração de dados é operacionalmente segura onde é desejada
  • Privado - Ajudaremos as organizações a proteger a privacidade dos indivíduos em colaborações de partilha de dados que envolvam informação pessoalmente identificável

Perfil: A Parceria Público-Privada de Dados em curso em Londres

Um exemplo de governação comunitária é a Carta de Dados publicada em 2021, seguindo as recomendações da Comissão de Dados de Londres.

O desbloqueio de soluções baseadas em dados é fundamental para a resolução de questões que afectam o crescimento futuro da cidade. Sem sinergia entre as autoridades locais e os interesses privados, seria impossível encontrar soluções para problemas urgentes como a melhoria da qualidade do ar, a redução dos tempos de deslocação, a melhoria do trânsito, e a redução do congestionamento. Em finais de 2019, o grupo empresarial London First reuniu um grupo de organizações públicas e privadas como membros da Comissão de Dados de Londres. A Comissão de Dados, dirigida por uma equipa de parceiros de projecto, incluindo London First, Arup, Oliver Wyman Forum, e Microsoft, reuniu autoridades locais e empresas privadas em torno da partilha de dados da forma mais aberta possível. A Comissão de Dados foi encarregada de servir como a voz empresarial autorizada sobre dados da cidade e de ajudar a lançar um ecossistema de partilha de dados, criando padrões de qualidade de dados e abordando questões como privacidade, ética, e confiança. Em Setembro de 2020, a Comissão de Dados de Londres desenvolveu propostas para um quadro de dados para Londres. Este quadro recomendou a entrega de um Quadro de Dados de Londres e de uma Carta de Dados de Londres.

Seguindo as recomendações da Comissão de Dados de Londres, Londres Primeiro criou um grupo de trabalho para cumprir estas recomendações e continuar a trabalhar com o Chief Digital Officer de Londres para entregar o London Data Board e desenvolver a London Data Charter.

A Carta de Dados de Londres é construída sobre um quadro de sete princípios: Proporcionar benefícios para os londrinos; Promover a inovação inclusiva; Proteger a privacidade e a segurança; Promover a confiança; Partilhar aprendizagens com outros; Criar soluções escaláveis e sustentáveis; e Ser tão aberto quanto possível. Uma vasta gama de empresas comprometeram-se com o quadro, e a carta está agora a considerar marcos para Londres na forma como trabalha com a comunidade empresarial da cidade para colaborar na segurança de dados em benefício de projectos públicos.

Saiba mais sobre a Comissão de Dados de Londres aqui, e sobre a London Data Charter aqui.

5. Tecnologia e Dados Tecnologia e Dados: Que soluções e recursos necessita para medir, permitir e aumentar o seu impacto?

Factores para determinar a infra-estrutura técnica correcta

Fundamental para abrir dados é a infra-estrutura técnica necessária para trabalhar com esses dados e apoiar a partilha de dados. Isto inclui análise de dados e ferramentas de visualização de dados, bem como tecnologias e plataformas para aceder e partilhar dados dentro e entre organizações de forma fácil e segura.

Para determinar as necessidades tecnológicas e de plataforma da sua iniciativa de dados, factores importantes a considerar incluem:

  • Os dados são sensíveis?
  • O que precisa de proteger, e a que norma legal ou contratualmente?
  • O que deve proteger, tendo em conta considerações éticas, reputacionais e comerciais?
  • Com que objectivo é que os dados são disponibilizados?
  • A quem é que os dados estão a ser disponibilizados?
  • Que nível de utilidade é necessário para trabalhar com os dados?
  • Pode o nível de utilidade necessário ser alcançado através da aplicação de tecnologias de reforço da privacidade?
  • Que plataformas existem para facilitar a partilha e o acesso aos dados, de acordo com as normas exigidas?
  • Para os dados sensíveis, que quadros de governação estão em vigor para controlar o acesso e a partilha?

A Viagem de Responsabilidade de Dados do GovLab é uma ferramenta de avaliação que procura permitir uma revisão de tais questões de uma forma interactiva.

Cada um destes factores pode apontar para uma série de necessidades tecnológicas. Por exemplo, as ferramentas de análise de dados podem ajudar a acompanhar tendências, identificar problemas e eficiências, bem como a fazer previsões. As ferramentas de visualização de dados permitem visualizar os dados com que se está a trabalhar, e manipulá-los visualmente.

Em cenários onde a privacidade deve ser protegida, deve ser considerada uma série de técnicas de preservação da privacidade, tais como a anonimização e a desidentificação. A privacidade diferencial é uma técnica orientada pela indústria para permitir uma maior abertura dos dados, de modo a não pôr em risco a protecção de dados. Conceitualmente, a privacidade diferencial utiliza duas etapas para obter benefícios de privacidade:

  • Primeiro, o ruído é acrescentado a cada resultado para mascarar a contribuição de pontos de dados individuais. O ruído é suficientemente significativo para proteger a privacidade de um indivíduo, mas com o objectivo de não afectar materialmente a exactidão das respostas extraídas por analistas e investigadores.
  • Em segundo lugar, a quantidade de informação revelada de cada consulta é calculada e deduzida de um orçamento global de perda de privacidade. Uma vez que o orçamento de privacidade é totalmente utilizado, os dados são retirados e não são permitidas consultas adicionais para evitar qualquer compromisso pessoal de privacidade. Isto pode ser pensado como um interruptor de desligamento integrado que impede o sistema de mostrar dados quando pode começar a comprometer a privacidade de alguém.

Quando se trata de segurança, é importante considerar a política ou o estado do ciclo de vida dos dados que se pretende aplicar, bem como os mecanismos certos para alcançar os objectivos de segurança da sua organização. Controlar o acesso aos dados e assegurar que aqueles a quem é concedido acesso são autorizados e devidamente autenticados é fundamental, mas podem ser necessárias medidas técnicas adicionais dependendo dos dados e da forma como devem ser utilizados. A computação confidencial ajuda a proteger os dados sensíveis na nuvem, oferecendo segurança através da encriptação de dados em uso que proporciona protecção adicional aos seus dados enquanto estão a ser processados e permite uma maior colaboração entre as organizações.

Perfil: Como as tecnologias de reforço da privacidade ajudaram a avaliar o impacto da aprendizagem à distância na educação dos jovens estudantes

Oito meses após a pandemia da COVID-19, o Open Data Institute e a Microsoft iniciaram um Desafio de Dados Abertos para estudar o impacto da transição para a aprendizagem à distância na educação dos jovens estudantes.

Para dar aos participantes do desafio acesso a novos e relevantes conjuntos de dados, a Microsoft publicou conjuntos de dados percentuais de utilização de banda larga dos Estados Unidos, tanto a nível de município como a nível de código postal, derivados de dados anónimos que recolhemos como parte do nosso trabalho contínuo para melhorar o desempenho e a segurança do nosso software e serviços. O conjunto de dados a nível de código postal fornece uma visão granular das percentagens de utilização da banda larga pelos agregados familiares dentro de um código postal, pelo que demos um passo adicional para garantir a garantia da privacidade dos dados. Aplicámos privacidade diferencial, acrescentando ruído às agregações de dados. A BroadbandNow também participou, disponibilizando pela primeira vez os seus preços ao nível de município e os dados do fornecedor de banda larga.

O Desafio de Dados Abertos da Educação produziu submissões e análises perspicazes com combinações e visualizações de dados. O desafio também serviu para destacar como podem ser disponibilizados dados mais abertos, protegendo ao mesmo tempo a privacidade.

 

Leia mais sobre o Desafio de Dados Abertos da Educação.

 

Recursos Liderança

Academia de Data Stewards

Para os líderes que procuram utilizar dados para a inovação social, a Academia de Data Stewards do Open Data Policy Lab: Desenvolver uma Estratégia de Reutilização de Dados para a Resolução de Problemas Públicos proporciona um programa de aprendizagem auto-dirigido.

Avaliação da Maturidade dos Dados

As organizações do sector social podem utilizar a ferramenta Data Maturity Assessment do data.org para ajudar a medir e compreender a posição actual da sua organização.

Oportunidade

Mapeamento do Ecossistema de Dados

Para um exercício de Mapeamento de Ecossistemas de Dados, visite o Mapeamento de Ecossistemas de Dados do Open Data Institute: Ferramenta e Orientação.

Livro de jogo da paisagem de dados

Para mais informações sobre a avaliação do panorama de dados e do contexto em que a sua iniciativa de dados opera, incluindo a identificação do problema que a sua iniciativa procura resolver, visite o Data Landscape Playbook do Open Data Institute.

Talento

Programas de formação

Quando se trata de programas de formação para aumentar os talentos actuais ou aperfeiçoar as competências dos talentos existentes, há uma variedade de recursos de que se pode recorrer:

  • Cursos LinkedIn Learning e Microsoft Learn para analistas de dados. Os cursos do LinkedIn Learning são ministrados por especialistas da indústria, e os cursos Microsoft Learn oferecem pequenos tutoriais passo-a-passo, ambientes de codificação e escrita interactivos baseados em browser, e realizações baseadas em tarefas.
  • Certificações Microsoft sobre dados e fundamentos de IA. As certificações Microsoft reconhecidas pela indústria ajudam os talentos a validar as suas competências e capacidade de desempenhar um papel utilizando tecnologias Microsoft.
  • Centro de Competências Digitais Microsoft para Sem Fins Lucrativos. Uma colaboração entre a TechSoup Courses e a Microsoft, especificamente para organizações sem fins lucrativos, para aceder à formação em produtos Microsoft, incluindo cursos centrados em Excel, Power BI, e muito mais.
  • Workshops e sessões de formação da Microsoft disponíveis através do Microsoft Store. Estes cursos de formação gratuitos e ao vivo para empresas e profissionais incluem sessões de mergulho introdutórias e mais profundas.
  • Aprendizagem Microsoft Viva. Formação a pedido está disponível como parte do Microsoft Viva Learning nas Equipas Microsoft.
  • Iniciativa MySkills4Afrika. Através da MySkills4Afrika, funcionários da Microsoft de todo o mundo disponibilizam o seu tempo, talento e perícia para ajudar a apoiar indivíduos e organizações em toda a África.

Quadro de Aptidões de Dados

Para recursos adicionais, consultar o Quadro de Competências de Dados do Open Data Institute.

Governação

Tela de Ética de Dados

A tela de Ética em Dados do Open Data Institute é uma ferramenta útil para desenvolver e avaliar a forma como os dados são utilizados.

A Assembleia de Dados

A Assembleia de Dados do GovLab fornece um modelo para a co-criação de princípios e condições em que os dados são acedidos e reutilizados através de deliberações directas.

Carta de Dados de Londres

A London Data Charter, publicada em finais de 2021, é um exemplo de governação comunitária em acção.

Tecnologia e Dados

Viagem de Responsabilidade de Dados

Ao avaliar as necessidades de tecnologia e recursos de uma organização para uma colaboração ou iniciativa de dados, The GovLab's Data Responsibility Journey é uma ferramenta que descreve as oportunidades e riscos a considerar em cada fase do ciclo de vida dos dados.

SmartNoise

A colaboração da Microsoft com a Iniciativa OpenDP, liderada por Harvard, lançou o SmartNoise, uma plataforma de código aberto de primeira qualidade para a privacidade diferencial. Qualquer pessoa pode começar a utilizar a plataforma para tornar os seus conjuntos de dados amplamente disponíveis a outros em todo o mundo. O código fonte aberto e exemplos estão disponíveis no GitHub.

Computação confidencial

A computação confidencial ajuda a proteger os dados sensíveis na nuvem, oferecendo segurança através da encriptação de dados em uso que proporciona protecção adicional aos seus dados enquanto estão a ser processados. Uma introdução útil à computação confidencial pode ser encontrada aqui, juntamente com exemplos de projectos aqui.

Partilha de dados Azure

A Microsoft tem várias tecnologias que suportam dados mais abertos numa variedade de casos de utilização, tais como o Azure Data Share, que permite às organizações partilhar dados de forma simples e segura com múltiplos clientes e parceiros e proporciona às organizações a capacidade de combinar dados internos com dados de parceiros para novos conhecimentos.

GitHub

GitHub é a maior plataforma de desenvolvimento de software e alojamento de código do mundo. GitHub é frequentemente utilizado para projectos de dados, particularmente para conjuntos de dados mais pequenos, dados com versões em colaboração, dados co-localizados com código, e fluxos de trabalho de aprendizagem de máquinas. GitHub suporta a renderização de dados e cadernos de notas em vários formatos.