Marco de datos abiertos para el impacto social

Introducción Aprovechar al máximo los datos abiertos y la colaboración de datos

Una nota de Burton Davis

En Microsoft, creemos que los datos son fundamentales para abordar los importantes problemas sociales a los que se enfrenta nuestro mundo hoy en día. La pandemia mundial nos ha mostrado el importante papel que desempeñan los datos a la hora de comprender, evaluar y tomar medidas para resolver los retos creados por la COVID-19. Sin embargo, casi todas las organizaciones, grandes y pequeñas, siguen luchando para que los datos sean relevantes para su trabajo. A pesar del valor que aportan los datos, muchas organizaciones no aprovechan su poder para mejorar los resultados.

Parte de esta lucha tiene su origen en la "brecha de datos", es decir, la que existe entre los países y organizaciones que tienen un acceso efectivo a los datos para ayudarles a innovar y resolver problemas y los que no lo tienen. Para cerrar esta brecha, Microsoft lanzó la Campaña de Datos Abiertos en 2020 para ayudar a hacer realidad la promesa de más datos abiertos y colaboraciones de datos que impulsen la innovación.

Una de las principales lecciones que hemos aprendido de la Campaña y del trabajo que hemos realizado con nuestros socios, el Instituto de Datos Abiertos y The GovLab, es que la capacidad de acceder y utilizar los datos para mejorar los resultados implica mucho más que las herramientas tecnológicas y los datos en sí. También es importante poder aprovechar y compartir las experiencias y prácticas que promueven la colaboración de datos y la toma de decisiones eficaces. Esto es especialmente cierto cuando se trata de trabajar con gobiernos, organizaciones multilaterales, organizaciones sin ánimo de lucro, instituciones de investigación y otros que buscan abrir y reutilizar los datos para abordar importantes problemas sociales, especialmente los que enfrentan los países en desarrollo.

Dicho de otro modo, el mero hecho de tener acceso a los datos y a la tecnología no crea valor ni mejora los resultados por arte de magia. Para sacar el máximo partido a los datos abiertos y a la colaboración en materia de datos, es necesario reflexionar sobre el modo en que la dirección de una organización puede comprometerse a hacer que los datos sean útiles para su misión, definiendo las preguntas a las que quiere dar respuesta con los datos, identificando las habilidades que su equipo necesita para utilizar los datos y determinando la mejor manera de desarrollar y establecer la confianza entre los colaboradores y las comunidades a las que sirve para obtener más información y beneficios de los datos.

El Marco de Datos Abiertos para el Impacto Social es una herramienta que los líderes pueden utilizar para poner los datos a trabajar para resolver los desafíos más importantes para ellos. Reconociendo que no todos los datos pueden ser accesibles al público, vemos los enormes beneficios que pueden derivarse de la promoción de más datos abiertos, ya sea en forma de colaboraciones de datos de confianza o de datos verdaderamente abiertos y públicos. Utilizamos la expresión "impacto social" para referirnos a un cambio positivo que permita abordar un problema social, como la reducción de las emisiones de carbono, el cierre de la brecha de la banda ancha, el desarrollo de habilidades para el empleo y el avance de la accesibilidad y la inclusión.

Creemos en las oportunidades ilimitadas que la apertura, el intercambio y la colaboración en torno a los datos pueden crear para obtener nuevas perspectivas, tomar mejores decisiones y mejorar la eficiencia a la hora de abordar algunos de los retos más acuciantes del mundo.

Burton Davis
Vicepresidente y Consejero General Adjunto del Grupo de Propiedad Intelectual de Microsoft

 

Este sitio no pretende proporcionar orientación legal y no debe ser considerado como tal. El marco proporciona recursos para ayudar a las organizaciones a avanzar en los datos abiertos y participar en colaboraciones de datos para el bien social. Compartir datos no está exento de riesgos. Se recomienda obtener asesoramiento jurídico independiente. Este sitio incluye enlaces a recursos de terceros. Microsoft no se responsabiliza de ninguna pérdida, lesión o daño derivado del uso de los enlaces o de la confianza en los materiales puestos a disposición por terceros.

Inicio rápido: Su hoja de ruta hacia los datos abiertos Una sencilla hoja de ruta para empezar

Explorar la hoja de ruta

Es posible que las organizaciones interesadas en utilizar datos abiertos comprendan sus ventajas y cómo podrían aplicarse a proyectos concretos, pero puede que no esté claro cómo dar ese primer paso. La siguiente es una sencilla hoja de ruta que puede seguir para empezar a utilizar más datos abiertos para abordar los retos de su organización, su comunidad y el mundo en general. Donde se indica, haga clic para obtener más información y saltar a las secciones correspondientes de este marco.

1. Determine si cuenta con la infraestructura organizativa necesaria.

Para muchas organizaciones, adoptar un enfoque de datos abiertos es un cambio cultural. ¿Tiene la aceptación de las partes interesadas? ¿Ha evaluado las inversiones necesarias para poner los datos en funcionamiento? ¿Se ha establecido la confianza entre las partes interesadas? Asegúrese de tener estas respuestas antes de dar el siguiente paso.

Más información en Liderazgo: ¿Está preparado para poner los datos a trabajar para mejorar los resultados sociales?

2. Comprender las preguntas a las que se quiere responder con datos.

Su estrategia de datos empieza por identificar las preguntas a las que quiere dar respuesta. Una vez identificadas estas preguntas, puede determinar qué conjuntos de datos son necesarios y si tiene acceso a ellos.

Más información en Oportunidad: ¿Cuáles son las preguntas que quiere responder con datos?

3. Reúne el talento necesario.

Necesita la estrategia y los conjuntos de datos adecuados. Pero también necesita a las personas adecuadas para que le proporcionen análisis y conocimientos a lo largo del proyecto. Asegúrate de evaluar los conocimientos de datos necesarios y de que todos los miembros de tu equipo comprendan que la colaboración es el núcleo del proyecto.

Más información en El talento: ¿Tiene el talento necesario para el análisis de datos?

4. Construir la confianza en la comunidad.

Cree un buen marco de gobernanza para garantizar que se abordan tanto las oportunidades como los riesgos de los datos. Asegúrese de que su política de gobernanza garantice la transparencia entre las partes interesadas, la inclusión de los miembros de la comunidad y fomente la capacitación, para que entiendan por qué la recopilación y el uso de datos abiertos es lo mejor para ellos.

Más información en Gobernanza comunitaria: ¿Ha creado confianza en su comunidad en torno al uso de los datos?

5. Asegúrese de que dispone de los recursos de datos adecuados.

Las herramientas de análisis y visualización de datos son esenciales si se trabaja con una amplia gama de conjuntos de datos y un gran volumen de datos. Del mismo modo, garantizar que se tienen en cuenta las necesidades de privacidad y seguridad es esencial para las colaboraciones responsables de datos abiertos y de intercambio de datos.

Más información en Tecnología y datos: ¿Qué soluciones y recursos necesita para permitir y mejorar su impacto?

Antecedentes y contexto Explicación de los retos de los datos abiertos

¿Por qué es tan importante el acceso a los datos?

La inteligencia artificial, o IA, es la columna vertebral de la transformación digital que el mundo está experimentando actualmente. Las operaciones industriales, los procesos empresariales, la gestión de clientes y otros aspectos están siendo transformados por el aprendizaje automático, que está creando la oportunidad de una mayor experimentación, eficiencia y velocidad. La racionalización de la recopilación, el almacenamiento y la gestión de grandes cantidades de datos crea perspectivas más fiables que las organizaciones pueden utilizar en su toma de decisiones.

Los conjuntos de datos amplios y diversos pueden ayudar a reforzar esos conocimientos o añadirlos. Los datos abiertos, es decir, los que se publican para que cualquiera pueda acceder a ellos, utilizarlos y compartirlos sin restricciones, pueden ayudar a los usuarios a resolver problemas a mayor velocidad y con mayor autoridad, lo que puede dar lugar a avances más rápidos y, como también pueden ser predictivos, pueden generar previsiones con mayor precisión. Por estas razones, el valor que los datos abiertos ofrecen en la sanidad, la ciencia, la educación, el medio ambiente y otros ámbitos es inconmensurable para ayudar a resolver los mayores retos de la sociedad.

Pero al abrir los datos, ¿no perderán valor?

En la mayoría de los casos, el valor de los datos no reside en sí mismo, sino en lo que se hace con ellos. En este contexto, también es importante señalar algunos aspectos económicos de los datos. Los datos no son rivales: pueden ser utilizados una y otra vez por muchos sin que se agote su valor, y pueden utilizarse para conseguir efectos de red: por ejemplo, más datos pueden crear una mejor IA, que puede atraer más uso y generar más datos.

Abrir los datos o hacerlos más accesibles tiene el potencial de generar más valor que mantenerlos aislados y puede desbloquear un enorme valor público. Los usuarios que combinan los datos con otros conjuntos de datos o trabajan con ellos en un nuevo contexto pueden descubrir nuevas perspectivas que no eran evidentes en su uso original. Como cita el Laboratorio de Políticas de Datos Abiertos en su marco de las 9R, unos datos más abiertos también pueden permitir la reproducibilidad, mejorando la confianza en los resultados al permitir que otros realicen trabajos idénticos o relacionados.

La clave no es simplemente transferir los datos a otros usuarios, sino trabajar con ellos para entender cómo se están utilizando y cómo se pueden compartir los beneficios de esos usos con la comunidad. Su valor proviene de cómo se utiliza para facilitar nuevos significados y soluciones. Abrir los datos puede ayudar a evitar que se pierdan sus usos y su valor si se mantienen cerrados. Este es el espíritu de colaboración de los datos abiertos. Su valor es infinito.

Para saber más sobre el valor de los datos, visite el informe The Value of Data del Open Data Institute.

¿Qué pasa con las preocupaciones sobre la privacidad asociadas a la apertura de datos?

Una de las preocupaciones de la apertura de datos puede ser el riesgo de revelar datos sensibles. Salvaguardar la privacidad de las personas y proteger la información confidencial o comercialmente sensible puede ser un requisito legal o estar regulado por un contrato. Además, las organizaciones deben tener en cuenta los riesgos reputacionales, éticos y comerciales de compartir datos sensibles.

Para proteger a las partes interesadas en el ecosistema de intercambio de datos, y para generar confianza en el intercambio de datos, es importante proteger los datos sensibles a través de los medios legales, técnicos y organizativos adecuados. Pero este requisito no debe disuadir a las organizaciones de llevar a cabo una estrategia de datos eficaz. Más bien, el nivel de protección puede lograrse mediante la aplicación de marcos de gobernanza adecuados para el intercambio responsable de datos.

Por ejemplo, las herramientas de mejora de la privacidad pueden utilizarse para ayudar a mantener la privacidad de la información personal. Tecnologías y técnicas como la privacidad diferencial, la encriptación homomórfica, la computación confidencial, la anonimización y la desidentificación pueden aprovecharse para salvaguardar la privacidad individual al tiempo que se mejora el acceso a los datos por parte de las organizaciones, los investigadores y la sociedad civil. Aunque estas tecnologías pueden no ser apropiadas para todos los entornos, pueden ser útiles en determinados contextos.

Para saber más sobre las condiciones favorables y los factores desfavorables que suelen determinar el impacto de las iniciativas de datos abiertos, visite la Tabla Periódica de Factores de Impacto de los Datos Abiertos de The GovLab.

Los beneficios de los datos abiertos para su organización

Crea una toma de decisiones más informada

Los datos abiertos pueden aportar a los interesados nuevos conocimientos que les ayuden a tomar decisiones más informadas y objetivas. El valor de los conjuntos de datos adicionales procedentes de diferentes fuentes puede ayudar a los usuarios a obtener una mayor claridad en torno a los problemas y desbloquear nuevos conocimientos. Como dice el refrán, "no se sabe lo que no se sabe". Los datos abiertos ofrecen la oportunidad de descubrir nuevas posibilidades que los usuarios nunca habían considerado.

El motor de este proceso es la propia naturaleza de los datos abiertos. Por ejemplo, los datos pueden ser analizados de numerosas maneras para revelar patrones y obtener una visión multifacética del problema que el usuario está tratando de resolver. Estos resultados pueden compartirse con el público en general para que el crowdsourcing mejore los resultados o cree otros nuevos aún no descubiertos. Además de la difusión y la concienciación, los datos abiertos pueden animar a otros a corresponder y producir contribuciones que beneficien a todos.

Por ejemplo, The Nature Conservancy (TNC)-India y Microsoft están utilizando imágenes abiertas de satélite existentes para crear un nuevo conjunto de datos abiertos sobre parques solares en la India. Estos datos ayudarán a identificar los factores que determinan la idoneidad del terreno para los proyectos solares y, en última instancia, ayudarán a los organismos públicos a planificar mejor el desarrollo de la energía solar.

Por lo tanto, la toma de decisiones no tiene por qué basarse estrictamente en los conjuntos de datos que residen en una sola organización. Los datos abiertos permiten el acceso a los datos publicados por otros, y pueden crear la oportunidad de realizar más aportaciones a los datos de su organización, informando aún más el resultado final y la toma de decisiones.

Lo que crea nuevas oportunidades de descubrimiento

Como se ha sugerido anteriormente, los datos abiertos ayudan a los usuarios a identificar y abordar diferentes problemas que pueden no haberse considerado inicialmente. Los datos abiertos también ayudan a las organizaciones a identificar conexiones con otros conjuntos de datos. El Índice de Vulnerabilidad Alimentaria y Agrícola de Purdue se basó en conjuntos de datos abiertos muy diferentes para generar nuevos conocimientos sobre el impacto de COVID-19 en la producción agrícola y la salud de los agricultores y trabajadores agrícolas.

Con el acceso a más datos, se puede obtener información más rápidamente. Esto da libertad a los usuarios para experimentar con nuevas ideas, ver correlaciones no conocidas antes o prolongar la fase de descubrimiento. Este despliegue continuo de los datos permite nuevas posibilidades de forma más eficiente que la que existía anteriormente.

Como resultado, se puede acelerar la innovación

Los avances en la ciencia que utilizan datos abiertos ya nos han demostrado que representan un modelo importante para los investigadores, que promueve el intercambio de protocolos, la comunicación y difusión de resultados, el intercambio de código, etc. La propia naturaleza de cualquier tipo de investigación depende, en efecto, de que los datos puedan buscarse, ser accesibles y reutilizarse para impulsar el escrutinio de terceros.

La promesa de los datos abiertos es que abre esas puertas y acelera la investigación y la innovación en beneficio del público. Por ejemplo, hacer públicos o compartidos ciertos datos sanitarios ayudó a acelerar el desarrollo de tratamientos médicos como las vacunas producidas para combatir el virus COVID-19. Las lecciones aprendidas de esa experiencia han motivado a Estados Unidos a asignar miles de millones de dólares para apoyar una investigación más oportuna. Los Institutos Nacionales de la Salud han aportado hasta la fecha fondos por valor de casi 4.900 millones de dólares para apoyar proyectos de investigación sobre el COVID-19. La incorporación de los principios de los datos abiertos en estos programas puede ayudar a acelerar la investigación, lo que beneficiará a la pandemia actual y a las crisis que se avecinan.

El valor de los datos abiertos - En cifras

  • En un informe de 2013 del McKinsey Global Institute, el mercado de los datos abiertos, valorado en 3 billones de dólares al año, se centra en el valor de combinar los datos abiertos de la administración con los datos compartidos de las empresas.
  • En 2014, Lateral Economics estimó que el valor potencial de los datos abiertos para el G20 sería de unos 2,6 billones de dólares al año, contribuyendo al producto interior bruto (PIB) acumulado de los países del G20 en torno al 1,1% entre 2014 y 2019, o el 55% del objetivo de crecimiento adicional del G20 del 2%.
  • En 2020, el Portal Europeo de Datos estimó que el valor de los datos abiertos para la UE28+ era de 184.450 millones de euros en 2019, y previó que alcanzaría entre 199.510 y 334.200 millones de euros en 2025. El informe también examinó las cifras de empleo, con 1,09 millones de empleados de datos abiertos en 2019 y entre 1,12 y 1,97 millones previstos para 2025.
  • Transport for London ha informado de que el uso de sus datos abiertos ha permitido a las empresas del sector privado aportar entre 12 y 15 millones de libras al año a la economía londinense.

Para obtener más información y estudios de casos sobre las razones por las que las empresas están adoptando el intercambio de datos, visite las "Siete razones por las que las empresas deberían compartir datos" del Instituto de Datos Abiertos.

Para más información sobre el caso de negocio para la colaboración de datos y la reutilización de datos en el interés público, vea el Marco de las 9Rs del Laboratorio de Políticas de Datos Abiertos.

El marco de datos abiertos para el impacto social Una herramienta que los líderes pueden utilizar

Sobre el marco

El Marco de Datos Abiertos para el Impacto Social es una herramienta que los líderes pueden utilizar para poner los datos al servicio de la solución de importantes problemas sociales, como la reducción de las emisiones de carbono, la eliminación de la brecha de la banda ancha, el desarrollo de habilidades para el trabajo y el avance de la accesibilidad y la inclusión. El siguiente marco está diseñado para guiar a los líderes de las organizaciones del ecosistema de datos -gobiernos, organizaciones sin ánimo de lucro y organizaciones multilaterales- hacia ideas y soluciones que pueden utilizar para ayudar a abordar importantes problemas sociales.

Este sitio identifica cinco áreas temáticas que las organizaciones deben tener en cuenta cuando buscan utilizar los datos para mejorar los resultados sociales: liderazgo, oportunidad, habilidades, gobernanza de la comunidad y tecnología y datos. Propone preguntas para hacer y ofrece recursos que pueden ayudar a responderlas. Estos conceptos cobran vida a través de ejemplos de proyectos de datos abiertos del mundo real. También hay una hoja de ruta hacia los datos abiertos que los líderes de las organizaciones pueden utilizar para empezar.

Este marco puede servir como herramienta para ayudar a sentar las bases de los datos abiertos y la colaboración de datos. Sin embargo, hay muchos otros recursos excelentes a los que recurrir que pueden ayudar a quienes desean utilizar los datos para el impacto social, algunos de los cuales identificamos a lo largo de este sitio.

El marco promueve una cultura de datos abiertos y colaboración de datos guiando a los líderes de la organización a través de las siguientes preguntas:

1. Liderazgo: ¿Está usted dispuesto a poner los datos a trabajar para mejorar los resultados sociales?

2. Oportunidad: ¿Cuáles son las preguntas a las que se quiere responder con datos?

3. Habilidades: ¿Tienes el talento necesario para el análisis de datos?

4. Gobernanza comunitaria: ¿Ha creado confianza en su comunidad en torno al uso de los datos?

5. Tecnología y datos: ¿Qué soluciones y recursos necesita para medir, habilitar y mejorar su impacto?

1. Liderazgo Liderazgo: ¿Estás preparado para poner los datos a trabajar para mejorar los resultados sociales?

Adoptar un enfoque abierto es un cambio cultural

Los líderes de las organizaciones pueden enfrentarse a una serie de preocupaciones o resistencias a la hora de poner los datos a trabajar para resolver retos difíciles. En algunos casos, el talento -con funciones que van desde los científicos de datos y los analistas de datos hasta los gestores de programas e investigadores- no se encuentra en la empresa para ingerir y analizar los datos. En otros casos, el largo tiempo necesario para desarrollar una estructura de gobernanza de intercambio de datos con otras organizaciones puede hacer que se abandone la colaboración antes de que dé sus frutos.

En última instancia, para la mayoría de las organizaciones, la adopción de un enfoque de datos abiertos es un cambio cultural.

En este sentido, es importante reconocer que las organizaciones se sitúan en un espectro de madurez de datos, desde un compromiso inicial con el uso de datos para la innovación hasta una cultura en la que la innovación de datos está integrada en todos los niveles. Independientemente de la posición en la que se encuentre una organización en este espectro, un enfoque de datos abiertos requiere un líder que se comprometa a poner en práctica los datos de la organización. Este compromiso puede adoptar diversas formas, como por ejemplo

  • Defender y hablar públicamente de la importancia de compartir los datos.
  • Extraer información de los datos.
  • Fomentar la colaboración y el compromiso de la comunidad.
  • Establecer relaciones con los principales beneficiarios y posibles usuarios de los datos.
  • Establecer un marco para el uso responsable de los datos.

Todas estas acciones contribuyen a crear un enfoque fiable para el intercambio de datos que puede infundir confianza entre las partes interesadas.

Pasos a tener en cuenta

Considere los siguientes pasos para situar a su organización en una mejor posición para utilizar los datos de forma innovadora para resolver los problemas prioritarios:

  • ¿Qué inversiones son necesarias para poner los datos en funcionamiento?
  • ¿Qué incentivos son necesarios para poner los datos en funcionamiento?
  • ¿Cómo se construye la confianza interna y externa? ¿Quiénes son sus socios/partes interesadas?
  • ¿Cómo puede crear un impulso dentro de su organización para considerar la innovación con datos como una prioridad a largo plazo, y no como un proyecto a corto plazo?

Se requiere un fuerte liderazgo

No es de extrañar que las organizaciones que priorizan los datos como un recurso vital requieran un liderazgo fuerte. Según una encuesta publicada en julio de 2021 por Data Orchard, el 63% de los encuestados afirma que la dirección de su organización no está convencida del valor de los datos. Solo un tercio dice que su liderazgo está comprometido y lo apoya, hace las preguntas correctas sobre los datos y es activo en el aprovechamiento de su valor. La promesa de aprovechar los datos crea una importante oportunidad para que los líderes mejoren su capacidad de utilizar los datos en beneficio de sus organizaciones.

El GovLab de la Universidad de Nueva York alberga una Academia de Administradores de Datos, que incluye un programa de aprendizaje autodirigido. El curso está diseñado para personas que ejercen como administradores de datos en diversas capacidades en todo el mundo, una función que busca responder a las preguntas enumeradas anteriormente de manera que permita una colaboración de datos sistémica, sostenible y responsable.

Perfil: Cómo la dirección de la Organización Mundial de la Salud transformó su cultura para orientarse a los datos

Los cambios culturales, estratégicos y operativos son necesarios para poner en marcha iniciativas de datos abiertos y de intercambio de datos. Para aprovechar el potencial de estos beneficios -como la responsabilidad por los resultados, la confianza, la transparencia y la seguridad-, los dirigentes deben abordar primero las barreras internas y otros tipos de resistencia organizativa. Para todos estos cambios, y especialmente en una gran organización, es fundamental un liderazgo y un compromiso sólidos.

La Organización Mundial de la Salud (OMS) demuestra continuamente esta necesidad a la hora de transformar la cultura de una organización para que esté más orientada a los datos. Con más de 8.000 empleados en todo el mundo y la obligación de rendir cuentas a sus 194 Estados miembros en seis regiones, la puesta en marcha de una iniciativa de transformación digital solo podría llevarse a cabo mediante un liderazgo y una acción sólidos en todos los niveles.

Como organización multilateral, la OMS tiene un estatus único como entidad basada en la ciencia y la evidencia que establece normas y estándares aplicables a nivel mundial con la misión de promover la salud, mantener el mundo seguro y servir a los vulnerables. Cuando el Dr. Tedros Adhanom Ghebreyesus fue nombrado Director General de la OMS en 2017, reconoció que los datos eran un componente fundamental para cumplir esta misión y alcanzar las metas del "triple mil millones ", es decir, mil millones más de personas que disfrutan de mejor salud y bienestar, mil millones más de personas con acceso a una cobertura sanitaria universal asequible y mil millones más de personas mejor protegidas frente a las emergencias sanitarias.

En 2019, el Dr. Tedros demostró su compromiso de transformar la OMS en una organización moderna y orientada a los datos, anunciando públicamente su visión y estableciendo una nueva División de Datos, Análisis y Suministro para el Impacto (DDI). Esta división se formó para abordar urgentemente las lagunas de datos, reducir la fragmentación de los datos y aumentar la eficiencia de los procesos de datos integrales de la OMS. Se hizo especial hincapié en la consolidación de los datos y activos sanitarios para los usuarios externos e internos, así como en el uso de tecnologías modernas, incluida la seguridad de los datos privados y sensibles, la transparencia de los análisis y los potentes métodos de visualización.

Desde el principio, la dirección de la OMS se propuso crear confianza y continuidad con las partes interesadas, tanto internas como externas, promoviendo un enfoque estratégico y coherente de la gobernanza de los datos. Internamente, se formó un Comité de Gobernanza de Datos, compuesto por altos directivos, para establecer la dirección corporativa de la estrategia y la política de datos. También se creó un centro de datos para facilitar la aplicación de las políticas de gobernanza de datos en toda la OMS, con todos los programas pertinentes y todas las regiones representadas. Se encomendó a los altos directivos que apoyaran periódicamente las reuniones de la colaboración para proporcionar orientación, fomentando así los avances y dando el apoyo tan necesario para institucionalizar un nuevo mecanismo de gobernanza de datos.

A nivel externo, la OMS buscó asesoramiento externo y se asoció con organizaciones ajenas a las Naciones Unidas, incluido el sector privado, para avanzar en sus capacidades de datos y análisis. En junio y septiembre de 2021, convocó dos cumbres sobre la gobernanza de los datos sanitarios para reunir a la OMS, los Estados miembros, los asociados y el público en general con el fin de examinar las mejores prácticas y subrayar la necesidad de que los datos sanitarios sean un bien público mundial.

Además, en colaboración con Microsoft y Avanade, entre otros, la dirección de la OMS realizó una inversión a largo plazo para desarrollar y mantener los sistemas técnicos necesarios para impulsar las decisiones mediante datos oportunos, fiables y procesables. Esta inversión dio lugar al desarrollo del Centro Mundial de Datos Sanitarios (CMDS). El WHDH es la primera solución integral del mundo para la salud mundial y tiene como objetivo racionalizar los procesos y garantizar que los datos sean accesibles, localizables y utilizables para todas las partes interesadas.

A lo largo de este proceso de transformación, la dirección de la OMS ha demostrado este compromiso hablando públicamente, siendo visible y comprometiéndose tanto interna como externamente, y realizando inversiones a largo plazo en las herramientas prácticas (como la WHDH) y el cambio de comportamiento (como una carta de valores actualizada) necesarios para la implementación. Este cambio cultural a gran escala hacia una organización basada en los datos sería imposible sin el compromiso de los dirigentes, y la OMS puede servir de ejemplo para otras organizaciones que pretendan realizar un cambio similar.

2. Oportunidad Oportunidad: ¿Cuáles son las preguntas a las que quiere responder con datos?

Entender el "por qué" es esencial para iniciar un proyecto

Entender por qué se quiere resolver un problema parece una tarea bastante sencilla. De hecho, preguntarse el "por qué" puede parecer tan sencillo que a menudo se pasa por alto este paso. Sin embargo, preguntarse "por qué" es esencial para iniciar un proyecto y también para mantener una solución sostenible. Es necesario a lo largo de todo el ciclo de vida de la innovación, desde la creación de un impulso dentro de una organización, la información sobre el compromiso de las partes interesadas, el impulso de la progresión en el proyecto, la derivación del enfoque correcto de la gobernanza, la garantía de que los datos son adecuados para el propósito, hasta la implementación de una solución técnica.

Identifique las preguntas que debe responder para resolver su problema

Identificar las preguntas a las que se quiere dar respuesta es un primer paso crucial. Una vez identificadas las preguntas, se puede empezar a pensar en las soluciones necesarias para abordarlas y ayudar a resolver el problema.

Algunos ejemplos de problemas que los datos abiertos pueden ayudar a resolver son:

  • Mi organización tiene datos que podrían contribuir a mejorar la planificación de la movilidad en mi región. Cómo puedo compartir estos datos de forma significativa y responsable?
  • Mi organización ha publicado datos abiertos sobre desigualdades raciales. Cómo podemos fomentar el uso de estos datos?
  • ¿Cuáles son las intervenciones más rentables y equitativas para mejorar la calidad del aire en cada región, especialmente en lo que respecta a las fuentes de contaminación que afectan a los países de ingresos bajos y medios?

Para conocer este último ejemplo y otras cuestiones apremiantes y de gran impacto que podrían abordarse si los conjuntos de datos pertinentes se aprovecharan de forma responsable, visite la iniciativa The 100 Questions de The GovLab.

Entender cómo los datos pueden ayudarle a responder a esas preguntas

Ahora que ha identificado las preguntas, el siguiente paso es comprender en qué punto se encuentra su organización para obtener esas respuestas. Para ello, puede ser útil mapear el ecosistema de datos actual. El mapeo del ecosistema de datos puede utilizarse para explorar nuevas fuentes de datos, explotar los flujos de datos existentes, identificar dónde se necesitan cambios e identificar otras partes interesadas que también están trabajando para resolver el mismo problema o uno similar.

Una forma de empezar es trazar un mapa de los actores de su ecosistema de datos y de cómo se intercambia valor en él. Por ejemplo, el valor puede venir en forma de datos, pero también puede ser el intercambio de opiniones o conocimientos.

Para realizar un ejercicio de mapeo del ecosistema de datos, visite el sitio web del Instituto de Datos Abiertos: Data Ecosystem Mapping: Herramienta y guía.

Determine el valor para los interesados

Proporcionar acceso a los datos puede ser una parte fundamental del ejercicio, pero no es el único elemento a tener en cuenta. También es importante considerar de forma más amplia cómo todas las partes interesadas de su ecosistema de datos obtendrán valor.

A nivel interno, los altos cargos tendrán que conseguir la aceptación de las partes interesadas y crear un impulso dentro de la organización para afrontar el reto. Las partes interesadas externas tendrán que entender la alineación con sus intereses y tener incentivos para participar. En otras palabras, necesitarán la respuesta a la pregunta "¿qué me aporta?".

Tener en cuenta los intereses de las partes interesadas ayudará, en última instancia, a generar confianza. Esto puede incluir la participación de las partes interesadas como parte del debate sobre los intercambios de valor, por ejemplo, asistiendo a una sesión de mapeo del ecosistema de datos en grupo.

Identificar qué conjuntos de datos ayudarán

Tratar de evaluar el panorama de los datos es una tarea desalentadora. Una vez que se han definido claramente las preguntas a las que se quiere dar respuesta, el paso de identificar los conjuntos de datos se convierte en una tarea más manejable. Evalúe los datos que tiene e identifique qué datos abiertos y compartidos son necesarios para ayudar a resolver el problema. Esto se puede lograr de la siguiente manera:

  • Utilizar una lista de control para identificar los datos que tiene y lo que puede hacer con ellos, por ejemplo:
    • ¿De qué se compone el conjunto de datos?
    • ¿Qué aspectos hay que proteger y cuál es la sensibilidad de los datos?
    • ¿De dónde proceden los datos? Comprender el pedigrí de los datos es un componente clave para fomentar un uso fiable de los mismos. El "pedigrí" se refiere a la calidad del conjunto de datos y se basa en varios factores, como la procedencia del conjunto de datos (incluyendo métricas de fiabilidad, confianza y riesgo estimados).
    • ¿Dónde se almacenan los datos?
    • ¿Para qué se utilizará?
    • ¿Existen restricciones de acceso o uso?
  • Identificar las lagunas en los datos e identificar los socios que pueden contribuir al proyecto o los recursos para obtener datos abiertos.
  • Aprovechar los conjuntos de datos disponibles de forma abierta, como los que se ponen a disposición bajo términos de datos abiertos en Azure Open Datasets, GitHub y Microsoft Research Open Data.
  • Prepare sus conjuntos de datos internos para compartirlos externamente. En el caso de los datos que pueden ponerse a disposición como abiertos, se recomienda utilizar el Acuerdo de Licencia de Datos Comunitarios - Permisivo, Versión 2. 0 (CDLA-Permisivo-2.0) u otra licencia de datos abiertos para compartir sus datos. Los términos ayudan a los usuarios a entender las condiciones y restricciones que rigen el uso de los datos. Adjuntar los términos adecuados identifica los datos como abiertos, crea claridad en torno a la reutilización y fomenta la innovación. Las organizaciones sin ánimo de lucro pueden acceder al Microsoft Nonprofit Innovation Hub, que incluye una plantilla legal ligera para establecer una colaboración de datos.
  • Asociarse con otras organizaciones o partes interesadas que tratan de resolver el mismo problema.

Perfil: El cuidado de la igualdad a través de la colaboración de datos

A principios de 2021, el Instituto de Datos Abiertos y Microsoft pusieron en marcha una Red de Aprendizaje entre Pares con el objetivo de ayudar a las organizaciones que colaboran en torno a los datos a abordar con mayor eficacia los retos a los que se enfrentan. Para ello, se exploraron cuestiones relacionadas con la confianza y la fiabilidad entre los participantes y otras partes interesadas.

En el primer taller, se presentó a los participantes la herramienta de mapeo del ecosistema de datos para explorar los flujos de datos y el valor en sus ecosistemas. Esto incluyó la superación de las barreras para compartir datos mediante el desarrollo de un mapa del ecosistema de confianza para entender dónde la confianza -o la falta de ella- impacta en el valor creado por los flujos de datos.

Uno de los proyectos de colaboración de la Red de Aprendizaje entre Pares, Caring for Equality, una colaboración del Gobierno de la Ciudad de Buenos Aires en Argentina, el Centro para el Desarrollo Global y la Carta de Datos Abiertos, tenía como objetivo abordar las brechas de desigualdad con respecto a las tareas relacionadas con el cuidado que limitan la autonomía económica de las mujeres. Utilizando datos de múltiples fuentes privadas y públicas, los equipos crearon un "Sistema de Indicadores de Cuidados" que abordara la situación en Buenos Aires y proporcionara información para mejorar la formulación de políticas y la rendición de cuentas a los ciudadanos de la ciudad.

La colaboración utilizó el ejercicio de mapeo del ecosistema de datos para identificar a los proveedores y fuentes de datos, cómo se podría acceder a los datos y aprovecharlos, y cómo considerar los desafíos de confianza para compartir datos con y dentro del gobierno. Este ejercicio condujo a importantes puntos de decisión para ayudar a dirigir la iniciativa hacia adelante con una comprensión común del valor del Sistema de Atención que se está construyendo.

Puede encontrar más información sobre Caring for Equality aquí.

Perfil: Cómo Londres utilizó los datos abiertos para conocer mejor la capacidad de carga de los coches eléctricos

Cuando Londres anunció su plan de convertirse en una ciudad con cero emisiones de carbono para 2030, era necesario considerar métodos de transporte más ecológicos en toda la ciudad y los suburbios circundantes. Dado que el cambio de vehículos de gasolina y diésel a vehículos eléctricos puede ayudar a reducir las emisiones de carbono, la ciudad necesitaba comprender mejor las oportunidades de crear una mejor infraestructura para la carga eléctrica. Para ello era necesario que los promotores y los operadores de puntos de recarga colaboraran en la creación de conjuntos de datos más completos para conocer la demanda de los propietarios de vehículos eléctricos.

Se creó un programa piloto de intercambio de datos para entender cómo podría mejorarse la infraestructura de recarga de vehículos eléctricos en Londres. El programa de intercambio de datos entre el sector público y el privado permitió determinar las posibles ubicaciones de las estaciones de recarga de vehículos eléctricos. El programa piloto de intercambio de datos demostró el potencial del intercambio de datos, la colaboración de datos y los datos abiertos para ayudar a desarrollar la infraestructura de recarga de vehículos eléctricos de Londres y, en última instancia, apoyar el objetivo de Londres de ser neutro en carbono para 2030.

Los conjuntos de datos, incluidos los datos sobre el comportamiento del tráfico, los datos sobre la capacidad de carga y los datos del registro de la propiedad, ayudaron a identificar más de 2.000 parcelas públicas en la ciudad que debían considerarse como ubicaciones candidatas para los puntos de carga de vehículos eléctricos.

La transparencia de los datos permite a la ciudad demostrar la base del análisis, contribuyendo así a generar confianza entre los escépticos y motivación entre los inversores en infraestructuras de recarga de VE. Los terceros pueden examinar el análisis para considerar si las conclusiones alcanzadas son fiables y precisas. En general, el uso de datos abiertos en el proyecto demostró que, a través de la puesta en común de datos, era posible superar las barreras de la infraestructura para un esfuerzo de tal envergadura.

Puede encontrar más información sobre el proyecto piloto de infraestructura de recarga de vehículos eléctricos aquí.

3. Talento El talento: ¿Tienes el talento necesario para el análisis de datos?

Contar con las habilidades necesarias para trabajar con datos es vital para cualquier organización

Al igual que el acceso a los datos es fundamental para que las organizaciones puedan resolver problemas e innovar, disponer de las habilidades necesarias para trabajar con esos datos es vital para cualquier organización. Sin embargo, según cifras de LinkedIn, alrededor de la mitad de las personas con conocimientos técnicos de IA trabajan en el sector tecnológico y suelen escasear en otras organizaciones y sectores.

Cuando se trata de poner los datos al servicio de su organización, es fundamental asegurarse de que ésta cuenta con el talento necesario para diseñar y ejecutar un plan que le permita obtener los conocimientos y las respuestas que desea obtener. Esto no significa que tenga que emplear equipos de informáticos. Por el contrario, una variedad de profesiones y conjuntos de habilidades trabajan con datos en diferentes formas, incluyendo analistas de datos, científicos de datos, ingenieros de software e investigadores. El talento que necesita estará impulsado por las habilidades de datos necesarias para su iniciativa.

Evaluación de las competencias en materia de datos

Una lista de preguntas que su organización puede utilizar para esa evaluación puede incluir:

  • ¿Qué competencias críticas en materia de datos se necesitan para abordar el reto identificado? Por ejemplo, las competencias técnicas podrían incluir la gestión de sistemas e infraestructuras para el procesamiento de datos, la implementación de canalizaciones de datos y análisis, y la visualización de datos o la elaboración de informes. Los conocimientos no técnicos necesarios podrían incluir la recopilación de requisitos consultivos, la gestión de las partes interesadas y la gestión de programas.
  • ¿Con qué competencias en materia de datos cuenta actualmente su organización?
  • ¿Dónde hay un déficit de competencias críticas?
  • ¿Puede asociarse con otra organización para llenar este vacío, o necesitará el talento dentro de su propia organización?
  • ¿Necesita contratar nuevos talentos? ¿Existe la posibilidad de mejorar las competencias del personal actual?
  • ¿Ofrece hoy en día programas de formación que ayuden a mejorar las competencias en materia de datos? ¿Qué programas de formación pueden ser necesarios?

En "The AI playbook", que puede descargarse aquí, se describen detalladamente las principales funciones técnicas y empresariales de un equipo interdisciplinar.

Para obtener recursos adicionales, consulte el marco de competencias en materia de datos del Instituto de Datos Abiertos.

Perfil: Las ventajas del crowdsourcing con datos abiertos

El crowdsourcing que utiliza datos abiertos ayuda a las organizaciones a resolver problemas difíciles porque puede dar lugar a soluciones inesperadas, a una resolución de problemas más rápida y a una reducción de la carga para el usuario. El crowdsourcing funciona utilizando agentes de recogida de datos voluntarios (o pagados) que pueden o no tener vínculos directos con la organización que realiza la investigación. Su ayuda, en última instancia, puede reducir los costes y el tiempo al aumentar las habilidades y los sistemas actuales. Los avances en la tecnología móvil han contribuido a impulsar la popularidad del crowdsourcing porque ahora hay más personas que tienen un mayor acceso a los datos y a una gran variedad de comunidades en todo el mundo.

Los beneficios del crowdsourcing incluyen:

  • Datos diversos. Dado que los colaboradores pueden reflejar una serie de usuarios de todo el mundo, es probable que sus aportaciones reflejen la diversidad necesaria para crear los resultados más fiables.
  • Reducción de costes. Con la externalización de la recogida de datos, las organizaciones pueden reducir costes y pueden necesitar menos recursos para obtener, limpiar y estructurar los conjuntos de datos dentro de la organización.
  • Mayor confianza. El propio nombre de "crowdsourcing" implica que los datos se obtienen fuera de cualquier organización y se recurre a una amplia gama de colaboradores. Por ello, el proceso puede ganar credibilidad. Esta mayor confianza puede generar una mayor participación del público para ayudar en la investigación.

Un buen ejemplo de crowdsourcing en el ámbito médico es Folding@homeuna organización y plataforma en línea que utiliza el crowdsourcing para acelerar las simulaciones, como las del coronavirus responsable de COVID-19, y desarrollar nuevas terapias.

A través de una asociación con Microsoft AI for Health, el Dr. Greg Bowman, biofísico molecular de la Facultad de Medicina de la Universidad de Washington en San Luis, solicitó a voluntarios de todo el mundo que utilizaran su potencia informática personal para ejecutar simulaciones de proteínas y enviar los datos generados a sus servidores. La pasión colectiva por resolver una pandemia mundial hizo que el número de dispositivos que ejecutaban Folding@home pasara de unos 10.000 a un millón en sólo dos meses. Bowman considera que el método de crowdsourcing de uso de datos abiertos es un modelo para combatir tanto las enfermedades actuales como las futuras.

"Podemos tomar un problema que habría tardado 500 años en completarse en un solo escritorio y resolverlo en cuestión de seis meses", dijo.

Más información sobre Folding@home y el Dr. Greg Bowman.

Puede encontrar más información sobre el programa y los proyectos de IA para la salud de Microsoft aquí.

4. Gobernanza comunitaria Gobernanza comunitaria: ¿Ha creado confianza en su comunidad en torno al uso de los datos?

Establecer marcos de buena gobernanza

El uso de los datos para abordar los problemas sociales suele conllevar importantes cuestiones de gobernanza y cumplimiento. También es importante situar estas cuestiones en el contexto de la comunidad de partes interesadas en los datos y su uso. El establecimiento de relaciones sólidas con esa comunidad ayudará a promover la buena gobernanza y a identificar usos nuevos y permitidos que pueden dar lugar a beneficios inesperados de una colaboración de datos o una iniciativa relacionada. Cuando la comunidad confía en estas oportunidades, pueden amplificar los beneficios de la iniciativa de datos para todas las organizaciones, individuos y comunidades implicadas o afectadas.

Los marcos de buen gobierno pueden ayudar a mitigar los riesgos. Estos riesgos pueden ser legales y reglamentarios, pero los riesgos para la confianza y la reputación del público también son de gran importancia para las organizaciones. Es necesario equilibrarlos con los riesgos de no proporcionar acceso a los datos para fines de interés público. El GovLab, y otros, enmarcan este proceso en la búsqueda de formas de evitar tanto el mal uso, como los usos no autorizados que perjudican a los sujetos de los datos, como los usos perdidos, incluidas las oportunidades fallidas de haber mejorado la vida de las personas mediante la reutilización de los datos. A continuación se presentan ejemplos de consideraciones de gobernanza que, cuando se deliberan y aplican en las primeras etapas, pueden utilizarse para lograr tanto la mitigación de riesgos como la mejora de las oportunidades de uso de los datos.

Gobernanza que genera transparencia y cumplimiento

¿Qué pasaría si pudiéramos permitir el uso de datos que todo el mundo pueda entender? Esto podría incluir el desarrollo de una iniciativa con cualquiera de las siguientes consideraciones incorporadas desde el principio:

  • Transparencia en la gobernanza de la iniciativa y en los consejos de administración
  • Transparencia en el propósito de la iniciativa
  • Transparencia en los datos recogidos, accedidos o creados
  • Transparencia en el uso de los datos conforme a las leyes y reglamentos
  • Identificación de un administrador de datos
  • Almacenar y compartir datos de forma segura
  • Proporcionar acceso o compartir datos de manera que se preserve la privacidad y la información comercialmente sensible
  • Proporcionar información a un amplio abanico de partes interesadas en las que se comparten los beneficios
  • Utilizar enfoques que den a los individuos y a las organizaciones la posibilidad de opinar sobre los aspectos de la recopilación, el uso, el almacenamiento y el intercambio de datos.

Gobernanza que crea apoyo comunitario

¿Y si pudiéramos recoger datos que ayudaran a las comunidades locales a resolver problemas locales? ¿Y si utilizáramos los datos para abordar los obstáculos a la inclusión? Las respuestas a estas preguntas ayudarán a mostrar al público que aprovechar los datos de forma nueva y responsable es de su interés y puede tener efectos positivos a largo plazo.

Gobernanza que permite el uso abierto

¿Qué mecanismos existen para garantizar que los datos puedan ser compartidos y utilizados? Las consideraciones pueden incluir:

  • Cómo hacer que los datos sean "lo más abiertos posible" para ayudar a la innovación y al uso y combinación de los datos de formas nuevas e interesantes. ¿Pueden abrirse los datos o compartirse de forma fiable, por ejemplo, mediante la anonimización?
  • ¿Cómo pueden hacerse interoperables los datos utilizando modelos de datos comunes, normas o identificadores estables? Por ejemplo, los Principios FAIR proporcionan orientación para mejorar la capacidad de búsqueda, accesibilidad, interoperabilidad y reutilización de los datos de investigación.

Trazar estos objetivos puede ser muy útil para desarrollar un marco de gobernanza para un ecosistema de datos justo, abierto y digno de confianza. Una herramienta útil para desarrollar y evaluar cómo se utilizan los datos es el Lienzo de Ética de los Datos del Instituto de Datos Abiertos.

A lo largo del ciclo de vida de la iniciativa, el marco de gobernanza debe ser revisado para crear un bucle de retroalimentación que garantice la reevaluación constante de los objetivos, especialmente si éstos cambian. Puede decidir que las decisiones de gobernanza se delegan mejor en un grupo de partes interesadas o en un organismo independiente, por ejemplo, en un consejo de gobernanza o en un administrador de datos independiente. Cuando se delegan las decisiones, puede ser especialmente importante disponer de directrices o de un enfoque de principios acordado que permita que esas decisiones se desarrollen de una manera que se ajuste al espíritu de la iniciativa.

Además, la cocreación de los principios y condiciones bajo los cuales se accede y se reutilizan los datos mediante deliberaciones directas, como el modelo presentado por The GovLab's The Data Assembly, puede proporcionar una licencia social adicional para la colaboración de datos.

Un enfoque basado en principios

Un enfoque de principios para la gobernanza le ayudará a desarrollar un marco de gobernanza que vaya más allá de las consideraciones legales y de cumplimiento. Esto puede ser útil cuando varias organizaciones participan en una iniciativa de innovación de datos. Si se acuerdan inicialmente los principios por los que se quiere recoger, almacenar, utilizar y compartir los datos, el grupo estará capacitado para tomar decisiones en el futuro. En algunos casos, los principios pueden consagrarse en una carta de datos.

Como punto de partida para evaluar sus políticas y principios para compartir datos, Microsoft publicó cinco principios que informan nuestras contribuciones y compromisos con la colaboración de datos confiables. Esperamos que estos principios informen la conversación más amplia sobre los datos abiertos y que otros puedan basarse en ellos y mejorarlos. Los cinco principios son:

  • Abiertos - Trabajaremos para que los datos relevantes para los problemas sociales importantes sean lo más abiertos posible, incluso aportando nosotros mismos datos abiertos
  • Utilizables - Invertiremos en la creación de nuevas tecnologías y herramientas, mecanismos de gobernanza y políticas para que los datos sean más utilizables para todos
  • Empoderamiento: ayudaremos a las organizaciones a generar valor a partir de sus datos de acuerdo con sus elecciones, y desarrollaremos su talento en IA para que utilice los datos de forma eficaz e independiente.
  • Seguridad - Emplearemos controles de seguridad para garantizar que la colaboración de datos sea operativamente segura donde se desee
  • Privado - Ayudaremos a las organizaciones a proteger la privacidad de los individuos en las colaboraciones de intercambio de datos que implican información personal identificable

Perfil: La asociación público-privada de datos en marcha en Londres

Un ejemplo de gobernanza comunitaria es la Carta de Datos publicada en 2021, siguiendo las recomendaciones de la Comisión de Datos de Londres.

Desbloquear las soluciones basadas en datos es fundamental para resolver los problemas que afectan al crecimiento futuro de la ciudad. Sin la sinergia entre las autoridades locales y los intereses privados, sería imposible encontrar soluciones a problemas acuciantes como la mejora de la calidad del aire, la reducción de los tiempos de desplazamiento, la mejora del tránsito y la reducción de la congestión. A finales de 2019, el grupo empresarial London First convocó a un grupo de organizaciones públicas y privadas como miembros de la Comisión de Datos de Londres. La Comisión de Datos, dirigida por un equipo de proyecto de socios de entrega, incluyendo London First, Arup, Oliver Wyman Forum y Microsoft, reunió a las autoridades locales y a las empresas privadas en torno a compartir datos de la manera más abierta posible. La Comisión de Datos se encargó de ser la voz empresarial autorizada sobre los datos de la ciudad y de ayudar a poner en marcha un ecosistema de intercambio de datos mediante la creación de normas de calidad de datos y el tratamiento de cuestiones como la privacidad, la ética y la confianza. En septiembre de 2020, la Comisión de Datos de Londres elaboró propuestas para un marco de Datos para Londres. Este marco recomendaba la creación de un Consejo de Datos de Londres y una Carta de Datos de Londres.

Siguiendo las recomendaciones de la Comisión de Datos de Londres, London First creó un grupo de trabajo para poner en práctica estas recomendaciones y seguir trabajando con el Director de Asuntos Digitales de Londres para crear el Consejo de Datos de Londres y desarrollar la Carta de Datos de Londres.

La Carta de Datos de Londres se basa en un marco de siete principios: Ofrecer beneficios a los londinenses; Impulsar la innovación inclusiva; Proteger la privacidad y la seguridad; Promover la confianza; Compartir lo aprendido con otros; Crear soluciones escalables y sostenibles; y Ser lo más abierto posible. Un amplio abanico de empresas se ha comprometido con el marco, y la carta está estudiando ahora los hitos para Londres en la forma de trabajar con la comunidad empresarial de la ciudad para colaborar en la obtención de datos en beneficio de los proyectos públicos.

Obtenga más información sobre la Comisión de Datos de Londres aquí, y sobre la Carta de Datos de Londres aquí.

5. Tecnología y datos Tecnología y datos: ¿Qué soluciones y recursos necesita para medir, habilitar y mejorar su impacto?

Factores para determinar la infraestructura técnica adecuada

Para los datos abiertos es fundamental la infraestructura técnica necesaria para trabajar con esos datos y apoyar su intercambio. Esto incluye herramientas de análisis y visualización de datos, así como tecnologías y plataformas para acceder y compartir datos dentro y entre organizaciones de forma fácil y segura.

Para determinar las necesidades tecnológicas y de plataforma de su iniciativa de datos, hay que tener en cuenta algunos factores importantes:

  • ¿Los datos son sensibles?
  • ¿Qué hay que proteger, y con qué nivel legal o contractual?
  • ¿Qué debe proteger, teniendo en cuenta consideraciones éticas, de reputación y comerciales?
  • ¿Con qué finalidad se facilitan los datos?
  • ¿A quién se facilitan los datos?
  • ¿Qué nivel de utilidad se requiere para trabajar con los datos?
  • ¿Puede alcanzarse el nivel de utilidad necesario aplicando tecnologías que mejoren la privacidad?
  • ¿Qué plataformas existen para facilitar el intercambio y el acceso a los datos, de acuerdo con las normas requeridas?
  • En el caso de los datos sensibles, ¿qué marcos de gobernanza existen para controlar el acceso y el intercambio?

El Viaje a la Responsabilidad de los Datos del GovLab es una herramienta de evaluación que pretende permitir una revisión de estas cuestiones de forma interactiva.

Cada uno de estos factores puede apuntar a una serie de necesidades tecnológicas. Por ejemplo, las herramientas de análisis de datos pueden ayudar a seguir las tendencias, identificar problemas y eficiencias, así como hacer predicciones. Las herramientas de visualización de datos permiten visualizar los datos con los que se trabaja y manipularlos visualmente.

En los casos en los que es necesario proteger la privacidad, hay que considerar una serie de técnicas de preservación de la privacidad, como la anonimización y la desidentificación. La privacidad diferencial es una técnica impulsada por la industria para permitir que los datos sean más abiertos de una manera que no ponga en riesgo la protección de los mismos. Conceptualmente, la privacidad diferencial utiliza dos pasos para lograr beneficios de privacidad:

  • En primer lugar, se añade ruido a cada resultado para enmascarar la contribución de los puntos de datos individuales. El ruido es lo suficientemente significativo como para proteger la privacidad de un individuo, pero con el objetivo de no afectar materialmente a la precisión de las respuestas extraídas por los analistas e investigadores.
  • En segundo lugar, se calcula la cantidad de información revelada por cada consulta y se deduce de un presupuesto global de pérdida de privacidad. Una vez que el presupuesto de privacidad se ha utilizado por completo, los datos se retiran y no se permiten más consultas para evitar que la privacidad personal se vea comprometida. Esto puede considerarse como un interruptor de apagado incorporado que impide que el sistema muestre datos cuando puede empezar a comprometer la privacidad de alguien.

Cuando se trata de seguridad, es importante tener en cuenta la política o el estado del ciclo de vida de los datos que se pretende aplicar, así como los mecanismos adecuados para alcanzar los objetivos de seguridad de su organización. Controlar el acceso a los datos y garantizar que las personas a las que se les concede el acceso están autorizadas y debidamente autentificadas es fundamental, pero pueden ser necesarias medidas técnicas adicionales en función de los datos y de cómo se vayan a utilizar. La computación confidencial ayuda a proteger los datos sensibles en la nube ofreciendo seguridad a través del cifrado de datos en uso que proporciona protección adicional para sus datos mientras se procesan y permite una mayor colaboración entre organizaciones.

Perfil: Cómo las tecnologías de mejora de la privacidad ayudaron a evaluar el impacto del aprendizaje a distancia en la educación de los jóvenes estudiantes

A los ocho meses de la pandemia de COVID-19, el Open Data Institute y Microsoft iniciaron un Desafío de Datos Abiertos en Educación para analizar el impacto de la transición a la enseñanza a distancia en la educación de los jóvenes estudiantes.

Para dar a los participantes en el reto acceso a conjuntos de datos nuevos y relevantes, Microsoft publicó conjuntos de datos de porcentaje de uso de banda ancha en Estados Unidos, tanto a nivel de condado como de código postal, derivados de datos anónimos que recopilamos como parte de nuestro trabajo continuo para mejorar el rendimiento y la seguridad de nuestro software y servicios. El conjunto de datos a nivel de código postal proporciona una visión granular de los porcentajes de uso de la banda ancha por parte de los hogares dentro de un código postal, por lo que dimos un paso adicional para asegurar las garantías de privacidad de los datos. Aplicamos la privacidad diferencial, añadiendo ruido a las agregaciones de datos. BroadbandNow también participó, poniendo a disposición por primera vez sus datos de precios y proveedores de banda ancha a nivel de condado.

El Desafío de Datos Abiertos sobre la Educación ha dado lugar a interesantes presentaciones y análisis con combinaciones y visualizaciones de datos. El desafío también sirvió para poner de relieve cómo se pueden poner a disposición más datos abiertos, protegiendo al mismo tiempo la privacidad.

 

Más información sobre el Reto de Datos Abiertos en Educación.

 

Recursos Liderazgo

Academia de Responsables de Datos

Para los líderes que buscan utilizar los datos para la innovación social, la Academia de Administradores de Datos del Laboratorio de Políticas de Datos Abiertos : Developing a Data Reuse Strategy for Solving Public Problems ofrece un programa de aprendizaje autodirigido.

Evaluación de la madurez de los datos

Las organizaciones del sector social pueden utilizar la herramienta de evaluación de la madurez de los datos de data.org para ayudar a medir y comprender la situación actual de su organización.

Oportunidad

Mapa del ecosistema de datos

Para realizar un ejercicio de mapeo del ecosistema de datos, visite el sitio web del Instituto de Datos Abiertos: Data Ecosystem Mapping: Herramienta y guía.

Libro de jugadas sobre el panorama de los datos

Para más información sobre la evaluación del panorama de los datos y el contexto en el que opera su iniciativa de datos, incluida la identificación del problema que su iniciativa trata de abordar, visite el Libro de Juego del Paisaje de los Datos del Instituto de Datos Abiertos.

Talento

Programas de formación

Cuando se trata de programas de formación para mejorar el talento actual o perfeccionar las habilidades del talento existente, hay una variedad de recursos a los que recurrir:

  • Cursos de LinkedIn Learning y Microsoft Learn para analistas de datos. Los cursos a ritmo propio de LinkedIn Learning son impartidos por expertos del sector, y los cursos de Microsoft Learn ofrecen breves tutoriales paso a paso, entornos de codificación y scripting interactivos basados en el navegador y logros basados en tareas.
  • Certificaciones de Microsoft sobre datos y fundamentos de la IA. Las certificaciones de Microsoft, reconocidas por el sector, ayudan a los talentos a validar sus habilidades y su capacidad para desempeñar un papel con las tecnologías de Microsoft.
  • Centro de habilidades digitales de Microsoft para organizaciones sin ánimo de lucro. Una colaboración entre TechSoup Courses y Microsoft, específicamente para las organizaciones sin ánimo de lucro, para acceder a la formación de productos de Microsoft, incluyendo cursos centrados en Excel, Power BI, y más.
  • Talleres y sesiones de formación de Microsoft disponibles a través de Microsoft Store. Estos cursos de formación gratuitos y en directo para empresas y profesionales incluyen sesiones de introducción y de profundización.
  • Microsoft VivaLearning. La formación a petición está disponible como parte de Microsoft Viva Learning en Microsoft Teams.
  • Iniciativa MySkills4Afrika. A través de MySkills4Afrika, los empleados de Microsoft de todo el mundo ofrecen voluntariamente su tiempo, talento y experiencia para ayudar a personas y organizaciones de toda África.

Marco de competencias en materia de datos

Para obtener recursos adicionales, consulte el marco de competencias en materia de datos del Instituto de Datos Abiertos.

Gobernanza

Lienzo de ética de datos

El Lienzo de Ética de los Datos del Instituto de Datos Abiertos es una herramienta útil para desarrollar y evaluar el uso de los datos.

El conjunto de datos

La Asamblea de Datos del GovLab ofrece un modelo para la cocreación de los principios y las condiciones de acceso y reutilización de los datos mediante deliberaciones directas.

Carta de Datos de Londres

La Carta de Datos de Londres, publicada a finales de 2021, es un ejemplo de gobernanza comunitaria en acción.

Tecnología y datos

Viaje a la responsabilidad de los datos

A la hora de evaluar las necesidades tecnológicas y de recursos de una organización para una colaboración o iniciativa de datos, el Data Responsibility Journey de The GovLab es una herramienta que describe las oportunidades y los riesgos que hay que tener en cuenta en cada etapa del ciclo de vida de los datos.

SmartNoise

En colaboración con la iniciativa OpenDP, liderada por Harvard, Microsoft ha lanzado SmartNoise, la primera plataforma de código abierto para la privacidad diferencial. Cualquiera puede empezar a utilizar la plataforma para poner sus conjuntos de datos a disposición de todo el mundo. El código fuente abierto y los ejemplos están disponibles en GitHub.

Informática confidencial

La computaciónconfidencial ayuda a proteger los datos sensibles en la nube ofreciendo seguridad a través de la encriptación de datos en uso que proporciona protección adicional para sus datos mientras se procesan. Puede encontrar una útil introducción a la computación confidencial aquí, junto con proyectos de ejemplo aquí.

Azure Data Share

Microsoft cuenta con varias tecnologías que apoyan más datos abiertos a través de una variedad de casos de uso, como Azure Data Share, que permite a las organizaciones compartir datos de forma sencilla y segura con múltiples clientes y socios y proporciona la capacidad de las organizaciones para combinar los datos internos con los datos de los socios para obtener nuevos conocimientos.

GitHub

GitHub es la mayor plataforma de desarrollo de software y alojamiento de código del mundo. GitHub se utiliza con frecuencia para proyectos de datos, en particular para conjuntos de datos más pequeños, datos versionados de forma colaborativa, datos co-ubicados con código y flujos de trabajo de aprendizaje automático. GitHub admite la representación de datos y cuadernos en varios formatos.