Por: Jennifer Yokoyama, consejera en jefe de propiedad intelectual.
Microsoft lanza una Campaña Open Data para ayudar a hacer frente a la “división de datos” que se avecina y ayudar a las organizaciones de todos tamaños a aprovechar los beneficios de los datos y las nuevas tecnologías que estos impulsan. Creemos que todos se pueden beneficiar de abrir, compartir y colaborar alrededor de los datos para tomar mejores decisiones, mejorar la eficiencia e incluso ayudar a abordar algunos de los desafíos sociales más apremiantes del mundo.
La meta de nuestra campaña es hacer avanzar una muy necesaria discusión sobre cómo el mundo usa y comparte datos. Para comenzar, anunciamos tres pasos:
- Primero, publicaremos nuevos principios que guiarán la manera en que Microsoft se plantea compartir nuestros datos con otros.
- Segundo, nos comprometemos a tomar acciones para desarrollar 20 nuevas colaboraciones para 2022, basadas alrededor de los datos compartidos. Esto incluye una labor con organizaciones líderes en el movimiento de datos abiertos como Open Data Institute y The Governance Lab (GovLab) en la Escuela Tandon de Ingeniería de la Universidad de Nueva York. Y buscaremos liderar con el ejemplo al hacer nuestras iniciativas de impacto social de Microsoft “abiertas por defecto”, comenzaremos con compartir datos sobre acceso de banda ancha de nuestra iniciativa Airband y los combinaremos con datos de otros para ayudar a acelerar las mejoras en la conectividad a banda ancha.
- Por último, invertiremos en los recursos esenciales que harán más fácil compartir datos, incluidas las herramientas, marcos y plantillas requeridas.
En los meses recientes, hemos visto de nuevo los beneficios que puede traer una mejor capacidad de compartir datos, no sólo para las compañías y otras organizaciones, sino también en abordar los desafíos más grandes del mundo. Desde el cambio climático a la pandemia de COVID-19, está claro que los datos juegan un rol crítico en ayudarnos a entender estos desafíos y a la manera de abordarlos. Para aprovechar al máximo los beneficios de los datos, necesitamos desarrollar la capacidad de compartirlos a través de las fronteras organizacionales de una manera segura y confiable, y permitir que puedan ser utilizados de manera efectiva. Si hubo un momento de acelerar los esfuerzos mundiales alrededor de los datos abiertos, se trata de este. Esperamos que nuestros pasos actuales contribuyan a esos esfuerzos. Estamos comprometidos con la causa, y en aprender de y trabajar con otros.
¿Qué queremos decir con la “división de datos” y por qué ahora?
A pesar del enorme crecimiento en datos e IA, ambos están cada vez más concentrados en las manos de un pequeño número de empresas. De hecho, menos de 100 compañías recolectan ahora más del 50% de esos datos generados por interacciones en línea (con base en el análisis de similarweb.com, appfigures.com y alexa.com) y alrededor de la mitad de todas las personas con habilidades técnicas en IA trabaja en el sector tecnológico (de acuerdo con cifras de LinkedIn). No es de sorprender que estos negocios sean entonces capaces de cosechar los enormes beneficios de los datos y la IA, mientras que otros se quedan en desventaja. Esta división de los datos presenta un serio desafío para la sociedad y, si no se atiende, podría llevar a un enorme poder económico que fluye sólo hacia algunos países y compañías. Con base en las tendencias actuales, por ejemplo, PWC predice que alrededor del 70% del valor económico generado por la IA se acumulará en sólo dos países: Estados Unidos y China. Pero no creemos que una división de datos cada vez mayor sea inevitable. Al hacer más para abrir y compartir datos, las organizaciones pueden desbloquear valor, compartir experiencia y hacer más útiles los datos para todos, para permitir que todos se beneficien en maneras que no pueden hacerlo por hacerlo por su cuenta. Si actuamos ahora y nos unimos, más organizaciones de la sociedad civil, gobiernos y negocios de todos tamaños podrán aprovechar todo el valor de los datos.
Trazar una ruta de principios
Para ayudar a guiar nuestros propios esfuerzos en datos abiertos, adoptamos un conjunto de principios que informen como en Microsoft abrimos y compartimos datos de manera responsable. Hemos aprendido a través de nuestra labor para proteger la privacidad, una IA responsable y la sustentabilidad que es valiosa para definir un claro conjunto de principios cuando nos adentramos en complejos e importantes problemas sociales. Esperamos que estos principios informen la amplia conversación alrededor de los datos abiertos y que otros puedan construir sobre ellos y mejorarlos. Los cinco principios que guiarán nuestras contribuciones a una colaboración de datos confiable son:
- Abiertos – Vamos a trabajar para hacer de los datos que son relevantes para importantes problemas sociales, tan abiertos como sea posible, incluso al contribuir nosotros mismos con los datos abiertos
- Utilizables – Vamos a invertir en crear nuevas tecnologías y herramientas, mecanismos de gobernanza y políticas para que los datos sean más utilizables para todos
- Impulsores – Ayudaremos a las organizaciones a generar valor a partir de sus datos de acuerdo con sus elecciones, y desarrollar el talento en IA para utilizarlos de manera efectiva e independiente
- Seguros – Vamos a emplear controles de seguridad para garantizar que la colaboración en datos, donde se desee, sea segura a nivel operacional
- Privados – Vamos a ayudar a las organizaciones a proteger la privacidad de los individuos en colaboraciones donde se compartan datos y que involucren información de identificación personal
Cada uno de esos principios es importante. Sin embargo, como ha quedado claro para nosotros en nuestra labor en esta área, uno se destaca como la clave más desafiante pero vital para tener éxito: la necesidad de hacer que los datos sean más utilizables. A menos que las organizaciones puedan recolectar y categorizar datos de una manera estandarizada, no podrán agregarlos ni analizarlos en una manera que produzca la información de valor transformadora que los datos compartidos tienen el potencial de desbloquear.
Comprometerse a nuevas colaboraciones
Además de trazar una ruta de principios, creemos que el éxito dependerá en construir colaboraciones profundas con otros miembros de la industria, gobierno y sociedad civil alrededor del mundo. Queremos tratar y liderar con el ejemplo y hacer más para aprender de primera manos sobre los desafíos y soluciones alrededor de los datos abiertos. Para este fin, Microsoft se compromete a lanzar 20 colaboraciones de datos para 2022, para construir asociaciones para hacer frente a los principales desafíos de nuestro tiempo. Para ayudar a sembrar esas colaboraciones, Microsoft hará sus iniciativas de impacto social “abiertas por defecto” y explorará si nuestros datos relacionados con iniciativas como Airband, AI for Good y nuestra labor en sustentabilidad y accesibilidad podrían abrirse y construirse para ayudar a resolver desafíos importantes. Estamos emocionados por asociarnos con Open Data Institute en este esfuerzo, trabajar en conjunto para desarrollar nuestras colaboraciones iniciales y compartir las lecciones que aprendamos con los demás, para que ellos también se puedan beneficiar. Nuestra labor inicial se enfocará en:
- Abordar los desafíos de conectividad: Microsoft ha publicado en GitHub, bajo el acuerdo de apertura, un pequeño pero importante conjunto de datos alrededor del uso de banda ancha en los Estados Unidos, reunido como parte de nuestra Iniciativa Airband. Vamos a trabajar con Open Data Institute y BroadbandNow, una compañía que ayuda a los consumidores a encontrar acceso de banda ancha en los Estados Unidos, para sumar a este conjunto de datos y que ayude a mejorar la disponibilidad de la banda ancha. El conjunto de datos BroadbandNow brinda datos de precio y competencia a nivel de condados.
- Hacer frente a COVID-19: Ya que es uno de los desafíos actuales más apremiantes, vamos a contribuir con el trabajo realizado para utilizar datos que permitan hacer frente a la crisis de COVID-19. Esto incluye expandir el trabajo que realiza Microsoft con su socio Adaptive Biotechnologies para decodificar cómo el sistema inmune responde a COVID-19 y compartir los descubrimientos de la investigación a través de un portal de acceso a datos abiertos para que cualquier investigador los use en la lucha contra la pandemia. De manera más amplia, Microsoft también ha construido un rastreador de COVID-19 en nuestro motor de búsqueda Bing, y ha lanzado datos agregados a aquellos en academia e investigación. También trabajamos con GitHub, que realiza diferentes proyectos colaborativos alrededor de COVID-19, incluidos software de código abierto, diseños de hardware, modelos y muchos conjuntos de datos líderes en COVID-19.
- Ayudar a las ciudades a colaborar alrededor de los datos: Microsoft se asociará con Arup y Oliver Wyman Forum sobre la London Data Comission, una iniciativa de datos abiertos organizada por London First, que trabaja con Greater London Authority y otros, para liderar un proyecto de colaboración de datos alrededor de datos basados en la ciudad, que puedan ayudar a hacer frente a los desafíos sociales y económicos en Londres.
- Ayudar a los gobiernos a colaborar alrededor de los datos: Para ayudar a los gobiernos a abrirse y colaborar mejor alrededor de los datos, vamos a lanzar, en conjunto con The GovLab en NYU, Open Data Policy Lab. Lab brindará un repositorio vivo de mejores prácticas y recursos con un foco en: 1) análisis, en la forma de investigación comparativa de iniciativas de datos que contribuyan al desarrollo económico; 2) orientación, para incluir kits de herramientas, marcos de trabajo y mejores prácticas para apoyar la capacidad de compartir datos y la toma de decisiones impulsada por datos; 3) comunidad, de administradores de datos y otras personas interesadas en ellos dentro de los sectores público y privado; y 4) acción, para implementar iniciativas de prueba de concepto.
- Avanzar la atención médica impulsada por datos: Esta labor habilitará la primer colaboración global de datos para mejorar la salud cardiovascular, a través de reunir datos de diferentes fuentes para ayudar a hacer frente a una de las principales causas de muerte en el mundo. Microsoft trabaja con Novartis Foundation, Apollo Hospitals en India y Coala Life en Suecia para consolidar sus respectivos conjuntos de datos cardiovasculares de hospitales y centros primarios de atención alrededor del mundo. La colaboración busca desarrollar aún más y utilizar la herramienta líder de IA cardiovascular – AICVD Risk Score, creada por Apollo Hospitals – para acelerar el uso decisiones impulsadas por datos para hacer frente a las enfermedades cardiovasculares e informar la dirección de la política de salud.
Hacer que sea más fácil y seguro compartir datos
Si los datos son abiertos y están disponibles pero no son utilizables, no sirven a ningún propósito. Por lo tanto, nos comprometemos en ayudar a hacer frente a los problemas creados por la falta de herramientas y marcos de trabajo fáciles de utilizar para compartir datos a fin de garantizar que podemos ayudar a hacerlos más utilizables. Un importante desafío que hemos visto en nuestra labor del intercambio de datos y el análisis que hemos hecho para ayudar a combatir la crisis de COVID-19 es la dificultad alrededor de la recopilación de datos inconsistente. En la actualidad, los datos son recopilados en una variedad de formatos y tipos de documentos diferentes – algunos en documentos de Word, algunos en PDF, algunos en hojas de cálculo, algunos todavía en papel. Esto hace casi imposible compartir y agregar datos en una manera que sea valiosa y brinda una barrera enorme para la colaboración. La campaña trabajará para hacer frente a este desafío y también para continuar nuestra labor de desarrollar herramientas escalables que cualquier organización pueda utilizar, a través de reducir la fricción en torno al intercambio.
En esta labor, hay valiosas lecciones que puede tomar el mundo del software de código abierto. Aunque hay importantes diferencias entre los datos y el código, en particular alrededor de los pasos necesarios para hacer frente a las consideraciones de privacidad y seguridad cuando se manejan datos, nuestra experiencia con código abierto nos otorga información de valor para permitir una colaboración exitosa. Una prioridad será continuar nuestra labor en acuerdos de uso de datos abiertos, para brindar plantillas que cualquiera pueda utilizar para compartir datos de manera sencilla y continuar la construcción sobre herramientas de gobernanza, licenciamiento y legales brindadas por el micrositio Open Data Campaign. También vamos a continuar con el avance en nuestra labor de privacidad diferencial con IQSS de Harvard, para brindar herramientas que permitan a las personas extraer información de valor útil a partir de conjuntos de datos en una manera que salvaguarde la privacidad de los individuos.
Cerrar la división de los datos es un gran desafío. Pero los beneficios para las organizaciones de todos tamaños, y para toda la comunidad son significativos si podemos trabajar juntos para conseguir progresos en los datos abiertos. Estamos comprometidos en brindar nuestra aportación, y esperamos trabajar con, y aprender de los demás, para que todos puedan aprovechar los beneficios de los datos.