La prueba de concepto de Project Silica almacena la película ‘Superman’ de Warner Bros. en un vidrio de cuarzo.
Microsoft y Warner Bros. han colaborado para recuperar y almacenar con éxito la icónica película “Superman” de 1978 en un trozo de vidrio apenas del tamaño de un portavaso, de 75 por 75 por 2 milímetros de grosor.
Se trató de la primera prueba de concepto para Project Silica, una iniciativa de Microsoft Research que utiliza descubrimientos recientes en ópticos láser ultra rápidos e inteligencia artificial para almacenar datos en vidrio de cuarzo. ¿Cómo funciona? Un láser codifica datos en vidrio al crear capas de rejillas y deformaciones tridimensionales a nano escala, en varios ángulos y profundidades. Los algoritmos de aprendizaje automático vuelven a leer los datos al decodificar imágenes y patrones que son creados a medida que la luz polarizada brilla a través del vidrio.
El fuerte vidrio de silicio puede soportar ser hervido en agua caliente, horneado en un horno, con microondas, inundado, fregado, desmagnetizado y otras amenazas ambientales que pueden destruir archivos históricos o tesoros culturales invaluables si las cosas salen mal.
El proyecto implica una inversión por parte de Microsoft Azure para desarrollar tecnologías de almacenamiento construidas en específico para patrones de cómputo en la nube, en lugar de confiar en medios de almacenamiento diseñados para trabajar en computadoras u otros escenarios. Es solo una de las muchas maneras en las que Azure se apoya en la experiencia de Microsoft Research para resolver desafíos a corto y largo plazo – desde las pruebas de centros de datos bajo el agua de Project Natick, al poder de procesamiento FPGA de Project Brainwave, a la emergente investigación de Optics for the Cloud.
“Almacenar toda la película ‘Superman’ en vidrio y poder leerla con éxito es un gran logro,” comentó Mark Russinovich, jefe de tecnología de Azure. “No digo que todas las preguntas hayan sido respondidas, pero parece que ahora estamos en una fase donde trabajamos en el refinamiento y la experimentación, en lugar de preguntar ¿Podemos hacerlo?”
Warner Bros., que se acercó a Microsoft después de conocer la investigación, siempre está en la búsqueda de nuevas tecnologías para salvaguardar su vasta librería de recursos: tesoros históricos como “Casablanca”, programas de radio de la década de los cuarenta, cortos animados, películas teatrales filmadas de manera digital, comedias de televisión, diarios de platós. Por años, han buscado una tecnología de almacenamiento que pueda durar cientos de años, que soporte inundaciones o erupciones solares y que no requiera ser mantenida a una cierta temperatura o que necesite una renovación constante.
“Ese siempre ha sido nuestro faro de esperanza para lo que creíamos que sería posible un día, así que cuando supimos que Microsoft había desarrollado esta tecnología basada en vidrio, queríamos probarla,” comentó Vicky Colf, jefa de tecnología en Warner Bros.
Disminuir los costos de almacenamiento a largo plazo
La mayoría de las personas piensan en “la nube” como una manera de almacenar todo: desde miles de fotos familiares a millones de emails sin utilizar espacio en su teléfono o computadora. Pero toda esa información es almacenada de manera física en hardware en una ubicación remota, lo que les permite acceder a ella desde múltiples dispositivos.
La cantidad de datos que la humanidad ahora busca almacenar –desde registros médicos a divertidos videos de gatos o imágenes tomadas por una nave espacial– ha comenzado a explotar al mismo tiempo que la capacidad de las tecnologías existentes de almacenamiento se reduce.
Los costos de almacenamiento a largo plazo aumentan debido a la necesidad de transferir datos de manera repetida hacia nuevos medios antes de que se pierda la información. Las unidades de disco duro se pueden desgastar después de tres a cinco años; la cinta magnética sólo puede durar de cinco a siete. Los formatos de archivo se vuelven obsoletos, y las actualizaciones son caras. Warner Bros., por ejemplo, en sus propios archivos digitales migra de manera proactiva contenido cada tres años para adelantarse a posibles problemas de degradación.
El almacenamiento en vidrio tiene el potencial de convertirse en una opción de bajo costo debido a que solo escribes los datos en el vidrio una vez. Los láseres de femtosegundos –que emiten pulsos ópticos ultra-cortos y que se usan por lo general en cirugías LASIK– cambian de manera permanente la estructura del vidrio, para que los datos puedan ser preservados por siglos. El vidrio de cuarzo tampoco necesita aire acondicionado de alto consumo de energía para mantener el material a una temperatura constante o de sistemas que remuevan la humedad del aire – los cuales podrían disminuir la huella ambiental del almacenamiento de datos de gran escala.
“No tratamos de construir cosas que pones en tu casa o de las que reproduces películas. Construimos almacenamiento que opera a escala de nube,” comentó Ant Rowstron, director asociado adjunto de laboratorio de Microsoft Research Cambridge en Reino Unido, que colaboró con la Universidad de Southampton para desarrollar Project Silica.
“Algo que buscábamos eliminar es el caro ciclo de mover y rescribir datos para la siguiente generación. Lo que queremos es algo que puedan poner en el estante por 50, 100 o mil años y olvidarse de eso hasta que lo necesiten,” comentó Rowstron.
Project Silica busca almacenar lo que es conocido como datos “fríos” – datos de archivo que podrían tener un valor tremendo o que las compañías deben mantener –pero a los que no se necesita acceder de manera frecuente. Esto podría incluir datos médicos que necesitan mantenerse durante toda la vida de un paciente, datos de regulación financiera, contratos legales, información geológica relacionada con la exploración energética y planes de construcción que las ciudades deben mantener.
Warner Bros. tenía un particular interés en ayudar a Microsoft a probar soluciones que pudieran aliviar los costos e ineficiencias asociados con almacenar datos sobre esos horizontes de tiempo prolongado, comentó Colf. “Con la librería de contenido más grande en la industria de medios y entretenimiento en muchos aspectos, nuestros desafíos son únicos en su escala, pero es cierto que no son únicos en términos del problema que tratamos de resolver,” mencionó.
Convertir los datos digitales en artefactos físicos
Con una historia de casi 100 años en el cine y la televisión, Warner Bros. posee una de las librerías de entretenimiento más profunda y significativa. Volver a lanzar viejas películas en nuevos formatos o para nuevas audiencias es una parte importante del negocio. También es una tremenda responsabilidad cultural preservar a perpetuidad algunas de las historias más queridas en el mundo, agregó Colf.
“Imagina si un título como ‘El Mago de Oz’ o un programa como ‘Friends’ no estuvieran disponibles generación tras generación para ser disfrutados y vistos y entendidos,” dijo. “Pensamos que eso es inimaginable, y por eso nos damos a la tarea de preservar y archivar nuestro contenido con una seriedad extrema.”
La compañía cuenta con planes de redundancia para manejar varios de los peores escenarios posibles: un terremoto o huracán que impacte una de las costas, un incendio donde los sistemas de supresión no arranquen o una falla en el control del clima que permita crecer a la humedad y arruinar el inventario de cintas. La meta es contar con tres copias de archivo de cada recurso almacenadas en diferentes ubicaciones en el mundo: dos copias digitales separadas, junto con la copia física original en cualquier medio que haya sido creada una película o episodio de televisión o cartón animado.
Por fortuna, los negativos originales de las películas durarán por siglos si son almacenados en las condiciones adecuadas. Pero para algunos de los programas de televisión más viejos –como episodios de “Alice”, grabada en los setenta– la copia física original tiene una vida útil limitada que requiere de migración a formatos más nuevos. Y para las películas y programas de televisión de la actualidad que son grabados de manera digital, la tercera copia de calidad de archivo tiene un muy corto ciclo de migración de tres a cinco años, lo que es difícil de manejar.
“Digamos que un programa de TV se va directo a nuestros archivos digitales; no hay nada físico,” puntualizó Steven Anastasi, vicepresidente de archivos y servicios de preservación de medios globales en Warner Bros. “El archivo digital va a ingresar, pero no tengo algo que pueda poner en una bóveda o en una mina de sal o en cualquier cosa física que ingrese al edificio.”
Warner Bros. recurrió a Project Silica para crear un recurso físico permanente para almacenar importante contenido digital y brindar copias durables de respaldo. Ahora, para los lanzamientos teatrales que son grabados de manera digital, la compañía crea una tercera copia de archivo al convertirla de vuelta en un filme análogo. Divide el material final en tres componentes de color –cian, magenta y amarillo– y transfiere a cada uno a negativos de película en blanco y negro que no se desgastan como la película a color. Esos negativos son puestos en un archivo de almacenamiento frío. En estas bóvedas altamente gestionadas, la temperatura y la humedad son controladas de manera estricta, y los rastreadores de aire buscan señales de descomposición que puedan indicar problemas. Si necesitan la cinta de nuevo, deben revertir esos complicados pasos.
Ese proceso es caro, y sólo hay unos cuantos laboratorios de películas en el mundo que pueden hacerlo. Y el proceso no es óptimo desde un punto de vista cualitativo, comentó Brad Collar, vicepresidente senior de archivos globales e ingeniería de medios de Warner Bros. “Cuando filmamos algo de manera digital –con ceros y unos que representan los pixeles en la pantalla– e imprimimos eso en un medio análogo llamado película, destruimos los valores originales de los pixeles. Y, por supuesto, se ve muy bien, pero esto no es reversible,” comentó Collar.
“Si podemos tomar la representación digital de esos pixeles y ponerla en un medio digital como el silicio y leerla de vuelta justo como era cuando salió de la cámara, hemos hecho nuestra labor de preservación lo mejor que hemos podido. Eso es lo que me encanta de esto,” señaló.
No es económico crear negativos de película de archivo para cada episodio de televisión filmado de manera digital en la librería de Warner Bros. La compañía espera que Project Silica pueda probar ser una alternativa más barata y de mayor calidad para crear archivos físicos de contenido digital. Hay mucho trabajo por delante para alcanzar esa escala: los investigadores de Microsoft necesitarán incrementar de manera significativa la velocidad a la que los datos pueden ser escritos y leídos, así como su densidad. Warner Bros. imagina su propia infraestructura para leer datos desde archivos de vidrio. Pero ambos socios ven prometedor lo lejos que han llegado.
“Si la solución de Project Silica prueba ser tan rentable y escalable como podría ser y todos reconocemos que aún está en sus primeras fases– será algo que nos va a encantar ver en otros estudios, entre nuestros colegas y otras industrias,” mencionó Colf.
“Si funciona para nosotros, creemos que será un beneficio para cualquiera que quiera preservar y archivar contenido,” agregó.
Diseñar almacenamiento para la nube
Es imposible saber cuánta información se ha perdido debido a que nadie se dio cuenta de su valor en ese momento –desde películas mudas que nadie pensó que serían vistas fuera de un cine a datos históricos de los que las herramientas modernas de analítica e IA podrían obtener nueva información de valor.
Una meta de la investigación de Microsoft de almacenamiento de siguiente generación, que incluye esfuerzos paralelos para almacenar datos en ADN, es desarrollar soluciones que sean lo suficientemente baratas y no requieran esfuerzo como para que en verdad no se tenga que tomar la decisión sobre dónde almacenar sus datos, señaló la compañía.
Los investigadores de Microsoft pasaron años en tratar de llegar ahí con tecnologías que en la actualidad son utilizadas en centros de datos. Pero el tamaño, forma y limitaciones de cosas como la cinta de carreta y los discos giratorios –todos fueron inventados para otros propósitos, mucho antes de que existiera la nube– no brindaron las ganancias que querían.
“De manera eventual, pensamos ‘¿Podemos construir algo para la nube algo desde cero que no necesite hacer algo más?’,” pregunta Rowstron. Ellos lanzaron una colaboración con el Centro de Investigación Optoelectrónica de la Universidad de Southampton, donde en un inicio los investigadores demostraron cómo almacenar datos en vidrio con láser de femtosegundo.
Con una inversión de Azure, el laboratorio de Microsoft en Cambridge, Reino Unido, construyó un equipo interdisciplinario de físicos, expertos en óptica, ingenieros eléctricos e investigadores con antecedentes en almacenamiento para empujar esta tecnología. Desde entonces, el equipo de Microsoft Research ha conseguido importantes avances en velocidad y precisión. También han trabajado de cerca con sus contrapartes de Azure para diseñar Project Silica con los desafíos y requerimientos diarios del almacenamiento de nube comercial en mente.
“Recibir todas sus ideas y pensamientos en el proyecto desde el Día 1 significa que al final vamos a generar algo que es en verdad útil para ellos,” comentó Rowstron sobre la relación con el equipo de producto de Azure.
Los láseres infrarrojos de Project Silica codifican los datos en “vóxels”, el equivalente tridimensional de los pixeles que forman una imagen plana. A diferencia de los medios ópticos de almacenamiento que escriben datos en la superficie de algo, Project Silica almacena datos dentro del vidrio. Una pieza de vidrio de dos milímetros de espesor, por ejemplo, puede contener más de 100 capas de vóxels.
Los datos son codificados en cada vóxel al cambiar la fuerza y orientación de cada pulso intenso de laser que deforma de manera física el vidrio. Es algo como crear icebergs boca abajo nano escala, con diferentes profundidades y tamaños y surcos que los hacen únicos.
Para volver a leer esos datos, los algoritmos de aprendizaje automático decodifican los patrones creados cuando la luz polarizada brilla a través del vidrio. A diferencia de la cinta de almacenamiento –que toma tiempo en cola para llegar al lugar que quieres volver a leer– los algoritmos pueden llegar a cualquier punto dentro del cuadrado de vidrio, lo que reduce de manera potencial el tiempo de retraso para recuperar la información.
“Si tienes la edad suficiente para recordar cuando rebobinabas o adelantabas canciones en cintas de casete, puede tomar un tiempo llegar a la parte que quieres,” comentó Richard Black, ingeniero de investigación de software en Microsoft. “En contraste, es muy rápido leer desde el vidrio porque puedes moverte de manera simultánea dentro de los ejes x o y o z.”
A diferencia de las frágiles copas de vino o los focos, los cuadrados de vidrio de cuarzo utilizados para el almacenamiento de datos son, sorprendentemente, difíciles de destruir.
Hace un tiempo, el equipo de investigación trató de hornear uno a 500 grados, meterlo a un microondas, hervirlo, y fregarlo con lana de acero. Y cuando leyeron los datos, todo seguía ahí.
Eso tuvo mucho sentido para los archivadores de Warner Bros, que descubrieron hace años cajas de las series de radio de ‘Superman’ grabadas en los años cuarenta en piezas de vidrio del tamaño de un vinil. “Encontramos aparatos que podían reproducir esas cosas, y eran tan buenos debido a que fueron almacenados en vidrio. Y pudimos digitalizarlos y salvar esas increíbles piezas de contenido,” comentó Collar.
“Así que ahora uno de nuestros recursos más viejo en nuestra bóveda es el vidrio y una de nuestras tecnologías más nuevas en la bóveda es el vidrio. Y ambos son Superman. Así que hemos cerrado el círculo”, concluyó.
Contenido relacionado:
Conozcan más: Project Silica
Conozcan más: Optics for the Cloud
Jennifer Langston escribe sobre investigación e innovación en Microsoft. Síganla en Twitter.