Con un “hola”, Microsoft y la Universidad de Washington prueban el primer almacenamiento de datos en ADN automatizado por completo

Codificación y recuperación de datos en ADN producido

Por: Jennifer Langston

Investigadores de Microsoft y la Universidad de Washington han probado el primer sistema automatizado por completo para almacenar y recuperar datos en ADN fabricado, un paso clave en mover la tecnología fuera del laboratorio de investigación hacia los centros de datos comerciales.

En una sencilla prueba de concepto, el equipo codificó de manera exitosa la palabra “hello” (hola) en fragmentos de ADN fabricado y la convirtieron de nuevo en datos digitales a través de un sistema automatizado por completo de principio a fin, proceso descrito en un nuevo documento publicado el pasado 21 de marzo de 2019 en Nature Scientific Reports.

El AND puede almacenar información digital en un espacio que es un orden de magnitud más pequeño que los centros de datos que utilizamos en la actualidad. Es una prometedora solución para almacenar la creciente cantidad de datos que el mundo genera cada día, desde registros de negocios y tiernos videos de animales a escaneos médicos e imágenes del espacio exterior.

Microsoft explora maneras de cerrar una amenazante brecha entre la cantidad de datos que producimos y que necesitan ser preservados y nuestra capacidad de almacenarlos. Esto incluye desarrollar algoritmos y tecnologías de cómputo molecular para codificar y recuperar datos en ADN fabricado, en el cual podría caber toda la información almacenada en la actualidad en un centro de datos del tamaño de una bodega en un espacio apenas del tamaño de unos dados.

“Nuestra meta definitiva es producir un sistema que, para el usuario final, se vea muy parecido a cualquier otro sistema de almacenamiento en la nube, los bits son enviados al centro de datos y almacenados ahí y luego tan solo aparecen cuando el cliente los quiera”, comentó Karin Strauss, investigadora en Microsoft. “Para hacer esto, necesitábamos probar que esto es práctico desde una perspectiva de automatización”.

La información es almacenada en moléculas sintéticas de ADN creadas en un laboratorio, no en ADN para humanos o de otras criaturas vivientes, y puede ser encriptado antes de ser enviado al sistema. Aunque las sofisticadas máquinas como los sintetizadores y secuenciadores ya realizan partes clave del proceso, hasta hoy muchos pasos intermedios requerían una labor manual en el laboratorio de investigación. Pero eso no sería viable en un escenario comercial, comenta Chris Takahashi, científico de investigación en la Escuela Paul G. Allen de Ciencias de la Computación e Ingeniería de la Universidad de Washington (UW).

“No puedes tener gente que corre con pipetas en la mano por un centro de datos, es algo propenso al error humano, es muy costoso y la huella puede ser muy grande”, mencionó Takahashi.

Para que la técnica haga sentido como solución comercial de almacenamiento, los costos necesitan disminuir tanto para sintetizar el ADN, en esencia filamentos construidos a la medida con secuencias significativas, como para el proceso de secuenciamiento que extrae la información almacenada. Los investigadores comentan que las tendencias se mueven de manera rápida hacia esa dirección.

La automatización es otra pieza clave de ese rompecabezas, pues podría habilitar el almacenamiento a escala comercial y hacerlo más asequible, comentan los investigadores de Microsoft.

Bajo las condiciones adecuadas, el ADN puede durar mucho más que las tecnologías actuales de almacenamiento de archivos que se degradan en cuestión de décadas. Parte del ADN ha conseguido persistir en condiciones de almacenamiento menos que ideales por miles de años en los colmillos de mamuts y en huesos de los humanos primitivos, y debería tener relevancia mientras la gente esté viva.

El sistema automatizado de almacenamiento de datos en ADN utiliza software desarrollado por los equipos de Microsoft y la UW que convierte los unos y ceros de los datos digitales en As, Ts, Cs, y Gs, que forman los componentes básicos del ADN. Luego utiliza equipo de laboratorio económico y en gran medida disponible para hacer fluir los líquidos y químicos necesarios hacia un sintetizados que construye los fragmentos de ADN fabricado y los envía hacia un recipiente de almacenamiento.

Cuando el sistema necesita recuperar la información, agrega otros químicos para preparar al ADN de manera adecuada y utiliza bombas de micro fluidos para empujar los líquidos hacia otras partes del sistema que “leen” las secuencias de ADN y las convierten en información que una computadora puede entender. La meta del proyecto no era probar qué tan rápido o económico podía funcionar el sistema, mencionan los investigadores, sino sólo demostrar que la automatización es posible.

Un beneficio inmediato de tener un sistema automatizado de almacenamiento en ADN es que libera a los investigadores para investigar cuestiones más profundas, en lugar de pasar tiempo en buscar botellas de reactivos o exprimir gotas de líquidos en tubos de ensayo de manera repetitiva.

“Contar con un sistema automatizado para que haga el trabajo repetitivo permite a los que trabajamos en el laboratorio tener una vista más amplia y comenzar a ensamblar nuevas estrategias, en esencia, innovar mucho más rápido”, comentó Bichlien Nguyen, investigador de Microsoft.

El equipo de Molecular Information Systems Lab ya ha demostrado que puede almacenar fotografías de gatos, grandes obras literarias, videos musicales y registros de archivos en ADN, y recuperar esos archivos sin errores en un escenario de investigación. A la fecha han podido almacenar 1GB de datos en ADN, lo que ha superado su marca mundial previa de 200MB.

Para almacenar datos en ADN, los algoritmos convierten los 1s y 0s de los datos digitales en secuencias ACTG del ADN. Los investigadores de Microsoft y de la Universidad de Washington almacenaron y recuperaron la palabra “hello” a través del primer sistema automatizado por completo de almacenamiento en ADN.

Los investigadores también han desarrollado técnicas para desempeñar cómputo significativo, como buscar y recuperar sólo imágenes que contienen una manzana o una bicicleta verde, a través de utilizar a las moléculas y sin tener que convertir los archivos de regreso a un formato digital.

“En definitiva, hemos comenzado a ver un nuevo tipo de sistema de cómputo que ha nacido aquí donde utilizas moléculas para almacenar datos y electrónicos para control y procesamiento. Al reunirlos, se obtienen posibilidades en verdad interesantes para el futuro”, comentó Luis Ceze, profesor de la Escuela Allen de la UW.

A diferencia de los sistemas de cómputo basados en silicio, el almacenamiento y los sistemas de cómputo basados en ADN tienen que utilizar líquidos para mover las moléculas. Pero de manera inherente, los fluidos son diferentes de los electrones y requieren soluciones nuevas de ingeniería.

El equipo de UW, en colaboración con Microsoft, también se encuentra en desarrollo de un sistema programable que automatiza los experimentos de laboratorio al aprovechar las propiedades de la electricidad y el agua para mover las gotas alrededor de una red de electrodos. La pila completa de software y hardware, nombrada “Puddle” y “PurpleDrop”, puede mezclar, separar, calentar o enfriar diferentes líquidos y correr protocolos de laboratorio.

La meta es automatizar experimentos de laboratorio que en la actualidad se realizan a mano o a través de caros robots que manejan líquidos, pero a una fracción de su costo.

Los siguientes pasos para el equipo de MISL incluyen integrar el simple sistema automatizado de principio a fin con tecnologías como PurpleDrop y con aquellas que habilitan la búsqueda con moléculas de ADN. Los investigadores diseñaron en específico el sistema automatizado para que sea modular, y permitirle evolucionar conforme nuevas tecnologías surgen para sintetizar, secuenciar o trabajar con ADN.

“Lo que es increíble de este sistema es que si queríamos reemplazar una de las partes con algo nuevo o mejor o más rápido, sólo tuviéramos que conectarlo”, comentó Nguyen. “Nos da una gran flexibilidad para el futro”.

Imagen principal: Investigadores de Microsoft y la Universidad de Washington han codificado y recuperado de manera exitosa la palabra “hello” a través de este nuevo sistema que automatiza por completo el almacenamiento en ADN. Es un paso clave en mover la tecnología fuera del laboratorio hacia los centros de datos comerciales.

Contenido relacionado con el almacenamiento en ADN:

Jennifer Langston escribe sobre investigación e innovación en Microsoft. Síganla en Twitter.

Tags: , , ,

Publicaciones Relacionadas