Pesquisadores da Microsoft e da Universidade de Washington demonstraram o primeiro sistema totalmente automatizado para armazenar e recuperar dados em DNA manufaturado – um passo fundamental na transferência da tecnologia do laboratório de pesquisa para os data centers comerciais.
Em um teste simples de prova de conceito, a equipe codificou com sucesso a palavra “hello” em fragmentos de DNA fabricado e converteu-a de volta em dados digitais usando um sistema automatizado de ponta a ponta, descrito em um novo documento publicado hoje, 21 de março, nos Relatórios Científicos da revista Nature.
O DNA pode armazenar informações digitais em um espaço com ordens de magnitude menores do que os data centers usam atualmente. É uma solução promissora para armazenar quantidades explosivas de dados que o mundo gera todos os dias, de registros comerciais e vídeos de animais fofos a imagens médicas e do espaço sideral.
A Microsoft está explorando maneiras de fechar a lacuna entre a quantidade de dados produzida que precisa ser preservada e nossa capacidade de armazená-la. Isso inclui o desenvolvimento de algoritmos e tecnologias de computação molecular para codificar e recuperar dados em DNA fabricado, que poderia reunir todas as informações atualmente armazenadas em um data center do tamanho de um depósito em um espaço do tamanho de alguns dados de jogos de tabuleiro, aproximadamente.
“Nosso objetivo final é colocar um sistema em produção que, para o usuário final, se parece muito com qualquer outro serviço de armazenamento na nuvem – bits são enviados para um data center e armazenados lá e então eles só aparecem quando o cliente os quer”, disse a brasileira Karin Strauss, diretora de pesquisa da Microsoft. “Para fazer isso, precisamos provar que é prático de uma perspectiva de automação.”
As informações são armazenadas em moléculas de DNA sintético criadas em laboratório, não em DNA de seres humanos ou outros seres vivos, e podem ser criptografadas antes de ir para o sistema. Enquanto máquinas sofisticadas, como sintetizadores e sequenciadores, já executam partes fundamentais do processo, muitas das etapas intermediárias até agora exigiam trabalho manual no laboratório de pesquisa. Mas isso não seria viável em um ambiente comercial, disse Chris Takahashi, cientista sênior de pesquisa da Escola de Ciência da Computação e Engenharia Paul G. Allen da UW.
“Você não pode ter um monte de pessoas correndo em torno de um data center com pipetas – isso é muito propenso a erros humanos, é muito caro e a pegada seria muito grande”, disse Takahashi.
Para que a técnica faça sentido como uma solução de armazenamento comercial, os custos precisam diminuir tanto para sintetizar DNA – basicamente tiras personalizadas de construção com sequências significativas – quanto para o processo de sequenciamento que extrai as informações armazenadas. As tendências estão se movendo rapidamente nessa direção, dizem os pesquisadores.
A automação é outra peça fundamental desse quebra-cabeça, pois permitiria o armazenamento em escala comercial e torná-lo mais acessível, dizem os pesquisadores da Microsoft.
Sob as condições certas, o DNA pode durar muito mais do que as tecnologias atuais de armazenamento de arquivos que se degradam em questão de décadas. Alguns DNA conseguiram persistir em condições de armazenamento inferiores às ideais por dezenas de milhares de anos em presas de mamutes e ossos de humanos primitivos, e deve ter relevância enquanto as pessoas estiverem vivas.
O sistema automatizado de armazenamento de dados de DNA usa software desenvolvido pela equipe da Microsoft e da UW que converte os zeros e uns dos dados digitais em As, Ts, Cs e Gs, que formam os blocos de construção do DNA. Em seguida, usa equipamentos de laboratório baratos, em grande parte disponíveis nas lojas, para transportar os líquidos e produtos químicos necessários a um sintetizador que constrói fragmentos fabricados de DNA e os empurra para um recipiente de armazenamento.
Quando o sistema precisa recuperar as informações, ele adiciona outras substâncias químicas para preparar adequadamente o DNA e usa bombas microfluídicas para empurrar os líquidos para outras partes do sistema que “leem” as sequências de DNA e as convertem de volta em informações que um computador pode entender. O objetivo do projeto não era provar quão rápido ou barato o sistema poderia ser, dizem os pesquisadores, mas simplesmente demonstrar que a automação é possível.
Um benefício imediato de ter um sistema automatizado de armazenamento de DNA é que ele libera os pesquisadores para investigar questões mais profundas, em vez de gastar tempo procurando frascos de reagentes ou espremendo repetidamente gotas de líquidos em tubos de ensaio.
“Ter um sistema automatizado para fazer o trabalho repetitivo permite que aqueles de nós que trabalham no laboratório tenham uma visão mais elevada e comecem a montar novas estratégias – essencialmente inovar muito mais rápido”, disse Bichlien Nguyen, pesquisador da Microsoft.
A equipe do Laboratório de Sistemas de Informação Molecular já demonstrou que pode armazenar fotografias de gatos, grandes obras literárias, vídeos e gravações de arquivos no DNA, e recuperar esses arquivos sem erros em um ambiente de pesquisa. Até hoje, eles conseguiram armazenar 1 gigabyte de dados no DNA, superando seu recorde mundial anterior de 200 MB.
Os pesquisadores também desenvolveram técnicas para realizar computação significativa – como procurar e recuperar apenas imagens que contêm uma maçã ou uma bicicleta verde – usando as próprias moléculas e sem precisar converter os arquivos de volta para um formato digital.
“Estamos definitivamente vendo um novo tipo de sistema de computador nascer aqui, usando moléculas para armazenar dados e eletrônica para controlar e processar. Colocar os dois juntos traz algumas possibilidades realmente interessantes para o futuro”, disse Luis Ceze, professor da UW Allen School.
Ao contrário dos sistemas de computação baseados em silício, os sistemas de computação e armazenamento baseados em DNA precisam usar líquidos para movimentar as moléculas. Mas os fluidos são inerentemente diferentes dos elétrons e exigem soluções de engenharia inteiramente novas.
A equipe da UW, em colaboração com a Microsoft, também está desenvolvendo um sistema programável que automatiza os experimentos de laboratório, aproveitando as propriedades da eletricidade e da água para mover gotículas ao redor de uma grade de eletrodos. O arranjo completo de software e hardware, apelidado de “Puddle” e “PurpleDrop”, pode misturar, separar, aquecer ou resfriar diferentes líquidos e executar protocolos de laboratório.
O objetivo é automatizar experimentos de laboratório que estão sendo feitos manualmente ou por robôs caros de manipulação de líquidos, mas por uma fração do custo.
As próximas etapas da equipe do MISL incluem a integração do sistema automatizado de ponta a ponta simples com tecnologias como a PurpleDrop e aquelas que permitem pesquisar com moléculas de DNA. Os pesquisadores projetaram especificamente o sistema automatizado para ser modular, permitindo que ele evolua à medida que surjam novas tecnologias para sintetizar, sequenciar ou trabalhar com o DNA.
“O que é ótimo sobre esse sistema é que, se quiséssemos substituir uma das peças por algo novo, melhor ou mais rápido, poderíamos apenas conectá-la”, disse Nguyen. “Isso nos dá muita flexibilidade para o futuro.”
Imagem do topo: Pesquisadores da Microsoft e da Universidade de Washington codificaram e recuperaram com sucesso a palavra “hello” usando este novo sistema que automatiza totalmente o armazenamento em DNA. É um passo fundamental para transferir a tecnologia do laboratório para os data centers comerciais.