Método da Microsoft torna aspectos computacionais do sequenciamento de genoma sete vezes mais rápidos

David Heckerman, diretor do grupo de genômica da Microsoft (Foto: Scott Eklund/Red Box Pictures)

Por Allison Linn //

A Microsoft encontrou uma forma de reduzir significativamente o tempo que leva para realizar os principais aspectos computacionais do sequenciamento de um genoma.

O método da Microsoft de executar o Alinhamento Burrows-Wheeler (Burrows-Wheeler Aligner – BWA) e o Kit de Ferramentas de Análise de Genoma (Genome Analysis Toolkit – GATK) do Broad Institute em seu sistema computacional de nuvem Azure é sete vezes mais rápido do que a versão anterior, permitindo que pesquisadores e profissionais médicos obtenham resultados em apenas 4 horas em vez de 28. BWA e GATK são duas das ferramentas computacionais mais comuns usadas combinadas para o sequenciamento de genoma.

O tempo poupado é importante por uma série de motivos. Por exemplo, pode permitir aos médicos diagnosticar condições genéticas raras e perigosas 24 horas antes e dar ao paciente o tratamento correto mais rapidamente.

“Há muitas informações cuja velocidade é realmente importante”, afirma Ravi Pandya, principal arquiteto de software do grupo de genômica da Microsoft e fundamental para esse trabalho acelerado.

Ravi Pandiya
Ravi Pandiya

Ao longo do tempo, os especialistas afirmam que a habilidade de sequenciar dados do genoma de plantas e animais também pode acelerar descobertas importantes em outros campos de pesquisa, como o de energias renováveis e produção eficiente de comida.

Uma “revolução da genômica”

A oferta veloz baseada em Azure chega num momento em que a habilidade de analisar dados de genoma está se tornando mais acessível a mais pessoas que precisam dela e impulsiona uma revolução da genômica.

David Heckerman, que dirige o grupo de genômica da Microsoft, afirma que os pedidos de hospitais, clínicas e instituições de pesquisa para processar dados de genoma está crescendo em uma taxa muito alta.

“Está chegando ao ponto no qual dezenas de milhares de genomas estão sendo sequenciados, então a eficiência realmente importa”, afirma Padya.

Nem sempre esse foi o foco.

Geraldine Van de Auwera, que trabalha para o Broad Institute na plataforma GATK e coordena o fórum de suporte online para 36 mil usuários afirma que, por um longo tempo, a análise de genoma foi usada principalmente com propósitos de pesquisa em vez de cuidados médicos. Isso significa que não havia uma urgência para economizar horas ou minutos no tempo necessário para realizar os cálculos.

Além disso, ela afirma, os pesquisadores estavam focados primariamente em garantir que seus métodos estivessem corretos.

“Por muito tempo, estivemos focados na precisão em vez da velocidade”, ela afirma.

Conforme as ferramentas amadureceram e os pesquisadores se tornaram mais confiantes na precisão, isso mudou.

Geraldine Van der Auwera
Geraldine Van der Auwera

“À medida que esse tipo de informação é usado mais frequentemente no ambiente clínico, a ênfase na velocidade se torna muito maior”, afirma Van de Auwera.

É aí que os cientistas da computação podem ajudar.

Muitas das ferramentas usadas para a análise do genoma foram escritas por biólogos que desenvolveram um interesse em ciências da computação, uma vez que ela se tornava valiosa em seus trabalhos.

Enquanto isso, afirma Pandya, cientistas da computação como ele próprio começaram a desenvolver um interesse em ciências biológicas porque enxergaram muitas possibilidades. Agora, esses cientistas da computação estão melhorando o trabalho dos biólogos.

Com o BWA e o GATK, a equipe da Microsoft vasculhou o código por pontos nos quais poderia fazer os algoritmos rodarem de forma mais suave, eficiente e confiável sem comprometer a atenção à precisão.

“Pegamos a especialidade em desenvolvimento de software da Microsoft e aplicamos aos algoritmos, tornando-os mais rápidos”, afirma Heckerman.

A Microsoft possui uma licença não-exclusiva do Broad Institute para fornecer o GATK no Azure e planeja trabalhar com o instituto de incorporar essas melhorias de desempenho em versões futuras do GATK. O Broad Institute tornaria essas melhorias disponíveis para os pesquisadores.

Heng Li, cientista-pesquisador do Broad que desenvolveu inicialmente a ferramenta BWA e trabalhou com a Microsoft para torná-la mais rápida, afirmou que a natureza colaborativa do trabalho proporcionou melhores resultados.

“Eles têm um conhecimento que eu não possuo. Por outro lado, eu sei o que é ou não importante por parte da análise biológica”, afirma Li.

A nuvem para armazenamento e computação

À medida que a análise do genoma foi se tornando mais importante para a saúde e outras aplicações, o Broad começou a trabalhar com a Microsoft e outras empresas de tecnologia para mover ferramentas como o GATK e o BWA para plataformas de computação na nuvem.

A computação na nuvem é ideal para esse tipo de trabalho, porque exige muito poder computacional, grande armazenamento de dados, e as solicitações podem vir repentinamente. Para a maioria dos hospitais, laboratórios de pesquisa e outras instalações e não é prático ficar com o trabalho de armazenar todos os dados, já que o volume bruto de informações está crescendo exponencialmente.

Como essas ferramentas se tornam mais úteis, mais pesquisadores e clínicos também querem obter os resultados que precisam, em vez de se preocuparem com o lado técnico das coisas.

“Quando você chega a esse nível, você apenas quer respostas”, afirma Pandya. “Você quer que seja realmente simples.”

Eventualmente, a equipe da Microsoft espera utilizar outra força da empresa – desenvolvendo um ecossistema ao redor da tecnologia – para ajudar os hospitais e outras instituições a implantar esses sistemas. A equipe de genômica da Microsoft está falando com fornecedores independentes de software sobre formas de fazer isso acontecer.

Essa ferramenta integra esforços mais amplos relacionados à saúde. Como parte de uma atualização em sua iniciativa contra o câncer, a Casa Branca anunciou que a Microsoft se uniu ao esforço de manter os dados de genoma do câncer na nuvem. O esforço é uma parceria entre o setor público e o privado.

Allison Linn é redatora sênior da Microsoft.

Tags: , ,

Posts Relacionados