Pesquisadores usam IA para melhorar a precisão da edição de genes com o CRISPR

Por John Roach //

Da esquerda para a direita, Nicolo Fusi, pesquisador da Microsoft, Jennifer Listgarten, que recentemente se juntou à faculdade UC Berkeley, e John Doench, diretor associado do Broad Institute, colaboraram em um método para usar a IA na melhoria dos resultados de edição de genes. (Foto: Dana J. Quigley)

Uma colaboração entre cientistas da computação e biólogos de instituições de pesquisa nos Estados Unidos está produzindo um conjunto de ferramentas computacionais que aumentam a eficiência e a precisão ao implantar o CRISPR, uma tecnologia de edição de genes que está transformando setores da economia, desde a área da saúde até a agricultura.

CRISPR é um kit de costura nanométrico, que pode ser projetado para cortar e alterar o DNA em um determinado ponto de um gene específico.

A tecnologia, por exemplo, pode levar a aplicações revolucionárias, como a modificação de células para combater o câncer ou produzir culturas de alto rendimento tolerantes à seca, como trigo e milho.

O Elevation, a mais nova ferramenta lançada pela equipe, usa uma aplicação da inteligência artificial, conhecida como aprendizagem de máquina, para prever os efeitos chamados “fora do alvo” ao editar genes com o sistema CRISPR.

Apesar de o CRISPR ser uma grande promessa em vários campos, um desafio comum é que muitas regiões genômicas são semelhantes, o que significa que o kit de costura nanométrico pode, acidentalmente, trabalhar no gene errado e causar consequências não intencionais – o chamado efeito “fora do alvo”.

“Os efeitos ‘fora do alvo’ são algo que queremos evitar”, disse Nicolo Fusi, pesquisador do laboratório de pesquisa da Microsoft, em Cambridge, Massachusetts. “Queremos nos certificar de que a experiência não prejudique outra coisa.”

Fusi e a ex-colega da Microsoft, Jennifer Listgarten, aliados a colaboradores do Instituto Broad do MIT e Harvard, da Universidade da Califórnia, em Los Angeles, Massachusetts General Hospital e Harvard Medical School, descrevem o Elevation em um artigo publicado no dia 10 de janeiro, na revista Nature Biomedical Engineering.

O Elevation e uma ferramenta complementar para prever os efeitos no alvo, chamada Azimuth, estão publicamente disponíveis sem custo, como um serviço guia de design de ponta a ponta baseado na nuvem, em execução no Microsoft Azure e via código-fonte aberto.

Usando as ferramentas computacionais, os pesquisadores podem inserir o nome do gene que desejam modificar, e o mecanismo de busca baseado na nuvem irá retornar uma lista de guias que os pesquisadores podem classificar por efeitos predispostos ou “fora do alvo”.

A natureza como engenheira

O sistema de edição de genes CRISPR é adaptado a partir de um mecanismo natural de combate a vírus. Os cientistas descobriram isso no DNA das bactérias no final da década de 1980, e o seu funcionamento ao longo das décadas seguintes.

“O sistema CRISPR não foi projetado, ele evoluiu”, disse John Doench, diretor associado do Broad Institute, que lidera a frente biológica da colaboração de pesquisa com a Microsoft.

A tradução para o português da palavra CRISPR significa “repetições palindrômicas curtas, agrupadas em intervalos regulares”, que descreve um padrão de sequências repetidas de DNA nos genomas de bactérias separadas por curtas sequências espaçadoras de DNA, não repetitivas.

Os espaçadores não repetidos são cópias de DNA de vírus invasores, cujos mensageiros moleculares conhecidos, como o RNA, usam como modelo para reconhecer invasões virais subsequentes. Quando um invasor é detectado, o RNA orienta o complexo CRISPR para o vírus e envia as proteínas associadas a ele (Cas) para cortar e desativar o gene viral.

Adaptações modernas

Em 2012, biólogos moleculares descobriram como adaptar o sistema bacteriano de combate ao vírus para editar genes em organismos que variam de plantas a camundongos e humanos. O resultado é a técnica de edição de genes CRISPR-Cas9.

O sistema básico funciona assim: os cientistas projetam o guia sintético RNA para combinar uma sequência de DNA no gene que eles querem cortar ou editar e liberá-lo em uma célula com as tesouras de proteína associadas ao CRISPR, Cas9.

Atualmente, a técnica é amplamente utilizada como uma maneira eficiente e precisa de entender o papel dos genes individuais em tudo, desde pessoas até árvores, além de mudar os genes para fazer tudo, desde lutar contra doenças até produzir mais alimentos.

“Se você quer entender como a disfunção do gene leva a determinada doença, por exemplo, você precisa saber como o gene normalmente funciona”, disse Doench. “CRISPR tem sido essencial para isso.”

Um desafio global para os pesquisadores é decidir o que leva o RNA a escolher por determinado experimento. Cada guia é de cerca de 20 nucleotídeos; existem centenas de guias potenciais para cada gene alvo em uma experiência avassaladora.

Em geral, cada guia tem uma eficiência diferente e um grau diferente de atividade “fora do alvo”.

A colaboração entre cientistas da computação e biólogos está focada na construção de ferramentas que ajudem os pesquisadores a estudarem por meio das escolhas do guia e encontrar o melhor para suas experiências.

Várias equipes de pesquisa criaram regras para determinar onde os efeitos “fora do alvo” estão nos experimentos de edição de genes e como evitá-los. “As regras são feitas e direcionadas à mão”, disse Fusi. “Decidimos abordar esse problema com a aprendizagem de máquina.”

Modelos de treinamento

Para enfrentar o problema, Fusi e Listgarten treinaram o chamado modelo de aprendizagem de máquina de primeira camada em dados gerados por Doench e seus colegas. Esses dados relataram sobre a atividade para todas as regiões alvo possíveis com apenas um desajuste de nucleotídeos com o guia.

Em seguida, usando dados publicamente disponíveis, que foram gerados anteriormente pela equipe da Harvard Medical School e colaboradores do Massachusetts General Hospital, os especialistas em aprendizagem de máquina treinaram um modelo de segunda camada que refina e generaliza o modelo da primeira camada para casos em que há mais de um nucleotídeo incompatível.

O modelo de segunda camada é importante porque a atividade “fora do alvo” pode ocorrer com muito mais do que apenas uma incompatibilidade entre guia e alvo, observou Listgarten, que se juntou à faculdade da Universidade da Califórnia, em Berkeley, em 1º de janeiro.

Finalmente, a equipe validou seu modelo de duas camadas em vários outros conjuntos de dados publicamente disponíveis, bem como um novo conjunto de dados gerado por colaboradores afiliados à Harvard Medical School e ao Massachusetts General Hospital.

Alguns recursos do modelo são intuitivos, como um desajuste entre o guia e a sequência de nucleotídeos, observou Listgarten. Outros refletem propriedades desconhecidas codificadas no DNA que são descobertas por meio da aprendizagem de máquina.

“Parte da beleza da aprendizagem de máquina é se você der a ela coisas suficientes para trabalhar, ela pode decifrá-las”, disse Listgarten.

Números do “fora do alvo”

O Elevation fornece aos pesquisadores dois tipos de pontuação “fora do alvo” para cada guia: pontuações individuais para uma região alvo e uma única pontuação geral de resumo para esse guia.

As pontuações alvo são as probabilidades baseadas em aprendizagem de máquina, providenciadas para cada região do genoma em algo ruim poderia acontecer. Para cada guia, o Elevation retorna milhares desses números “fora do alvo”.

Para os pesquisadores que tentam determinar qual das centenas de guias devem utilizar para um determinado experimento, esses números “fora do alvo” individuais podem ser pesados, observou Listgarten.

A pontuação de resumo é o único número que agrupa a pontuação “fora do alvo” em um conjunto para fornecer uma visão geral sobre a probabilidade de o guia interromper a célula em todos os seus potenciais efeitos “fora do alvo”.

“Em vez de uma probabilidade para cada ponto do genoma, é a probabilidade de eu estragar essa célula por causa de todas as atividades ‘fora do alvo’ do guia?”, disse Listgarten.

Design do guia de ponta a ponta

Escrevendo para a Nature Biomedical Engineering, os colaboradores descrevem como o Elevation funciona em conjunto com uma ferramenta lançada em 2016, chamada Azimuth, que prevê efeitos alvo.

As ferramentas complementares fornecem aos pesquisadores um sistema de ponta a ponta para projetar experimentos com o sistema CRISPR-Cas9 – ajudando-os a selecionar um guia que obtenha o efeito pretendido – desativando um gene, por exemplo – e reduzindo erros, como cortar o gene errado.

“Nosso trabalho”, disse Fusi, “é oferecer as melhores ferramentas possíveis às pessoas que trabalham em biologia molecular.”

Além de Listgarten, Fusi e Doench, colaboram no projeto Michael Weinstein, da Universidade da Califórnia, em Los Angeles; Benjamin Kleinstiver; Keith Joung e Alexander A. Sousa, da Harvard Medical School e Massachusetts General Hospital, e Melih Elibol, Luong Hoang, Jake Crawford e Kevin Gao, do Microsoft Research.

John Roach escreve sobre pesquisa e inovação da Microsoft. 

Tags: , ,

Posts Relacionados