Modelo de IA da Google DeepMind descodifica ADN e prevê mutações, abrindo novas possibilidades para a investigação de doenças.
O nosso ADN resulta de milhões de combinações no genoma que dão origem ao corpo humano. Mesmo alterações mínimas nestas sequências, ou na forma como atuam, podem alterar o funcionamento de todo o organismo e causar doenças como o cancro.
O AlphaGenome, a nova ferramenta de inteligência artificial (IA) da Google, consegue ler longos segmentos de ADN e prever o comportamento de diferentes regiões, estimando como alterações podem conduzir a doenças.
Recorrendo à aprendizagem profunda e inspirado no modo como o cérebro processa informação, foi concebido para ajudar os cientistas a compreender o funcionamento do ADN.
A nova ferramenta da Google pode ajudar a decifrar como o ADN controla os genes, prevendo o que fazem longos segmentos de código genético.
“Acreditamos que o AlphaGenome pode ser um recurso valioso para a comunidade científica, ajudando os cientistas a compreender melhor a função do genoma, a biologia da doença e, em última análise, a impulsionar novas descobertas biológicas e o desenvolvimento de novos tratamentos”, afirmou a Google DeepMind.
Como funciona o AlphaGenome?
O modelo lê até um milhão de letras do ADN com precisão ao nível de cada letra, algo impossível com ferramentas anteriores.
O ADN consiste em longas cadeias formadas por quatro blocos químicos básicos chamados nucleótidos, cada um identificado por uma letra: A, C, G e T. Funciona como um manual de instruções para construir e controlar cada célula.
Apenas cerca de 2% do ADN humano codifica diretamente proteínas, os blocos que desempenham a maior parte do trabalho nas nossas células.
Os 98% restantes foram durante muito tempo descartados como “ADN lixo”; porém, longe de serem inúteis, estas sequências funcionam como painéis de controlo que regulam o modo como trabalham os outros 2%.
Orientam quando, onde e em que intensidade os genes se ativam ou desativam, respondem a sinais ambientais e influenciam o splicing do ARN, um mecanismo que junta sequências e permite ao mesmo gene produzir transcritos diferentes.
Muitas variantes associadas a doenças escondem-se aqui, afetando a atividade dos genes sem alterar as proteínas.
O AlphaGenome é o primeiro modelo de aprendizagem profunda capaz de abordar esta parte do ADN e prever o seu funcionamento.
O modelo consegue estimar de que forma pequenas alterações genéticas, as chamadas variantes, podem afetar a atividade dos genes ou perturbar processos normais associados a doenças como o cancro.
Como funciona na prática?
Como exemplo real, os investigadores concentraram-se num tipo de leucemia aguda, um cancro dos glóbulos brancos, em que células T imaturas, componentes do sistema imunitário, crescem descontroladamente.
Alguns casos de leucemia são causados por pequenas alterações no ADN que não modificam a própria proteína, mas alteram a intensidade ou o momento em que determinados genes se ativam.
O modelo AlphaGenome comparou a sequência de ADN normal com a mutada e previu a probabilidade de a mutação aumentar a atividade de genes próximos.
O modelo está atualmente disponível gratuitamente para cientistas em investigação não comercial; é uma ferramenta de investigação, não destinada a uso clínico.
Como pode ajudar?
A equipa de investigação antecipa múltiplas utilizações para o novo modelo.
Em biologia molecular, pode funcionar como uma ferramenta de laboratório virtual, permitindo testar ideias por simulação antes de realizar experiências dispendiosas.
Em biotecnologia, pode ajudar a conceber terapias genéticas ou a melhorar moléculas que visam tecidos específicos.
“O AlphaGenome da DeepMind representa um marco importante no campo da IA genómica”, afirmou Robert Goldstone, responsável pela área de genómica no Francis Crick Institute.
Acrescentou que o nível de resolução que o novo modelo permite é uma conquista que transfere a tecnologia do interesse teórico para a utilidade prática, permitindo aos cientistas estudar e simular, por via computacional, as raízes genéticas de doenças complexas.
“O AlphaGenome não é uma solução mágica para todas as questões biológicas, mas é uma ferramenta basilar e de alta qualidade que transforma o código estático do genoma numa linguagem decifrável para a descoberta”, acrescentou Goldstone.
Ainda assim, os cientistas alertam que, como todos os modelos de IA, o AlphaGenome vale tanto quanto os dados usados no seu treino.
“A maioria dos dados existentes em biologia não é muito adequada à IA: os conjuntos de dados são demasiado pequenos e pouco normalizados”, disse Ben Lehner, responsável por genómica generativa e sintética no Wellcome Sanger Institute, no Reino Unido.
Segundo o investigador, o principal desafio agora é como gerar os dados para treinar a próxima geração de modelos de IA.