Compreendendo os impactos das mutações
O código genético humano está totalmente mapeado, proporcionando aos cientistas um modelo do DNA para identificar regiões genômicas e suas variações responsáveis por doenças. As ferramentas estatísticas tradicionais identificam eficazmente estas “agulhas no palheiro” genéticas, mas enfrentam desafios na compreensão de quantos genes contribuem para doenças, como se verifica na diabetes ou na esquizofrenia. Um novo estudo do Instituto de Ciência e Tecnologia da Áustria (ISTA), publicado em PNASaborda esse problema.
Muitos modelos estatísticos e algoritmos usados pelos cientistas podem ser imaginados como uma “caixa preta”. Estes modelos são ferramentas poderosas que fornecem previsões precisas, mas o seu funcionamento interno não é facilmente interpretável ou compreendido. Numa era dominada pela aprendizagem profunda, onde uma quantidade cada vez maior de dados pode ser processada, Natália Ru¸icková, física e doutoranda no Instituto de Ciência e Tecnologia da Áustria (ISTA), optou por dar um passo atrás. Pelo menos no contexto da análise de dados genômicos.
Juntamente com Michal Hledík, recém-formado pelo ISTA, e o professor Ga¨per Tkacik, Ru¸icková propôs agora um modelo que pode ajudar a analisar “doenças poligênicas”, onde muitas regiões do genoma contribuem para um mau funcionamento. Além disso, o modelo serve para compreender as regiões genômicas identificadas que contribuem para essas doenças. Eles fazem isso combinando análises genômicas de última geração com conhecimentos fundamentais da biologia. Os resultados são publicados em PNAS.
Decodificando o genoma humano
Em 1990, o Projeto Genoma Humano foi lançado para decodificar completamente o DNA humano – o modelo genético que define os humanos. Avançando para 2003, quando o projeto foi concluído, ele abriu caminho para numerosos avanços na ciência, medicina e tecnologia. Ao decifrar o código genético humano, os cientistas tinham esperança de aprender mais sobre doenças ligadas a mutações e variações específicas neste roteiro genético. Dado que o genoma humano compreende aproximadamente 20 mil genes e ainda mais pares de bases – as letras do modelo – o grande poder estatístico tornou-se essencial. Isto levou ao desenvolvimento dos chamados “estudos de associação genômica ampla” (GWAS).
Os GWAS abordam a questão identificando variantes genéticas potencialmente ligadas a características do organismo, como a altura. É importante ressaltar que também incluem a propensão a diversas doenças. Para isso, o princípio estatístico subjacente é bastante simples: os participantes são divididos em dois grupos – indivíduos saudáveis e doentes. Seu DNA é então analisado para detectar variações – mudanças em seu genoma – que são mais proeminentes nas pessoas afetadas pela doença.
Uma interação de genes
Quando surgiram estudos de associação genómica, os cientistas esperavam encontrar apenas algumas mutações em genes conhecidos ligados a uma doença que explicariam a diferença entre indivíduos saudáveis e doentes. A verdade, porém, é muito mais complicada. “Às vezes, existem centenas ou milhares de mutações ligadas a uma doença específica”, diz Ru¸icková. “Foi uma revelação surpreendente e entrou em conflito com a compreensão da biologia que tínhamos.”
Individualmente, cada mutação tem um impacto ou contribuição mínima para o risco de desenvolver uma doença. Contudo, colectivamente, podem explicar melhor, mas não completamente, porque é que alguns indivíduos desenvolvem a doença. Tais doenças são referidas como “poligênicas”. Por exemplo, a diabetes tipo 2 é poligénica, porque não pode ser atribuída a um único gene; em vez disso, envolve centenas de mutações. Algumas dessas mutações afetam a produção de insulina, a ação da insulina ou o metabolismo da glicose, enquanto a maioria está localizada em regiões genômicas não previamente ligadas ao diabetes ou com funções biológicas desconhecidas.
O modelo omnigênico
Em 2017, Evan A. Boyle e colegas da Universidade de Stanford propuseram uma nova estrutura conceitual chamada “modelo omnigênico”. Eles propuseram uma explicação para a razão pela qual tantos genes contribuem para doenças: as células possuem redes reguladoras que ligam genes com diversas funções.
“Como os genes estão interligados, uma mutação num gene pode impactar outros, à medida que o efeito mutacional se espalha pela rede regulatória”, explica Ru¸icková. Devido a essas redes, muitos genes do sistema regulatório acabam contribuindo para uma doença. No entanto, até agora, este modelo não foi formulado matematicamente e permaneceu como uma hipótese conceitual difícil de testar. Em seu último artigo, Ru¸icková e seus colegas apresentam uma nova formalização matemática baseada no modelo omnigênico denominado “modelo omnigênico quantitativo” (QOM).
Combinando estatística e biologia
Para demonstrar o potencial do novo modelo, era necessário aplicar a estrutura a um sistema biológico bem caracterizado. Eles escolheram o modelo comum de levedura de laboratório Saccharomyces cerevisiaemais conhecido como levedura de cerveja ou o fermento de padeiro. É um eucarioto unicelular, o que significa que sua estrutura celular é semelhante à de organismos complexos como os humanos. “Na levedura, temos uma compreensão bastante boa de como são estruturadas as redes regulatórias que interconectam os genes”, diz Ru¸icková.
Usando o seu modelo, os cientistas previram os níveis de expressão genética – a intensidade da actividade genética, indicando quanta informação do ADN é activamente utilizada – e como as mutações se espalham através da rede reguladora da levedura. As previsões foram altamente eficientes: o modelo não apenas identificou os genes relevantes, mas também conseguiu identificar claramente qual mutação provavelmente contribuiu para um resultado específico.
As peças do quebra-cabeça das doenças poligênicas
O objetivo dos cientistas não era superar o GWAS padrão no desempenho de previsão, mas sim seguir uma direção diferente, tornando o modelo interpretável. Enquanto um modelo GWAS padrão funciona como uma “caixa preta”, oferecendo um relato estatístico da frequência com que uma determinada mutação está ligada a uma doença, o novo modelo também fornece um mecanismo causal de cadeia de eventos em que a mutação pode levar a uma doença.
Na medicina, a compreensão do contexto biológico e de tais vias causais tem enormes implicações para a descoberta de novas opções terapêuticas. Embora o modelo esteja atualmente longe de qualquer aplicação médica, ele mostra potencial, principalmente para aprender mais sobre doenças poligênicas. “Se você tiver conhecimento suficiente sobre as redes regulatórias, poderá construir modelos semelhantes para outros organismos também. Analisamos a expressão genética em leveduras, que é apenas o primeiro passo e uma prova de princípio. Agora que entendemos o que é possível, podemos começar a pensar em aplicações à genética humana”, diz Ru¸icková.
Publicação:
Natália Ruçicková, Michal Hledík & Gaëper Tkacik. 2024. Modelo omnigênico quantitativo descobre associações interpretáveis em todo o genoma.PNAS. DOI: 10.1073/pnas.2402340121