GenAI inaugura uma nova era na pesquisa de medicamentos
O uso de inteligência artificial generativa no design de proteínas revolucionará o desenvolvimento de novos medicamentos. A EPFL ambiciona formar um consórcio para explorar ainda mais esta via.
Todos os seres vivos são feitos de proteínas. Eles desempenham um papel fundamental na estrutura celular, nutrição e saúde, bem como nas interações entre medicamentos e corpo.
Avanços recentes no design de proteínas inauguram uma nova era na pesquisa de medicamentos. Na vanguarda desta revolução está a inteligência artificial generativa (GenAI), que é capaz de projetar tipos inteiramente novos de proteínas. Novos métodos de imagem, como a cristalografia de raios X e a microscopia eletrônica criogênica, também estão desempenhando um papel fundamental, pois permitem aos cientistas observar a composição das proteínas do mundo real com uma precisão sem precedentes. A combinação destas novas tecnologias poderia abrir caminho para novos processos, permitindo aos investigadores desenvolver – entre outras coisas – medicamentos biológicos inovadores, muitas vezes chamados de biológicos.
Uma visão aproximada das biomoléculas
Nossa compreensão atual de como as proteínas e as células interagem baseia-se em dados empíricos coletados ao longo de anos de pesquisa biomédica. Para dar apenas um exemplo, sabemos muito bem o papel que a insulina desempenha no metabolismo da glicose. Mas inúmeras outras interações proteína-célula permanecem um mistério – assim como as razões e mecanismos por trás do mau funcionamento das proteínas causadoras de doenças.
A emergência de novos métodos e tecnologias está a expandir o corpo de conhecimento científico a um ritmo exponencial. A microscopia eletrônica criogênica – método praticado e desenvolvido no EPFL-UNIL Dubochet Center for Imaging – permitiu aos pesquisadores observar, in vitrocomo a proteína spike da variante SARS-CoV-2 Omicron interagiu com os receptores na superfície das células humanas, oferecendo informações sobre a rápida propagação do vírus no corpo e sua imunidade às vacinas desenvolvidas para variantes anteriores.
Spike Conhecida por ser a ponta de lança que permite ao vírus SARS-CoV-2 penetrar nas células humanas, a proteína Spike ganhou fama durante a pandemia. A proteína spike se liga às proteínas ACE2 em membranas celulares específicas (incluindo as do nosso sistema respiratório), abrindo a porta para a entrada do vírus. Consiste em três cadeias idênticas que se projetam do envelope viral. A proteína spike é uma glicoproteína – ou seja, é revestida com açúcares que são de origem humana. Se a camada de açúcar for espessa o suficiente, ela atua como uma “capa invisível”, tornando o vírus indetectável pelo nosso sistema imunológico.
A proteína spike é um alvo principal do nosso sistema imunitário no combate a uma infecção – e as vacinas são um poderoso aliado nesta luta. Os cientistas usaram uma variedade de métodos para desenvolver vacinas contra SARS-CoV-2. Um deles envolvia a síntese e a purificação da proteína spike do vírus, que era então depositada em nanopartículas e administrada por meio de injeções subcutâneas. A vacina estimula o sistema imunológico do receptor a produzir anticorpos, uma vez que a proteína spike é reconhecida como uma substância estranha. No caso das vacinas de mRNA, não é uma réplica da proteína spike que é administrada, mas sim o “modelo” da proteína na forma de mRNA. Isto permite que as próprias células do receptor sintetizem a proteína spike, contra a qual o sistema imunológico desenvolve anticorpos específicos.
Aplicando aprendizado profundo à vida
De forma semelhante, estão a ser feitos progressos rápidos noutro campo: a aplicação da aprendizagem automática às ciências da vida. Os vencedores do Prêmio Nobel de Química de 2024 foram David Baker, um pioneiro americano da biologia computacional, junto com Demis Hassabis – um ganhador do EPFL Doctor Honoris Causa – e John M. Jumper, que juntos desenvolveram AlphaFold, um modelo de IA de referência multipremiado para prever a estrutura das moléculas.
Projetando novas biomoléculas
EPFL também é altamente ativo no design de proteínas. Há mais de cinco anos que o Laboratório de Design de Proteínas e Imunoengenharia da Escola, liderado por Bruno Correia, utiliza a aprendizagem automática para prever o potencial interativo entre proteínas e os seus recetores. “A utilização da aprendizagem profunda na engenharia biológica está a abrir novas oportunidades interessantes”, afirma Correia.
Embora este trabalho inovador esteja a aprofundar a nossa compreensão de como funcionam os organismos vivos, também marca o ponto de partida para uma revolução nascente na investigação de medicamentos. Porque quando os programas GenAI, como o ChatGPT, são treinados em dados de proteínas e de interação molecular gerados por pesquisadores e modelos como o AlphaFold, os programas podem projetar e modelar tipos inteiramente novos de moléculas, em inúmeras formas, e simular suas interações com as células. E os programas podem realizar bilhões desses cálculos por segundo até encontrarem moléculas com relevância teórica para o desenvolvimento de medicamentos. “Esta nova abordagem representará nada menos que uma mudança de paradigma para todo o campo da biotecnologia”, acrescenta Correia.
Esta nova abordagem será nada menos que uma mudança de paradigma para todo o campo da biotecnologia.
Bruno Correia
Do planejamento à realidade
Existem, no entanto, várias maneiras de produzir proteínas existentes ou até então desconhecidas sob demanda. É isso que Florence Pojer e seu grupo de pesquisa estão fazendo no Protein Production and Structure Core Facility (PTPSP) da EPFL, onde garrafas contendo líquidos avermelhados são agitadas em armários de vidro por horas a fio. “Por exemplo, estes frascos contêm células de rim embrionário humano (HEK), que foram imortalizadas e cultivadas durante décadas”, diz Pojer. “Nós os usamos para produzir proteínas como anticorpos, depois de primeiro transfectar as células com plasmídeos contendo a sequência desejada”.
Os cientistas do PTPSP também criam outros tipos de misturas celulares e bacterianas, dependendo dos resultados que pretendem alcançar. A solução final é então purificada para isolar as proteínas alvo. “Em teoria é possível produzir qualquer proteína a partir de sua sequência genética”, acrescenta. “Mas do jeito que as coisas estão atualmente, apenas uma pequena fração das proteínas projetadas in silicopor computadores, podem realmente ser feitos e funcionar no mundo real. A ideia por trás de novas abordagens biotecnológicas é expandir a gama do que podemos produzir no futuro”.
Grande parte desta tecnologia inovadora está a ser aplicada ou desenvolvida na EPFL – não apenas por Correia e o seu grupo de investigação, mas também no laboratório liderado por Sebastian Maerkl, onde os investigadores se concentram não em processos biológicos em células vivas, mas sim em in vitro pesquisa, usando cerca de 30 enzimas realmente necessárias para a produção de proteínas. Enquanto isso, o grupo de pesquisa de Matteo Dal Peraro utiliza observação, modelagem e simulação para estudar grandes sistemas macromoleculares e suas capacidades de ação, que são determinadas por sua estrutura e composição.
Um vasto consórcio em formação
Vários projetos de investigação complementares estão atualmente em curso em escolas e universidades em toda a Suíça. Na EPFL, Correia e Beat Fierz estão a construir um consórcio com vista a inaugurar uma nova era na investigação de medicamentos – alimentada pela aprendizagem automática. Trazer isto sob o mesmo teto não só consolidaria a posição do país como um centro de excelência neste campo, mas também encorajaria o rápido surgimento de novas proteínas eficazes para aplicações clínicas. A ideia é promover o desenvolvimento de tecnologia de design de moléculas habilitada para IA, explorar novos tipos de interações entre medicamentos e células, criar novos bancos de dados para melhorar ainda mais o desempenho do software de design e preparar cientistas em início de carreira para aproveitar novas oportunidades de pesquisa e transferência de tecnologia. . É um empreendimento ambicioso que certamente cativará os cientistas nas próximas gerações.
AlphaFold, de propriedade do Google DeepMind, é um modelo de IA que usa a sequência de aminoácidos de uma proteína para prever a maneira como ela é dobrada – um fator estrutural que determina sua função e sua capacidade de interagir com o ambiente. AlphaFold 3, a versão mais recente, lançada em maio de 2024, pode até modelar a estrutura e as interações das cadeias de DNA e RNA, permitindo aos pesquisadores identificar os mecanismos celulares exatos que desempenham um papel fundamental no desenvolvimento de novos medicamentos. Foi lançado como um modelo de código aberto, permitindo que cientistas de todo o mundo o utilizassem para desenvolver novos compostos terapêuticos.