Sistema de IA Treinado em Genomas Bacterianos Gera Sequências de Proteínas Novas

AI trained on bacterial genomes produces never-before-seen proteins

Pontos principais

  • Evo é um modelo de IA treinado em genomas bacterianos para interpretar DNA como linguagem.
  • Ele pode reconstruir porções faltantes de genes, alcançando até a recuperação completa.
  • O sistema restaura com sucesso genes deletados dentro de clusters funcionais.
  • Evo gera sequências de proteínas novas, demonstrado com variantes de toxinas que não possuem antitoxinas conhecidas.
  • A abordagem respeita os limites evolutivos, alterando apenas regiões tolerantes à variabilidade.
  • Aplicações potenciais incluem engenharia de proteínas, biologia sintética e descoberta de drogas.

Pesquisadores introduziram um modelo de inteligência artificial, chamado Evo, que aprende com genomas bacterianos para prever e completar DNA codificador de proteínas. O sistema pode reconstruir fragmentos de genes faltantes, restaurar genes deletados em clusters funcionais e até gerar sequências de proteínas completamente novas, incluindo variantes de toxinas que não possuem antitoxinas conhecidas.

Modelo de IA Treinado em Genomas Bacterianos

Cientistas desenvolveram um sistema de inteligência artificial chamado Evo, que é treinado no complemento completo de genomas bacterianos. Aprendendo as relações entre padrões de nucleotídeos e contextos genômicos maiores, Evo pode interpretar fragmentos de DNA muito como um modelo de linguagem interpreta texto.

Preenchendo Lacunas em Genes Conhecidos

Quando solicitado com uma sequência parcial de um gene conhecido, Evo pode prever com precisão a porção faltante. Por exemplo, fornecer 30 por cento da sequência de um gene permitiu que Evo gerasse 85 por cento do restante, e fornecer 80 por cento da sequência resultou em uma reconstrução completa.

Restaurando Genes Deletados

Em experimentos onde um único gene foi removido de um cluster funcional, Evo identificou corretamente e restaurou o gene faltante, demonstrando sua compreensão da organização de genes e relações funcionais.

Gerando Sequências de Proteínas Novas

Além de completar genes existentes, Evo foi desafiado a produzir novas sequências de proteínas. Pesquisadores usaram genes de toxinas bacterianas, que normalmente evoluem rapidamente e são pareados com genes de antitoxinas. Ao solicitar Evo com uma toxina que era apenas mildamente relacionada a toxinas conhecidas e filtrar respostas que se assemelham a antitoxinas conhecidas, o sistema gerou uma sequência de toxina nova sem uma contraparte de antitoxina óbvia.

Implicações para a Biotecnologia

Esses resultados indicam que Evo pode não apenas replicar informações biológicas conhecidas, mas também explorar novos espaços de sequência enquanto respeita as restrições evolutivas. Isso abre avenidas para o design de proteínas com funções desejadas, acelerar a biologia sintética e expandir a caixa de ferramentas para a engenharia de proteínas.

#IA#design de proteínas#genomas bacterianos#Evo#biologia sintética#aprendizado de máquina#genômica#engenharia de proteínas#biotecnologia

Também disponível em: