Sistema de IA entrenado en genomas bacterianos genera secuencias de proteínas novellas

AI trained on bacterial genomes produces never-before-seen proteins

Puntos clave

  • Evo es un modelo de IA entrenado en genomas bacterianos para interpretar ADN como lenguaje.
  • Puede reconstruir porciones faltantes de genes, logrando hasta la recuperación completa.
  • El sistema restaura con éxito genes eliminados dentro de clusters funcionales.
  • Evo genera secuencias de proteínas novellas, demostrado con variantes de toxinas que carecen de antitoxinas conocidas.
  • El enfoque respeta los límites evolutivos, alterando solo regiones tolerantes a la variabilidad.
  • Las aplicaciones potenciales incluyen la ingeniería de proteínas, la biología sintética y el descubrimiento de fármacos.

Investigadores han introducido un modelo de inteligencia artificial, llamado Evo, que aprende de genomas bacterianos para predecir y completar ADN codificador de proteínas. El sistema puede reconstruir fragmentos de genes faltantes, restaurar genes eliminados en clusters funcionales y incluso generar secuencias de proteínas completamente nuevas, incluyendo variantes de toxinas que carecen de antitoxinas conocidas.

Modelo de IA entrenado en genomas bacterianos

Científicos desarrollaron un sistema de inteligencia artificial llamado Evo, que se entrena en el complemento completo de genomas bacterianos. Al aprender las relaciones entre patrones de nucleótidos y contextos genómicos más amplios, Evo puede interpretar fragmentos de ADN de manera similar a como un modelo de lenguaje interpreta texto.

Rellenando lagunas en genes conocidos

Cuando se le proporciona una secuencia parcial de un gen conocido, Evo puede predecir con precisión la porción faltante. Por ejemplo, proporcionar el 30 por ciento de la secuencia de un gen permitió a Evo generar el 85 por ciento del resto, y suministrar el 80 por ciento de la secuencia resultó en una reconstrucción completa.

Restaurando genes eliminados

En experimentos donde se eliminó un solo gen de un cluster funcional, Evo identificó y restauró correctamente el gen faltante, demostrando su comprensión de la organización de genes y las relaciones funcionales.

Generando secuencias de proteínas novellas

Más allá de completar genes existentes, Evo se enfrentó a la tarea de producir nuevas secuencias de proteínas. Los investigadores utilizaron genes de toxinas bacterianas, que típicamente evolucionan rápidamente y se emparejan con genes de antitoxinas. Al proporcionar a Evo una toxina solo ligeramente relacionada con toxinas conocidas y filtrar las respuestas que se asemejan a antitoxinas conocidas, el sistema generó una secuencia de toxina novella sin una contraparte de antitoxina obvia.

Implicaciones para la biotecnología

Estos resultados indican que Evo no solo puede replicar información biológica conocida, sino también explorar nuevos espacios de secuencia mientras respeta las limitaciones evolutivas. Esto abre avenidas para diseñar proteínas con funciones deseables, acelerar la biología sintética y expandir la herramienta para la ingeniería de proteínas.

#IA#diseño de proteínas#genomas bacterianos#Evo#biología sintética#aprendizaje automático#genómica#ingeniería de proteínas#biotecnología

También disponible en: