Un equipo de la Universidad de Stanford desarrolló una inteligencia artificial llamada Evo, capaz de generar proteínas completamente nuevas y potencialmente funcionales, a partir de patrones genéticos presentes en millones de genomas bacterianos. El avance, publicado esta semana, representa un salto significativo en la aplicación de IA al diseño biológico, ya que trasciende la predicción estructural de proteínas conocida por sistemas como AlphaFold, y entra en el terreno de la generación de información biológica original a partir del ADN.
Genomas como lenguaje
Inspirados en cómo se entrenan los modelos de lenguaje extensos (LLM), los investigadores alimentaron a Evo con una vasta colección de genomas bacterianos, aprovechando una característica particular de estos organismos: los genes con funciones relacionadas suelen agruparse físicamente. Así, el modelo aprendió no solo a predecir secuencias genéticas, sino también a relacionar segmentos de ADN con funciones bioquímicas específicas, incluyendo la generación de nuevas proteínas.
El sistema funciona de manera generativa: puede recibir una instrucción en forma de secuencia parcial de un gen y producir posibles completamientos o elementos funcionales asociados, como antitoxinas o inhibidores de CRISPR.
Resultados: proteínas sin precedentes
Evo fue capaz de reconstruir proteínas conocidas a partir de fragmentos y, más sorprendente aún, generar proteínas completamente nuevas que, al ser sintetizadas y probadas en laboratorio, mostraron funcionalidad biológica. En el caso de antitoxinas bacterianas, la IA creó variantes que no se parecían a ninguna proteína previamente registrada, pero que aun así neutralizaban toxinas eficientemente.
En otro experimento, se enfocaron en inhibidores de CRISPR, un sistema bacteriano esencial en la defensa contra virus y en la edición genética moderna. Algunas de las proteínas generadas por Evo inhibieron el sistema CRISPR con éxito, pese a que su estructura era tan novedosa que ni siquiera podía ser interpretada por software tradicional de predicción estructural.
¿Qué implica esto?
El hallazgo cambia el punto de partida del diseño proteico. Mientras otros modelos parten de proteínas conocidas para modificarlas, Evo genera secuencias desde el ADN, tal como lo hace la evolución natural. Este enfoque amplía radicalmente el universo de posibles proteínas, abriendo nuevas rutas para descubrir medicamentos, enzimas industriales, agentes terapéuticos o herramientas biotecnológicas aún inimaginables.
Los investigadores generaron 120 mil millones de pares de bases de ADN nuevo, a partir de 1,7 millones de genes bacterianos y virales. Se trata de un repositorio colosal de información biológica inédita, que requerirá años de análisis, pero que podría ser fuente de innumerables aplicaciones científicas.
Acerca de los comentarios
Hemos reformulado nuestra manera de mostrar comentarios, agregando tecnología de forma de que cada lector pueda decidir qué comentarios se le mostrarán en base a la valoración que tengan estos por parte de la comunidad. AMPLIAREsto es para poder mejorar el intercambio entre los usuarios y que sea un lugar que respete las normas de convivencia.
A su vez, habilitamos la casilla [email protected], para que los lectores puedan reportar comentarios que consideren fuera de lugar y que rompan las normas de convivencia.
Si querés leerlo hacé clic aquí[+]