CIENCIA

AlphaGenome

La nueva IA de Google permite predecir variaciones de ADN implicadas en enfermedades incurables

AlphaGenome analiza regiones del genoma hasta ahora difíciles de interpretar, lo que acelera la investigación biomédica para descubrir las mutaciones del ADN que influyen en el desarrollo de enfermedades

Los responsables de la IA, Ziga Avsec y Natasha Latysheva, junto al vicepresidente de Google DeepMind, Pushmeet Kohli.
Los responsables de la IA, Ziga Avsec y Natasha Latysheva, junto al vicepresidente de Google DeepMind, Pushmeet Kohli.Ilustración de Josetxu L. Piñeiro
Actualizado

Parece que solo son cuatro letras. Y es mucho más. El genoma humano es el manual de instrucciones de la vida. Sin embargo, la ciencia tan solo entendía una pequeña parte: el 2% que codifica proteínas. El 98% restante, denominado ADN no codificante (o incluso «ADN basura»), ha sido descrito a menudo como un territorio oscuro y difícil de interpretar, pese a que contiene muchas de las variantes genéticas asociadas a las enfermedades. Muchas alteraciones oncológicas y de las patologías más raras encuentran ahí su razón de ser.

Sin embargo, ahora un nuevo modelo de inteligencia artificial llamado AlphaGenome aspira a cambiar esa situación. Desarrollado por el equipo liderado por Ziga Avsec y Natasha Latysheva, junto al vicepresidente de Google DeepMind, Pushmeet Kohli,, el sistema acaba de ser presentado ayer en sociedad a través de la portada de la revista Nature, y ya está disponible para investigación. Su objetivo es ambicioso: predecir cómo pequeñas variaciones en la secuencia del ADN afectan a los complejos mecanismos que regulan la actividad de los genes.

Kohli situó a AlphaGenome como la evolución lógica tras el éxito de AlphaMissense y AlphaFold. Esta IA científica fue desarrollada por Demis Hassabis y John Jumper y presentada también a través de Nature en 2020. Su impacto fue tal, que poco tiempo después sus creadores recibieron con el Premio Nobel en 2024. Entonces la herramienta ya supuso un punto de inflexión. La comunidad científica calificaba sostenía que iba a cambiar la medicina, la investigación y la bioingeniería. «Pero las proteínas son tan solo un capítulo de la historia biológica», apuntaba Kohli en una rueda de prensa de presentación a los medios.

«Si las proteínas son los ingredientes de la vida, el ADN es la receta», continuaba el vicepresidente de Google DeepMind con la descripción del salto cualitativo que supone AlphaGenome. «Aunque el Proyecto del Genoma Humano nos proporcionó el libro de la vida, leerlo sigue siendo un reto. Tenemos el texto, pero aún estamos descifrando la semántica. Comprender la gramática de este genoma, lo que está codificado en nuestro ADN y cómo gobierna la vida, es la próxima frontera crítica para la investigación».

Para saber más

La comunidad científica valora este avance muy positivamente. Jonathan Frazer, jefe de grupo en el Centro de Regulación Genómica (CRG), confiesa que es un gran admirador de este trabajo. «En los últimos años se ha producido un gran avance en la predicción de los efectos de las variantes, y esta contribución a la genómica reguladora es especialmente emocionante».

Para Lluís Montoliu, investigador en el Centro Nacional de Biotecnología (CNB-CSI C) y en el CIBERER-ISCIII, esta nueva inteligencia artificial de Google pone luz donde solo había oscuridad. «Y lo hace con un detalle, una sistematicidad y una precisión necesarios». Si bien subraya que «estamos ante un trabajo complejísimo», también reconoce su gran utilidad dentro y fuera de los laboratorios: «Nos va a ayudar muchísimo, sobre todo a completar los diagnósticos genéticos de personas con enfermedades congénitas en los cuales habitualmente o bien no encontrábamos la causa o bien era muy difícil interpretarlos»

¿Cómo consigue todo esto?

Leer y comprender qué hay en las secuencias que nos describen las combinaciones de las cuatro letras y cómo intervienen otros procesos es un desafío constante, sobre todo cuando hay fallos que se convierten en enfermedades. En la presentación a los medios, Natasha Latysheva se centró en las aplicaciones prácticas: cómo los científicos utilizarán la herramienta y qué la hace diferente en el laboratorio. «No solo dice si una mutación tiene un efecto, sino que predice la dirección (si aumentará o disminuirá la expresión de un gen)».

AlphaGenome analiza secuencias de ADN de hasta un millón de pares de bases, una escala inédita hasta ahora, y genera predicciones a resolución de letra individual. Esto le permite captar tanto los efectos locales de una mutación como la influencia de regiones reguladoras situadas a gran distancia, algo fundamental para entender cómo se activan o silencian los genes.

Ziga Avsec enumeró las ventajas técnicas que explican por qué AlphaGenome es un salto técnico respecto a herramientas anteriores como Enformer. Además del volumen que puede manejar, «a diferencia de modelos anteriores especializados en una sola tarea, esta herramienta modela simultáneamente 11 procesos biológicos distintos».

En cifras, la herramienta permite la predicción simultánea de 5.930 señales genéticas humanas o 1.128 procedentes de ratones relacionadas con funciones específicas, como la expresión génica, el splicing (el corte y la reorganización de genomas) y la modificación de proteínas. Los resultados igualan o superan el rendimiento de los modelos más avanzados existentes en 25 de las 26 evaluaciones de predicciones de efectos de variantes, como el mencionado Enformer. Su punto fuerte radica en la capacidad de realizar múltiples predicciones sobre una serie de señales genéticas y resultados biológicos simultáneamente, subrayaron los investigadores.

Ilustración de
Ilustración deJosetxu L. Piñeiro

De hecho, Frazer destaca también estas ventajas del modo multimodal, que «combinado con una longitud de contexto tan grande, lo convierte en una herramienta valiosa para el descubrimiento».

Entender el lado oscuro del genoma

Esto marca la diferencia clave: AlphaGenome se adentra de lleno en el ADN no codificante. El modelo predice miles de propiedades moleculares: dónde empiezan y terminan los genes, cómo se procesa el ARN, cuánta expresión génica se produce, qué regiones del ADN están accesibles o qué proteínas se unen a ellas. Para entrenarlo, los investigadores recurrieron a grandes consorcios públicos como ENCODE, GTEx, 4D Nucleome y FANTOM5, que han recopilado datos experimentales de cientos de tipos celulares, tejidos humanos y de ratón.

Gracias a las mejoras arquitectónicas, el modelo logra este salto sin disparar los costes computacionales. De hecho, entrenar AlphaGenome requirió aproximadamente la mitad del presupuesto de cálculo utilizado para Enformer.

Uno de sus avances más destacados es el modelado explícito de las uniones de splicing, un proceso clave en numerosas enfermedades genéticas raras. Hasta ahora, este fenómeno era especialmente difícil de predecir directamente a partir de la secuencia del ADN. Natasha Latysheva explicó que reemplaza el «kit de herramientas fragmentado» (un modelo para splicing, otro para expresión, otro para estructura 3D) «por un marco de trabajo único y más amigable».

Uno de los investigadores, Ziga Avsec, contó cómo fue «ese momento eureka» en el que el gran avance dio el salto definitivo al descubrir «cómo romper la barrera entre secuencias largas y alta resolución mediante el entrenamiento en múltiples GPUs y la destilación de modelos».

Los autores muestran el potencial del modelo con un ejemplo concreto: una mutación asociada a la leucemia linfoblástica aguda de células T. AlphaGenome predijo que dicha mutación activaba el gen TAL1 al introducir un motivo de unión para la proteína MYB, reproduciendo con precisión el mecanismo patológico ya conocido. «Es un hito para el campo», afirma Caleb Lareau, del Memorial Sloan Kettering Cancer Center.

Montoliu manifiesta que «tener acceso al detalle genómico» marca un punto de inflexión en el diagnóstico y tratamiento de las enfermedades. «Hay que conocer los elementos reguladores de los genes cuando están mutados, pues pueden ser causa de una patología», explica el investigador del CNB-CSIC, ya que «en las enfermedades de base genética, no solamente las mutaciones están dentro de los genes, sino que están también alrededor de esos elementos reguladores».

Las limitaciones de AlphaGenome

Pese a sus avances, los propios investigadores subrayan las limitaciones del sistema. AlphaGenome no está diseñado para la predicción del genoma personal ni para uso clínico directo, y no puede explicar por sí solo cómo una variante genética desemboca en enfermedades complejas que dependen también de factores ambientales y de desarrollo.

Natasha Latysheva admitió que la genómica es «más confusa y desordenada» que el plegamiento de proteínas, y que «el modelo es mejor prediciendo efectos cuando tiene alta confianza, aunque los falsos negativos siguen siendo un reto».

Desde el CRG, Frazer también ayuda a poner los pies en el suelo ante las expectativas que pueda levantar la nueva herramienta. «Si vemos todo el campo en su conjunto, aún no han alcanzado el objetivo final de la predicción del genoma personal, por lo que es importante señalar que la utilidad clínica de estos modelos sigue siendo algo limitada». No obstante, «parece un gran paso en la dirección correcta», certifica. También, resumen los responsables que se podrían realizar más mejoras para ampliar las aplicaciones de esta herramienta, como aumentar la cobertura de especies o ampliar la gama de secuencias no codificantes que conoce el modelo.

Sin embargo, la verdadera potencia de este avance reside en su accesibilidad: AlphaGenome no se ha quedado bajo llave en los servidores de Google. En un ejercicio de ciencia abierta, el equipo ha liberado el modelo, sus pesos y una herramienta digital que ya utilizan más de 3.000 científicos en todo el mundo. Esta democratización permite que laboratorios sin grandes recursos computacionales puedan investigar enfermedades raras o diseñar nuevas terapias génicas en igualdad de condiciones.

Para el vicepresidente de Google DeepMind, «el siguiente objetivo es predecir con alta precisión el efecto de cualquier mutación en el genoma». Con AlphaGenome, la inteligencia artificial no solo da un paso más hacia uno de los grandes objetivos de la biología moderna, sino que entrega las llaves de este conocimiento a toda la humanidad para comprender, por fin, cómo el ADN dicta el funcionamiento de la vida.