top of page
Buscar

Desarrollan una IA capaz de predecir la actividad interna de la célula, con un "enorme" potencial

La inteligencia artificial está transformando la investigación en los laboratorios de biología y biomedicina. Un equipo científico ha desarrollado un sistema innovador capaz de predecir el funcionamiento interno de las células, lo que podría mejorar la comprensión del cáncer y otras enfermedades.


Esta nueva inteligencia artificial (IA) opera de manera similar a los modelos de lenguaje como ChatGPT, que utilizan grandes conjuntos de datos para identificar patrones subyacentes, como la gramática del lenguaje y, en este caso, los mecanismos y estados celulares, aplicando esas reglas a nuevas situaciones.

El modelo de aprendizaje profundo utilizado, llamado GET, fue entrenado con datos de más de 1,3 millones de células de 213 tipos diferentes, obtenidas de tejido humano sano.


Detrás de este avance están los científicos de la Universidad de Columbia, Estados Unidos, liderados por el español Raúl Rabadán, experto en biología de sistemas y genómica del cáncer.


GET (siglas en inglés de "General Expression Transformer") fue presentado recientemente en la revista Nature, y según Rabadán, el algoritmo está disponible de forma pública para toda la comunidad científica. "Estamos trabajando activamente en la siguiente versión, GET 2.0", asegura.


"GET es solo el inicio, mi grupo en Columbia está ampliando el método a más de 50 millones de células y con aplicaciones en el estudio de diferentes tipos de cáncer, como tumores cerebrales y linfomas. Las posibilidades son enormes", destaca el investigador.


Un avance en la predicción Las herramientas tradicionales de investigación en biología permiten observar cómo las células realizan sus funciones o responden a alteraciones, pero no son capaces de predecir su funcionamiento o cómo reaccionarían ante cambios, como una mutación cancerígena.


"Tener la capacidad de predecir con precisión las actividades de una célula transformaría nuestra comprensión de los procesos biológicos fundamentales", explica Rabadán, director del Programa de Genómica Matemática en Columbia.


En los últimos años, la acumulación de grandes volúmenes de datos celulares y potentes modelos de IA, como AlphaFold de Google o ESMFold de Meta, diseñados para predecir la estructura de proteínas, están comenzando a convertir la biología en una ciencia más predictiva.


De hecho, el Premio Nobel de Química de 2024 se otorgó a investigadores por su trabajo pionero en el uso de la IA para predecir la estructura de proteínas, elementos clave de la vida.


Sin embargo, prever las actividades de genes y proteínas dentro de las células ha resultado ser más desafiante.


Para avanzar en este campo, Rabadán y su equipo crearon la nueva IA con el objetivo de predecir qué genes están activos en células específicas. Esta información sobre la expresión génica, el proceso por el cual los genes se convierten en proteínas, puede revelar la identidad de la célula y cómo lleva a cabo sus funciones.


Aunque todas las células del cuerpo contienen el mismo ADN, sus funciones son diferentes. Lo que varía y determina su función (o cuando no funcionan) son los genes que se expresan, es decir, la cantidad de proteínas generadas en cada célula.


"La expresión es como el volumen de cada gen, algunos están apagados y otros se expresan mucho; hay genes que se expresan en gran medida en una célula y en menor medida en otra. Lo que GET aprende es la 'gramática' de qué genes se expresan en cada célula", explica Rabadán.


Después de entrenarse con los datos de más de 1,3 millones de células humanas, el sistema fue lo suficientemente preciso para predecir la expresión génica en tipos celulares que nunca había encontrado, con resultados que coincidieron con los experimentos realizados en el laboratorio.


"Podemos, por ejemplo, entrenar el modelo sin que haya visto nunca un astrocito y pedirle que haga predicciones sobre la expresión génica en estas células nerviosas", señala Rabadán.


Explorando la "materia oscura" del genoma Los nuevos métodos computacionales también permitirán a los investigadores explorar el papel de la "materia oscura" del genoma, un término proveniente de la cosmología que se refiere a la gran mayoría del genoma que no contiene genes que codifiquen proteínas.


"La mayoría de las mutaciones encontradas en pacientes con cáncer se encuentran en las llamadas regiones oscuras del genoma, mutaciones que no afectan a las proteínas y que hasta ahora han permanecido sin estudiar", explica Rabadán.


El objetivo es que estos modelos permitan identificar y analizar esas mutaciones, iluminando esa parte del genoma.


"La IA está transformando la investigación en biología y biomedicina", concluye Rabadán, quien señala que el número de experimentos potenciales es extremadamente alto.

Comments


bottom of page