En el constante esfuerzo por descubrir sustancias activas eficientes para combatir enfermedades, los investigadores se enfrentan a la desafiante tarea de determinar qué molécula de medicamento es más efectiva. Este proceso implica el acoplamiento de compuestos a proteínas, generalmente enzimas o receptores que desencadenan acciones fisiológicas específicas. Algunas moléculas buscan bloquear reacciones indeseables en el cuerpo, como respuestas inflamatorias excesivas. Con la abundancia de compuestos químicos disponibles, la investigación inicial a menudo se asemeja a buscar una aguja en un pajar.
El rol creciente de la inteligencia artificial en el descubrimiento de medicamentos
La inteligencia artificial (IA) ha revolucionado la investigación de medicamentos al introducir aplicaciones de aprendizaje automático. Las redes neuronales gráficas (GNNs) se destacan como una de las oportunidades clave en este campo. Estas se adaptan para predecir cuán fuertemente se une una molécula específica a una proteína objetivo. Los modelos GNN se entrenan con grafos que representan complejos formados entre proteínas y compuestos químicos (ligandos).
«La forma en que las GNN llegan a sus predicciones es como una caja negra en la que no podemos asomarnos», señala el Prof. Dr. Jürgen Bajorath, investigador de quimioinformática. Bajorath, junto con colegas de la Universidad de Bonn y la Universidad Sapienza en Roma, ha examinado a fondo si las GNN realmente aprenden las interacciones proteína-ligando para predecir la fuerza de un compuesto activo enlazado a una proteína objetivo.
Desmitificando el proceso de predicción de las GNN
En un estudio publicado en Nature Machine Intelligence, se analizaron seis arquitecturas diferentes de GNN utilizando el método «EdgeSHAPer» desarrollado especialmente. Este método se diseñó para determinar la importancia de los bordes en las predicciones y la delimitación de subgráficos que las determinan. Los investigadores querían saber si las GNN aprenden las interacciones más importantes entre un compuesto y una proteína y, por lo tanto, predicen la potencia del ligando como se espera.
«Las GNN son muy dependientes de los datos con los que se entrenan», advierte Andrea Mastropietro, autor principal del estudio y doctorando en la Universidad Sapienza de Roma. Las GNN se entrenaron con grafos extraídos de estructuras de complejos proteína-ligando, cuyos modos de acción y fuerza de unión ya eran conocidos experimentalmente.
El desencadenante del efecto «Clever Hans» en las GNN
Según el análisis EdgeSHAPer, las seis GNN evaluadas básicamente fallaron en aprender las interacciones clave entre fármacos y proteínas. La mayoría de las GNN solo aprendieron algunas interacciones entre proteínas y fármacos, centrándose principalmente en los ligandos. «Para predecir la fuerza de unión de una molécula a una proteína objetivo, los modelos principalmente ‘recordaban’ moléculas químicamente similares que encontraron durante el entrenamiento, sin importar la proteína objetivo», comenta Bajorath.
Este fenómeno se asemeja en gran medida al efecto «Clever Hans», que involucra a un caballo que aparentemente podía contar. Sin embargo, se descubrió que el caballo no podía calcular en absoluto, sino que deducía resultados esperados a partir de matices en las expresiones faciales y gestos de su acompañante.
Implicaciones para la investigación en descubrimiento de medicamentos
Bajorath sostiene que «generalmente no es sostenible que las GNN aprendan interacciones químicas entre sustancias activas y proteínas». Asegura que las predicciones de estas redes están sobrevaloradas, ya que se pueden hacer pronósticos de calidad equivalente utilizando conocimientos químicos y métodos más simples.
Sin embargo, Bajorath destaca que el estudio también presenta oportunidades para la IA. Algunos de los modelos GNN examinados mostraron una clara tendencia a aprender más interacciones cuando la potencia de los compuestos de prueba aumentaba. «Vale la pena investigar más a fondo aquí», comenta Bajorath. Tal vez estos GNN podrían mejorarse aún más en la dirección deseada mediante representaciones y técnicas de entrenamiento modificadas.
Desmitificando la magia negra de la IA
«Aunque la IA no es magia negra», advierte Bajorath, su equipo ha publicado herramientas de análisis especializadas, como EdgeSHAPer, que ofrecen enfoques prometedores para arrojar luz sobre la caja negra de los modelos de IA. Actualmente, su equipo se centra en GNN y nuevos «modelos de lenguaje químico». Bajorath sostiene que el desarrollo de métodos para explicar las predicciones de modelos complejos es una área crucial de investigación en IA.
«Pronto veremos avances emocionantes en el campo de la ‘IA Explicable’ en el Instituto Lamarr, donde soy investigador principal y presidente de IA en Ciencias de la Vida», concluye Bajorath, resaltando el potencial continuo de la inteligencia artificial en la investigación farmacéutica.