Impresión artística de la estructura de algunas proteínas - AlphaFold
Hace un año AlphaFold publicaba una base de datos que incluía la estructura prevista de cerca de un millón de proteínas. Eso incluía todas las proteínas humanas y alguna que otra más. Pero acaba de publicar una actualización masiva de su base de datos que la multiplica por algo más de 200; ahora incluye la estructura casi todas las proteínas conocidas. Su uso es libre y gratuito.
Según la nota de prensa, «ahora incluye las estructuras predichas para plantas, bacterias, animales y otros organismos, lo que abre muchas nuevas oportunidades para que los investigadores utilicen AlphaFold para avanzar en su trabajo sobre temas importantes, como la sostenibilidad, la inseguridad alimentaria y las enfermedades olvidadas.»
Como comenté en su momento, disponer de esta base de datos es importantísimo, pues el funcionamiento de las proteínas depende su estructura 3D. Y conocerla es de gran interés para el estudio de su funcionamiento y por tanto para el estudio de nuestro organismo, de algunas enfermedades, y para el desarrollo de posibles tratamientos y fármacos. Con la ampliación, se abren muchísimas posibilidades más.
Antes de AlphaFold sólo podíamos determinar la estructura mediante técnicas como por ejemplo la cristalografía de rayos X o la criomicroscopía electrónica. Pero son procesos muy complicados y costosos tanto en tiempo como en recursos.
AlphaFold, por el contrario, lo que hace es aplicar técnicas de inteligencia artificial para predecir la forma de la estructura 3D de una proteína a partir de la secuencia de aminoácidos que la forman. Y aquí la palabra clave es predecir: en la primera versión de la base de datos de hace un año se estimaba que sólo el 38% tiene una probabilidad muy alta de que la predicción sea correcta. Y basta con que la posición de la predicción y la estructura real difieran en más de 0,3 ángstrom –un ángstrom es la diezmilmillonésima parte del metro: 0,0000000001 metros– como para que sus propiedades cambien. Y, de nuevo en la versión original de la base de datos, AlphaFold tiene una media de error de 1,6 ángstrom.
Pero en cualquier caso, como decía hace un año, las predicciones de AlphaFold son un avance importantísimo, ya que evitarán hacer muchas pruebas a ciegas y ayudarán a apuntar en la dirección adecuada el estudio de proteínas y el diseño de posibles tratamientos.