Una guía para los métodos y software de predicción de estructura de proteínas.

Para ejercer sus funciones biológicas, las proteínas se pliegan en una o más conformaciones específicas, dictadas por interacciones no covalentes complejas y reversibles. La determinación de la estructura de una proteína puede lograrse mediante técnicas que requieren mucho tiempo y son relativamente caras, como la cristalografía, la espectroscopía de resonancia magnética nuclear y la interferometría de polarización dual. El software de bioinformática se ha desarrollado para calcular y predecir estructuras de proteínas en función de sus secuencias de aminoácidos.

Un resumen de la estructura de la proteína.

Como alternativa a las técnicas experimentales, las herramientas de análisis y predicción de estructuras ayudan a predecir la estructura de las proteínas de acuerdo con sus secuencias de aminoácidos. Resolver la estructura de una proteína dada es muy importante en la medicina (por ejemplo, en el diseño de fármacos) y en la biotecnología (por ejemplo, en el diseño de nuevas enzimas). El campo de la predicción computacional de proteínas está evolucionando constantemente, siguiendo el aumento en el poder computacional de las máquinas y el desarrollo de algoritmos inteligentes.

Hay cuatro niveles de estructura proteica (figura 1). En la predicción de la estructura de la proteína, la estructura primaria se usa para predecir las estructuras secundarias y terciarias.

Las estructuras secundarias de las proteínas se localizan plegándose dentro de la cadena de polipéptidos que se estabiliza mediante enlaces de hidrógeno. Las estructuras proteicas secundarias más comunes son las hélices alfa y las láminas beta.

La estructura terciaria es la forma final de la proteína una vez que las diferentes estructuras secundarias se han plegado en una estructura 3D. Esta forma final se forma y se mantiene unida a través de la interacción iónica, puentes disulfuro y fuerzas de van de Waals.

Cuatro niveles de estructura proteica. Imagen de Khanacademy.org.

Métodos y software de predicción de estructura de proteínas.

Se desarrolla una gran cantidad de software de predicción de estructuras para características y particularidades específicas de proteínas, como predicción de trastornos, predicción dinámica, predicción de conservación de estructuras, etc. Los enfoques incluyen modelado de homología, enhebrado de proteínas, métodos ab initio, predicción de estructura secundaria y hélice transmembrana y predicción del péptido señal.

Elegir el método correcto siempre comienza usando la secuencia primaria de la proteína desconocida y buscando homólogos en la base de datos de proteínas (figura 2).

Cuadro de toma de decisiones para el método de predicción de estructura de proteínas.

Aquí hay algunos métodos detallados para la predicción de la estructura de la proteína:

  • Herramientas de predicción de estructura secundaria.

Estas herramientas predicen estructuras secundarias locales basadas solo en la secuencia de aminoácidos de la proteína. Las estructuras predichas se comparan con la puntuación DSSP, que se calcula en función de la estructura cristalográfica de la proteína (más información sobre la puntuación DSSP aquí).

Los métodos de predicción para la estructura secundaria se basan principalmente en bases de datos de estructuras proteicas conocidas y métodos modernos de aprendizaje automático, como redes neuronales y máquinas de vectores de soporte.

Aquí hay una gran herramienta para la predicción de estructura secundaria.

  • Estructura terciaria

Las herramientas de predicción de estructuras terciarias (o tridimensionales) se dividen en dos métodos principales: Ab initio y modelado comparativo de proteínas.

Los métodos de predicción de estructuras de proteínas ab initio (o de novo) intentan predecir estructuras terciarias a partir de secuencias basadas en principios generales que rigen la energía de plegamiento de proteínas y / o tendencias estadísticas de características conformacionales que adquieren las estructuras nativas, sin el uso de plantillas explícitas.

Toda la información sobre la estructura terciaria de una proteína está codificada en su estructura primaria (es decir, su secuencia de aminoácidos). Sin embargo, se puede predecir una enorme cantidad de ellos, entre los cuales solo uno tiene la energía libre mínima y la estabilidad necesarias para plegarse correctamente. Por lo tanto, la predicción de la estructura de la proteína Ab initio requiere una gran cantidad de potencia computacional y tiempo para resolver la conformación nativa de una proteína, y sigue siendo uno de los principales desafíos para la ciencia moderna.

Los servidores más populares incluyen Robetta (usando el paquete de software Rosetta), SWISS-MODEL, PEPstr, QUARK. Explore una lista exhaustiva aquí.

Si una proteína de estructura terciaria conocida comparte al menos el 30% de su secuencia con un homólogo potencial de estructura indeterminada, se pueden utilizar métodos comparativos que superponen la supuesta estructura desconocida con lo conocido para predecir la estructura probable de lo desconocido. El modelado de homología y el enhebrado de proteínas son dos estrategias principales que utilizan información previa sobre otras proteínas similares para proponer una predicción de una proteína desconocida, en función de su secuencia.

El software de modelado de homología y subprocesamiento de proteínas incluye RaptorX, FoldX, HHpred, I-TASSER y más.

Referencias

Predicción de estructura proteica de novo. Wikipedia

Predicción de estructura proteica. Wikipedia