Un bioinformático reconocido en Alemania | Portal del Ingresante | Universidad Nacional de Entre Ríos

Un bioinformático reconocido en Alemania

estudiante en una clase

Gonzalo Parra es oriundo de Córdoba, terminó su secundario en San Luis y viajó a Oro Verde para  ingresar a la Facultad de Ingeniería de la UNER en el año 2006, como parte de la primer camada de la Licenciatura en Bioinformática.

En diciembre del 2010 se recibió de Licenciado en Bioinformática, con una tesis producida junto a Cristian Rohr, centrada en encontrar genes que regulen el estado de pluripotencialidad en células madre embrionarias. Al año siguiente, comenzó un Doctorado en el Laboratorio de Fisiología de Proteínas de la Universidad de Buenos Aires, gracias a una beca CONICET, bajo la dirección del Dr. Diego Ferreiro. Actualmente reside en Goettingen, Alemania.Recientemente, uno de sus artículos fue elegido como cover del número de Junio en la revista Plos Computational Biology http://journals.plos.org/ploscompbi...

Acerca de la Tesis Doctoral
Defendió su tesis en el 2016, la cual se enfocaba en intentar entender cómo se pliegan las proteínas: “en particular estábamos interesados en unas proteínas que se llaman repetitivas –explica Gonzalo– que están formadas por unidades estructurales muy parecidas entre sí, que les dan una naturaleza modular. Estas proteínas en las células se encargan de reconocer a otras proteínas y moléculas con una afinidad muy grande de la misma forma que los anticuerpos pero con la ventaja que están codificadas en una única cadena polipeptidica”.

Esa característica explica que en los últimos años “muchos grupos en el mundo han usado este tipo de proteínas para diseñar proteínas que unan blancos específicos dentro de las células ya que se puede hacer un aleatorización de la secuencia de las mismas y generar combinatorias, en donde de alguna forma siempre podemos encontrar una proteína de este tipo que va a unir lo que nosotros nos interesa. Luego esa molécula es optimizada y estudiada en más detalle. De todas formas, los diseños son todavía muy rudimentarios y no son tan eficientes como las moléculas que se encuentran naturalmente en las células", expresa Gonzalo. En definitiva, “nosotros intentamos entender como la naturaleza diseña estas moléculas de forma eficiente”, sintetiza.
El trabajo en cuestión

Junto con otra estudiante del Doctorado, Rocío Espada, Gonzalo estudió durante 5 años las secuencias, las estructuras, la energética y las dinámicas de estas proteínas. “Fue un trabajo muy lindo, y complementario, ya que Rocío es Licenciada en Física y actualmente Doctora, y su Director (Ferreiro) es un Biólogo especializado en biofísica”.

“¿Que hicimos en este último trabajo? A modo de introducción –explica Gonzalo, detenidamente– una proteína se sintetiza en la célula como un polímero lineal que se puede representar como una secuencia de letras donde cada una de las 20 letras representa un aminoácido diferente. Luego esa secuencia, de alguna forma en el interior de la célula se pliega hacia un conjunto de estructuras tridimensionales que están en equilibrio. Estas estructuras se interconvierten entre sí (es decir, la proteína se mueve) y confieren la función especifica de la proteína. El problema es que la estructura es difícil de conseguir y el problema central de la Bioinformática ha sido desde casi el principio intentar predecir las estructuras de las proteínas a partir de la secuencia. Esto se puede hacer medianamente bien si se conoce la estructura de una parienta de la proteína porque asumimos que sus estructuras van a ser parecidas. Pero de nuevo, ¿qué pasa si no tenemos ninguna parienta con estructura conocida?", pregunta el investigador.

Avances y aciertos
El Dr. Parra cuenta que hace algunos años apareció una técnica que permite predecir la estructura de una proteína a partir de alineamientos de secuencias. "Si bien no es lo que idealmente quisiéramos (dada una secuencia, te predigo la estructura) es posible ahora predecir la estructura de una proteína si conocemos un numero suficiente de proteínas emparentadas con la misma”.

Implícitamente, esta técnica explota el concepto de “familia” de proteínas en donde se asume que todas las secuencias de la misma derivan de un único antecesor común. A partir de ese origen común, las secuencias fueron acumulando mutaciones a lo largo de su historia evolutiva hasta que en el día de hoy, vemos que si bien guardan rasgos en común (al igual que las familias humanas donde podemos decir: tiene la nariz de la madre y los ojos del padre) todos los miembros de la familia tienen sus propias particularidades para poder adaptarse al entorno en el cual funcionan. Otro concepto implícito al tratar con familias de proteínas es que todos los miembros tienen estructuras parecidas (porque además, se sabe que la estructura es robusta a los cambios en secuencia, es decir, que por mas que variemos la secuencia, en la mayoría de los casos la estructura cambia muy poco ya que se cambian ciertos aminoácidos por otros cuyas propiedades físico químicas son similares).

Entonces, la idea subyacente es que cuando un aminoácido en una posición de la proteína cambia, ese aminoácido tiene 3 posibles consecuencias: 1) estabilizar la estructura de la proteína, desestabilizarla o que al a estructura le de lo mismo. Las estructuras de proteínas no tienen que ser ni muy estables ni demasiado inestables para poder funcionar y existen en un delicado equilibrio energético. Entonces, cuando se produce una mutación, dicho equilibrio debe mantenerse para que la proteína pueda seguir funcionando. Al cambiar un residuo, dicho cambio tiene que ser compensado por los aminoácidos con que este aminoácido interactúa en la estructura. Para hacer una analogía, sería algo así como si cambiamos el tipo de tornillo que usamos para sujetar algo (plano o fisher) tenemos que cambiar también el destornillador para poder manipularlo o de otra forma no podremos hacerlo.

Entonces cuando alineamos las proteínas de una familia (es decir superponemos las partes que son parecidas entre todas) podemos analizar los patrones de cambio en cada posición. No solo eso, podemos analizar si los patrones de cambio en una posición, están acoplados con los patrones de cambio de alguna otra posición y si esto sucede es entonces un indicio de que esas dos posiciones están en contacto físico, ya que lo que observamos es una compensación. Al comparar los patrones de cambio de todas las posiciones contra todas las posiciones podemos entonces predecir todos los pares de posiciones que están en contacto en la estructura tridimensional.

“Cuando hemos obtenido la lista de posiciones que están en contacto físico, podemos aplicar técnicas de simulación computacional y predecir las estructuras de integrantes particulares de la familia que estudiamos. Esto fue una revolución en el campo y funciona bastante bien para ciertos casos (no todos). Entre esos casos en los que esto no funciona, están las proteínas repetitivas porque como pueden tener diferentes largos (diferente números de repeticiones) los resultados que se obtienen son totalmente erróneos".

En el laboratorio de Fisiología de Proteínas se trabaja hace varios años generando nuevos métodos y adaptando los ya existentes para poder aplicarlos a estar proteínas en particular. En un trabajo reciente titulado “Capturing coevolutionary signals in repeat proteins” (capturando señales de co-evolución en proteínas repetitivas), liderado por la Dra. Rocío Espada, con colaboradores en Francia (Ecole Normale Supérieure) hemos adaptado el método anteriormente mencionado a este tipo de arquitecturas proteicas. Pero no nos quedamos allí, en nuestro último trabajo titulado “Inferring repeat-protein energetics from evolutionary information” (infiriendo la energética de proteínas repetitivas a partir de información evolutiva) fuimos uno par de pasos más allá y usamos la técnica de medir la coevolución de posiciones para generar una función energética que nos permita hacer dos cosas:

1) Dada una secuencia, predecir el impacto energético que tendría una mutación: actualmente para poder medir el impacto energético de una mutación en una proteína es necesario contar con la estructura de la misma, realizar la mutación y poder medir el cambio energético en la nueva estructura generada. Con nuestra técnica, adaptada a proteínas repetitivas, podemos medir el cambio energético a partir de las secuencias aún cuando la estructura no es conocida. Para ver que tan bien funciona nuestro método, generamos una base de datos con todas las mutaciones que se conocen experimentalmente para proteínas repetitivas de las familias más conocidas y para las cuales se conoce de forma experimental el cambio energético que las mismas producen. Pudimos observar que nuestro método predice de mejor forma los cambio energéticos que aquellos métodos que usan la estructura de las proteínas realizar la predicción. Esto es importante para poder mejorar el diseño de proteínas sintéticas, manipulando la energía de las mismas y también por ejemplo, para entender la razón de porque hay ciertas mutaciones en ciertas proteínas que producen patologías como ciertos tipos de cáncer.

2) Explorar el espacio de secuencias posibles para una familia
Usamos esta función energética para generar a partir de secuencias al azar, mutaciones de forma iterativa hasta que la energía de las mismas sea compatible con los patrones energéticos de la familia a partir de la cual hemos entrenado la función. Al analizar que tipos de secuencias podemos generar, pudimos observar que muchas de las mismas no son parecidas a las que se conocen actualmente y que sin embargo son idénticos en su energía y composición a los miembros conocidos. Esto es importante porque entonces es posible diseñar proteínas nuevas sin usar como molde los patrones de secuencias de proteínas naturales y expandir el abanico de posibilidades.

Las proteínas repetitivas de diseño tienen múltiples aplicaciones biotecnológicas entre las que se encuentran el diseño de bloqueadores específicos de ciertas proteínas implicadas en ciertos tipos de cáncer, delivery de drogas dentro de tumores o a ciertos compartimentos del organismo, inhibidores o activadores de proteínas claves en ciertas rutas metabólicas y demás.

Futuros proyectos
El Dr. Gonzalo Parra realizó el postdoctorado en el Instituto Max Planck de Biofísica Química en Alemania. Actualmente ha cambiado el foco de su investigación inicial , ya que está trabajando en lo que denomina Transcriptomica de célula única, que consiste en analizar los perfiles de expresión de células a lo largo de un proceso dinámico como por ejemplo, el desarrollo embrionario. "Estoy desarrollando algoritmos y programas para estudiar este tipo de datos y encontrar por ejemplo que genes son responsables en la progresión tumorigenica en ciertos tipos de cáncer o entender como las células toman decisiones a lo largo del desarrollo de células sanguíneas o neuronales a partir de células madre multipotentes", expresa Parra.

En principio, su idea, es quedarse en Alemania algunos años para adquirir experiencia y luego volver a Argentina “y poder juntar lo que he aprendido en diferentes campos a lo largo de mi carrera en una línea propia en la cual poder desarrollarme como investigador, tal vez dentro del CONICET”.

 Notas vinculadas
“Hemos tenido la suerte de hacer un trabajo muy productivo en  los últimos años en los que hemos podido publicar múltiples artículos  relacionados al tema que les comenté”, comenta Gonzalo.
Protein Repeats from First Principles.
Structural and Energetic Characterization of the Ankyrin Repeat Protein Family.
Repeat proteins challenge the concept of structural domains.
Capturing coevolutionary signals inrepeat proteins.
Detecting repetitions and periodicities in proteins by tiling the structural space.
RepeatsDB: a database of tandem repeat protein structures.
//www.graduados.uner.edu.ar

Fuente: Área de Comunicación - Facutlad de Ingeniería