ANÁLISIS DE LAS RELACIONES ESTRUCTURA-FUNCIÓN EN EL VIRUS DEL ARABESCO DEL PELARGONIUM Una prospección realizada recientemente en España ha puesto de manifiesto que el virus del arabesco del Pelargonium (Pelargonium line pattern virus, PLPV) es el agente de tipo viral más frecuente en geranio (Pelargonium spp.) con porcentajes de incidencia que oscilan entre el 40 y el 90% dependiendo del área geográfica examinada. Una situación similar es previsible en países de nuestro entorno y, probablemente, en otros más alejados. Se trata de un virus con partículas isométricas y un genoma monopartido de RNA de simple cadena y polaridad positiva cuyas infecciones naturales parecen restringidas a especies del género Pelargonium, aunque experimentalmente puede infectar especies muy diversas. Dada la escasez de datos sobre el PLPV y la importancia que el virus está adquiriendo como patógeno, en esta tesis hemos pretendido profundizar en sus características biológicas y moleculares. El primer objetivo abordado en este trabajo ha sido determinar la secuencia nucleotídica completa de su RNA genómico (gRNA). Esta molécula está constituida por 3883 nt y, mediante análisis in silico, inicialmente identificamos seis marcos abiertos de lectura (ORFs) que potencialmente codificaban proteínas de 27 (p27), 13 (p13), 87 (p87), 7 (p7), 6 (p6), y 37 kDa (p37). Estas ORFs están flanqueadas por una región no traducible (UTR) en 5´ inusualmente corta, con sólo 6 nt, y por una 3´ UTR de 246 nt. Tanto la organización de las ORFs en el RNA viral como la mayoría de sus productos potenciales se asemejaban mucho a los implicados en replicación (p27 y p87), movimiento (p7) y encapsidación (p37) de miembros del género Carmovirus (familia Tombusviridae). A pesar de las semejanzas que compartía el PLPV con miembros de dicho género, los carmovirus producen dos RNAs subgenómicos (sgRNAs) para la síntesis de las proteínas de movimiento y de cubierta, mientras que un análisis Northern indicó que el PLPV genera un solo sgRNA de aproximadamente 1.7 kb presumiblemente implicado en la traducción de las proteínas p7, p6 y p37. Además, la región central del genoma de los carmovirus contiene dos pequeñas ORFs normalmente en distintas fases de lectura y con codones de iniciación canónicos que codifican dos proteínas de movimiento. Sin embargo, solo la p7 potencialmente codificada por el PLPV mostraba homología significativa con proteínas de movimiento mientras que no se encontraron homólogos claros para la p6 (cabe reseñar que tampoco para la p13). Además esta p6 debía ser expresada a partir de una ORF con un codón de iniciación no canónico y/o, alternativamente, mediante un mecanismo de “-1 frameshift” (FS) o de corrimiento de pauta de lectura que se produciría inmediatamente aguas arriba del codón de parada de la ORF (p7), generándose una proteína de 12 kDa (p7-FS ó p12). Esta posibilidad estaba apoyada por la presencia, inmediatamente aguas arriba de dicho codón de parada, de un heptanucleótido cuya secuencia se ajusta al motivo característico de este tipo de mecanismo, y por la posible formación de una estructura de tipo horquilla aguas abajo del mencionado codón. Es destacable que tanto la organización de ORFs como las estrategias de expresión génica predichas para el sgRNA del PLPV eran muy similares a las descritas para el único sgRNA del virus del mosaico del Panicum (PMV), que constituye el género Panicovirus dentro de la familia Tombusviridae. Además del PLPV, se habían descrito un conjunto de pequeños virus isométricos cuyas infecciones naturales parecían también restringidas a especies del género Pelargonium, entre los que se encontraban el virus de las manchas anulares de Pelargonium (Pelargonium ringspot virus, PelRSV) y el virus del anillo clorótico de Pelargonium (Pelargonium chlorotic ring pattern virus, PCRPV). Curiosamente el PCRPV codifica potencialmente cinco proteínas muy similares a las implicadas en replicación (p27 y p87), movimiento (p7 y p9) y encapsidación (p37) del género Carmovirus, pero produce un único sgRNA presumiblemente implicado en la traducción de las ORFs alejadas del extremo 5´ del gRNA y podría utilizar un mecanismo -1 FS para la traducción de una ORF interna de pequeño tamaño, al igual que había sido predicho para el PLPV. Algunos datos indican que estas características podrían ser compartidas por el PelRSV y por el virus latente de la baya del saúco (Elderberry latent virus, ELV) y, sobre la base de estas características comunes y de similitudes de secuencia, se propuso incluir a los cuatro agentes virales en un nuevo género dentro de la familia Tombusviridae, designado provisionalmente como Pelarspovirus. Las peculiaridades genómicas del PLPV (y su posible adscripción a un nuevo género) merecían sin duda ser estudiadas en mayor profundidad, por ello el siguiente objetivo fue la generación de un clon infeccioso del virus para llevar a cabo un análisis detallado de las relaciones estructura-función en el patógeno. Con esta finalidad, fusionamos un cDNA viral de longitud completa al promotor de la RNA polimerasa del fago T7 y lo ligamos a un vector de clonación de alto número de copias. Los transcritos generados in vitro a partir de la construcción resultante se inocularon mecánicamente en distintos huéspedes experimentales. Los resultados mostraron que los RNAs del PLPV sintetizados in vitro daban lugar a infecciones indistinguibles de aquellas establecidas por el aislado viral de partida en plantas de C. quinoa, N. clevelandii y N. benthamiana. Disponer de esta herramienta nos permitió desarrollar estrategias para obtener información acerca del papel de las distintas ORFs en el ciclo biológico del virus y de los mecanismos que median su expresión. Mediante experimentos de traducción in vitro y bioensayos de distintos mutantes identificamos las ORFs biológicamente activas del PLPV y obtuvimos datos acerca de la(s) etapa(s) del ciclo infeccioso en la(s) que están involucradas. Las funciones predichas inicialmente para las ORFs (p27), (p87), presuntamente implicadas en replicación, y para las ORFs (p7) y (p37), en movimiento y encapsidación, respectivamente, eran consistentes con los resultados de este trabajo, mientras que las ORFs (p13) y (p6), inicialmente identificadas in silico, no eran traducidas in vitro ni requeridas in vivo, de modo que probablemente carecen de significado biológico. En su lugar se identificó una nueva ORF, localizada en la región central del genoma, que se traducía a partir de un codon débil de iniciación (GUG) y que daba lugar a una proteína de tamaño 9.7 kDa implicada en el movimiento del virus. Esta proteína, además, mostraba una notable identidad de secuencia (44,4%) con otra de tamaño 9.4 kDa, potencialmente codificada por una ORF del PCRPV también ubicada en la región central del genoma y cuyo codón de inicio era, asimismo, un triplete no-AUG, lo que ampliaba las semejanzas entre estos dos virus, ambos miembros provisionales del género propuesto Pelarspovirus. Una vez determinada la función de las proteínas codificadas por el PLPV se inició un estudio sobre las estrategias que utiliza este patógeno para la expresión de todos sus genes. Ensayos de traducción in vitro confirmaron que: i) el gRNA dirige la síntesis de las proteínas p27 y p87 de manera eficiente (la última mediante un mecanismo de lectura a través del codón de parada débil del gen p27), pese a carecer de una estructura cap en su extremo 5’, como ocurre en el resto de miembros de la familia Tombusviridae, y presentar una secuencia líder extremadamente corta (6 nt) y, ii) el sgRNA actúa como mRNA para la producción de las tres proteínas restantes, p7, p9.7 y p37, mediante escapes al proceso de rastreo o leaky-scanning. Estos procesos parecen estar favorecidos por el contexto subóptimo del codón de inicio del gen p7, por el codón débil de inicio (GUG) del gen p9.7, y por la ausencia de codones AUG adicionales en cualquier pauta de lectura en la región que precede al codón de inicio del gen p37 en el sgRNA. Por último se llevó a cabo un análisis de la variabilidad genética del PLPV para obtener información acerca de las presiones selectivas que operan sobre el genoma del virus. Para ello, se partió de una colección de aislados provenientes de plantas de P. zonale o P. peltatum con distintos orígenes geográficos y/o con diferentes fechas de recolección. La región genómica examinada, de 1817 nt, comprendía una región parcial del gen de la RdRp, los genes de las proteínas de movimiento (p7 y p9.7) y de la CP, y la 3’ UTR. El análisis de las secuencias obtenidas ha permitido determinar algunos de los factores que actúan limitando la heterogeneidad viral como son la conservación de las secuencias aminoacídicas de determinados dominios de las proteínas, y la preservación del plegamiento de regiones reguladoras del genoma viral. El estudio de covariaciones dentro y entre proteínas también ha permitido identificar una red potencial de interacciones específicas probablemente requerida para mantener la conformación correcta de las proteínas virales y para conducir al RNA viral desde el proceso de replicación hasta su diseminación en la planta. Adicionalmente, mediante pases seriados de un aislado del PLPV en el huésped experimental C. quinoa, se ha demostrado que este patógeno es capaz de evolucionar de forma muy rápida y reproducible cuando es transferido a una nueva especie vegetal. Esta observación pone de manifiesto el papel crítico que desempeñan las presiones selectivas ejercidas por el huésped en la estructura genética de las poblaciones del virus y sugiere que la tasa de mutación del PLPV es inusualmente elevada.