Resumen:
|
[ES] Los virus de ARN son conocidos agentes causantes de algunas enfermedades graves en los seres humanos como la influenza, el VIH, la hepatitis C, Ébola, SARS, MERS o el reciente brote de la COVID19. La evolución de estos ...[+]
[ES] Los virus de ARN son conocidos agentes causantes de algunas enfermedades graves en los seres humanos como la influenza, el VIH, la hepatitis C, Ébola, SARS, MERS o el reciente brote de la COVID19. La evolución de estos virus está impulsada por una tasa de mutación relativamente alta en comparación con los virus de ADN, así como por procesos de intercambio genético, que incluyen redistribución y recombinación. Este último puede ocurrir cuando dos o más virus relacionados coinfectan una misma célula, y se ha demostrado que desempeña un papel fundamental en la capacidad de los virus de ARN (e.g. MERS) para ampliar su rango de infección a humanos. Generalmente, se reconoce la evolución vertical como el cambio genético que se produce a través de generaciones, mientras que los procesos evolutivos horizontales incluyen el intercambio genético entre distintas variantes. La reconstrucción filogenética es uno de los métodos más comúnmente empleados para representar la divergencia de especies debida a la evolución vertical. Sin embargo, los árboles filogenéticos no logran captar los procesos horizontales, en parte porque están limitados a un espacio bidimensional. El Análisis Topológico de Datos (por sus siglas en inglés, TDA) es una aplicación emergente de la topología algebraica en estudios evolutivos que permite inferir procesos horizontales a partir de bases de datos genómicos de gran tamaño. Las conclusiones se extraen a partir de las propiedades topológicas de los datos representados en mayores dimensiones, aplicando herramientas matemáticas fundamentadas en la homología persistente. En estudios previos se ha aplicado la metodología de TDA para la caracterización de redistribución en influenza aviar H7N9 y de recombinación en VIH-1. En la misma línea de investigación, el objetivo de este trabajo es deducir patrones de recombinación en conjuntos de datos de secuencias virales de ARN de gripe aviar, coronavirus en murciélagos, MERS y SARS-CoV-2. Nuestros resultados proporcionan una mayor comprensión de la aplicación de TDA al análisis de secuencias biológicas y contribuyen a la interpretación de la evolución horizontal de los virus de ARN. Más concretamente, la identificación de los eventos de recombinación que se producen entre los coronavirus de murciélago. Asimismo, destacamos el potencial de TDA como una herramienta útil para la evolución de estos virus en los reservorios naturales antes de que emerjan como enfermedades que infectan a los seres humanos, como el SARS-CoV-2.
[-]
[EN] RNA viruses can cause known severe diseases in humans, such as influenza, HIV, Hepatitis C, Ebola, SARS, MERS, or the recent outbreak of COVID19. The evolution of these viruses is driven by a relatively high mutation ...[+]
[EN] RNA viruses can cause known severe diseases in humans, such as influenza, HIV, Hepatitis C, Ebola, SARS, MERS, or the recent outbreak of COVID19. The evolution of these viruses is driven by a relatively high mutation rate compared to DNA viruses, as well as genetic exchange events, which involve reassortments and recombination. The latter can occur during co-infection of a cell with two or more related viruses and has been shown to play a key role in the ability of RNA viruses (e.g., MERS) to expand their host range to humans. Vertical evolution is generally acknowledged as the genetic changes occurring over generations, whereas horizontal evolutionary processes include genetic exchange between variants. Phylogenetic reconstruction is one of the most common methodologies to represent species divergence due to vertical evolution. However, phylogenetic trees fail to capture horizontal events, partially because they are limited to a two-dimensional space. An emerging application of algebraic topology to evolutionary studies, Topological Data Analysis (TDA), allows us to infer horizontal evolutionary events from large amounts of genomic data. Conclusions are drawn from the topological properties of the data represented in higher dimensions, applying mathematically well-founded persistent homology tools. A TDA methodology has been previously applied to study reassortment in H7N9 avian influenza and recombination of HIV-1. In this work, we expand this study inferring recombination patterns in data sets of RNA viral sequences of avian influenza, bat coronaviruses, MERS, and SARS-CoV2. Our results provide further insight into the application of TDA to biological sequence analysis and contribute to the understanding of horizontal evolution of RNA viruses. More specifically, the identification of recombination events occurring among bat coronaviruses opens the door for TDA to become a tool to track the evolution of these viruses in natural reservoirs before they emerge as human-infecting diseases, such as SARS-CoV-2.
[-]
|