Resumen:
|
[EN] The use of NGS technologies for the genetic diagnosis of hereditary diseases is becoming increasingly common.
During the variant calling process, the values of Depth and Var/Depth for each sequenced position are ...[+]
[EN] The use of NGS technologies for the genetic diagnosis of hereditary diseases is becoming increasingly common.
During the variant calling process, the values of Depth and Var/Depth for each sequenced position are obtained. These values indicate the number of reads obtained for that position, and the ratio between the number of reads for the alternative allele and the total number of reads obtained for that position. In theory, a heterozygous variant (1 copy of the reference allele and 1 copy of the alternative allele) should have a V/D close to 0.5. However, factors such as the Depth or the complexity of the sequence analyzed (homopolymer, GC rich regions, homology regions, etc.) can alter the V/D value (moving it away from the theoretical ratio of 0.5) and can raise doubts about the presence of these variations in the sample.
Currently, the presence of a variant with probable clinical relevance must be confirmed by Sanger sequencing, the Gold Standard for sequencing in most laboratories. This confirmation represents an extra cost, and can represent a significant expense depending on the number of variants detected by NGS. This expense increases exponentially when a large number of genes are analyzed as in exome analysis.
In this context, the aim of this study is to empirically determine a V/D threshold value that will allow us to discriminate a priori between a false positive and a false negative, avoiding performing the additional Sanger sequencing confirmation. To do this, we will select and confirm by Sanger sequencing a large number of variants identified by means of exome analysis and that have a V/D value far from the theoretical value of a heterozygous variant (0.5). The data obtained will be subjected to a statistical analysis in order to establish this V/D threshold value. The determination of the cut-off point is helpful since it allows increasing the benefit-efficiency ratio of the genetic diagnosis using NGS.
[-]
[ES] El uso de las tecnologías de secuenciación masiva (NGS) para el diagnóstico de enfermedades de origen genético es cada vez más frecuente.
En el proceso de identificación de variantes mediante NGS, para cada posición ...[+]
[ES] El uso de las tecnologías de secuenciación masiva (NGS) para el diagnóstico de enfermedades de origen genético es cada vez más frecuente.
En el proceso de identificación de variantes mediante NGS, para cada posición secuenciada se obtienen unos valores de Depth (D) y Var/Depht (V/D), que indican el número de lecturas obtenidas para esa posición, y el ratio entre el número de veces que se detecta el alelo alternativo con respecto a las lecturas totales para esa posición. Teóricamente, una variante en heterocigosis (1 copia del alelo de referencia y 1 copia del alelo alternativo) debería tener un V/D en torno al 0.5. No obstante, factores como el Depth o la complejidad de la secuencia analizada (zonas de homopolímeros, zonas ricas en GC, zonas de homología etc.) pueden alterar el ratio V/D (alejándolo del ratio teórico de 0.5) y creando, por tanto, dudas acerca de la verdadera presencia de la variante en la muestra analizada.
Actualmente la presencia de una variante con posible relevancia clínica ha de ser confirmada mediante secuenciación Sanger, ya que se trata de la metodología Gold Standard de secuenciación en la mayoría de laboratorios. Esta confirmación representa un coste adicional para estos estudios, pudiendo llegar a suponer un gasto relevante en función del número de variantes detectadas mediante NGS. Este gasto se incrementa de forma exponencial con un mayor número de genes analizados, como es el caso del exoma diagnóstico.
En este contexto, el objetivo del presente trabajo consiste en determinar el valor umbral de V/D, que permita esclarecer a priori la presencia o ausencia de una variante detectada por NGS, sin necesidad de realizar su confirmación por secuenciación Sanger. Para ello se llevará a cabo la selección y confirmación mediante secuenciación Sanger, de un elevado número de variantes con un V/D discrepante del teórico 0.5, identificadas en muestras de exoma. Estos datos serán sometidos a un análisis estadístico para el establecimiento del valor umbral de V/D que nos permita discriminar entre la presencia de un falso positivo frente a un verdadero positivo. La determinación de dicho punto de corte es de gran ayuda ya que permite aumentar el beneficio coste-eficiencia del diagnóstico genético mediante NGS.
[-]
|