Los análisis metagenómicos se realizan bajo la creencia de que pueden proporcionar una visión cuantitativa de la abundancia relativa de las especies en una muestra desconocida. Sin embargo, sabemos que las múltiples reacciones que se producen durante los pasos de preparación y análisis de la muestra tienden a producir sesgos - en particular, la amplificación preferente de unas secuencias sobre otras. En este estudio, intentamos cuantificar el grado al cual se sesga la salida y, con suerte, identificar la fuente más probable de este sesgo.
Usando una muestra compuesta de las mismas cantidades de ADN de 48 especies de plantas y 6 de los primers más usados como "códigos de barras", ejecutamos una secuencia de pasos típica de análisis metagenómico. En cada paso, se re-muestreó el resultado y se cuantificó la aparente abundancia de especies en esa fase, renormalizando las muestras para continuar. Así, concluimos que el resultado final de un estudio metagenómico se puede sesgar hasta en 2000 folds!
Hemos encontrado una correlación entre los valores Cq y el sesgo de la qPRC. Sin embargo, este hecho no explica todas las observaciones del sesgo. Resulta interesante que algunas fuentes significativas de sesgo parecen proceder de alguna característica de la secuencia que se amplifica, y no (como esperábamos) de hechos relacionados con la imperfección del calentamiento de la cadena primer aplicón contra las secuencias divergentes. Ahora realizaremos un análisis de las secuencias para intentar determinar los tipos de características de la secuencia que produce el sesgo en la amplificación. Si este nuevo análisis fuera exitoso, sería posible construir un algoritmo de normalización posterior a la experimentación que corregiría estos sesgos y, por lo tanto, dara un perfil más preciso de la abundancia de especies en las muestras del entorno.
Quantitative evaluation of bias in PCR amplification and next-generation sequencing derived from metabarcoding samples - DOI:10.1007/s00216-014-8435-y