Comparación de métodos de optimización de la población de entrenamiento en selección genómica

La selección genómica es una herramienta de mejora que utiliza información genómica para estimar el valor fenotípico de un individuo. Su efectividad depende de la calidad de la población de entrenamiento empleada para construir el modelo predictivo. Se han descrito numerosos algoritmos para seleccionar dicha población, pero no existe una comparación sistemática entre ellos, dificultando su aplicación.

 

En nuestro trabajo hemos comparado una amplia variedad de algoritmos de optimización de la composición de la población de entrenamiento en 7 conjuntos de datos pertenecientes a 6 cultivos distintos y con diversos niveles de estructura poblacional, arquitectura genética y heredabilidad. Asimismo, hemos descrito una nueva metodología basada en información genómica para determinar el tamaño óptimo de la población de entrenamiento. Nuestro estudio ha permitido obtener un conocimiento clave para orientar las estrategias de construcción de poblaciones de entrenamiento en selección genómica. CDmean y Avg_GRM_self fueron los mejores criterios para la optimización del conjunto de entrenamiento. Se necesita un tamaño del conjunto de entrenamiento del 50-55% (dirigido) o del 65-85% (no dirigido) para lograr el 95% de la precisión.


zoom

Publicación Original:

Fernández-González, J., Akdemir, D., Isidro y Sánchez, J. 2023. A comparison of methods for training population optimization in genomic selection. Theoretical and Applied Genetics 136, 30. DOI: 10.1007/s00122-023-04265-6


Imprimir