eggNOG-mapper v2: anotación funcional eficiente de genomas y metagenomas

La anotación funcional de genomas y metagenomas es un paso clave en esta época de secuenciación masiva de ADN. La nueva versión de eggNOG-mapper, publicada en Molecular Biology and Evolution, provee un método eficiente de anotación de secuencias de ADN y proteínas, basado en filogenias precalculadas a partir de la base de datos de ortólogos eggNOG.

 

A día de hoy no es realista aspirar a determinar experimentalmente la función de todos los genes que se secuencian. Por ello, es necesario contar con herramientas informáticas que transfieran el conocimiento que existe para unos genes a otros que puedan estar llevando a cabo la misma función. Estos programas informáticos, conocidos como “de anotación funcional”, buscan genes relacionados evolutivamente (homólogos), bajo la premisa de que la función de estos genes estará conservada en mayor o menor medida. Sin embargo, los genes homólogos no siempre realizan la misma función. Por ejemplo, una de las formas más comunes de evolución en familias de proteínas es por duplicación de un gen, de forma que con el tiempo una copia conserva la función original mientras que la otra puede derivar hacia el cometido de una función distinta. Así, los genes relacionados por eventos de duplicación (parálogos) no conservan tan a menudo la función como aquellos relacionados por eventos de especiación (ortólogos).

Sin embargo, la discriminación de parálogos y ortólogos es computacionalmente más exigente que la mera detección de genes homólogos. Debido a esto, y al incremento exponencial en el volumen de secuencias obtenidas en los últimos años, por el extendido uso de las tecnologías de secuenciación masiva, muchos programas utilizan métodos de homología para realizar la anotación funcional. EggNOG-mapper aprovecha la base de datos de ortólogos eggNOG para refinar las predicción de anotación funcional en base a filogenias precalculadas, que se obtienen a partir de los genomas completos de un gran número de organismos que abarcan toda la filogenia. Al usar estas filogenias precalculadas, eggNOG-mapper alcanza un compromiso entre la velocidad de los métodos de homología y la precisión de los métodos de ortología.

Esta segunda revisión de eggNOG-mapper aporta una serie de optimizaciones que lo hacen más eficiente, así como numerosas nuevas opciones para adaptar el análisis a distintas capacidades computacionales (desde workstations hasta equipos de altas prestaciones), y a diferentes objetivos de investigación (desde el análisis lecturas de secuenciación individuales en un rango taxonómico específico, hasta la anotación genomas completos o de metagenomas). Además, eggNOG-mapper v2 incluye nuevas fuentes de anotación funcional, como la anotación de dominios de proteínas o la producción de listados de ortología. Por último, se ha optimizado el servicio web que posibilita la anotación funcional de cientos de miles de secuencias a cualquier tipo de usuario.

zoom
Figure: schematic of the functional annotation workflow performed by eggNOG-mapper v2.

Publicación Original:

Cantalapiedra, C.P., Hernández-Plaza, A., Letunic, I., Bork, P., Huerta-Cepas, J. 2021. eggNOG-mapper v2: Functional Annotation, Orthology Assignments, and Domain Prediction at the Metagenomic Scale. Molecular Biology and Evolution. DOI: 10.1093/molbev/msab293


Imprimir