SIO - ayudando a las máquinas a examinar datos biológicos


Los informáticos frecuentemente dicen: "¡una de las mejores cosas que tienen los estándares es que hay muchos para elegir!" Solemos hacer esta broma porque es mejor reir que llorar... La proliferación de estándares es un problema interminable para los bioinformáticos, cuando intentan encontrar, integrar y analizar datos de miles de recursos biológicos online. Sólo una pequeña muestra: en 2006 había más de 20 formatos diferentes para representar las secuencias de ADN y, con los nuevos formatos que surgieron con el NGS ¡ahora hay incluso más! Algunos, como el estándar FASTQ, incluso tiene diferentes "sabores", como son los "sabores" Sanger, Solexa e Illumina de FASTQ, todos incompatibles mutuamente. ¿Cuál es la solución a este problema? ¡Crear un nuevo estándar, por supuesto!

La 'Semantic Science Integrated Ontology' (SIO) fue creada por un grupo de investigadores informáticos apasionados por la integración de datos. Su objetivo era crear "un único anillo que los gobierne a todos" - una metodología que permita que los nuevos tipos de datos bioinformáticos se creen conforme sea necesario, preservando algunas reglas básicas bien establecidas para la representación de datos. Los datos representados con el estándar SIO pueden ser fácil y automáticamente interpretados e integrados por las máquinas. Así, se reduce radicalmente el tiempo y el esfuerzo que se requiere para ensamblar los complejos conjuntos de datos que necesitan los modernos estudios de la Biología de Sistemas. SIO es el estándar para la representación de datos que usa un amplio conjunto de iniciativas internacionales de biología computacional, incluyendo Bio2RDF, liderado por la Universidad de Standford, y el proyecto SADI, liderado por nuestro laboratorio en el CBGP. Conforme avance el tiempo, estos dos proyectos convertirán muchos de los datos bioinformáticos que existen en formatos compatibles con SIO, así como fomentarán que nuevos proyectos adopten los estándares SIO en el futuro.



Publicación Original:

Dumontier, M; Baker, C; Baran, J; Callahan, A; Chepelev, L; Cruz-Toledo, J; Del Rio, N; Duck, G; Furlong, L; Keath, N; Klassen, D; McCusker, J; Queralt-Rosinach, N; Samwald, M; Villanueva-Rosales, N; Wilkinson, M; Hoehndorf, R. 2014. "The Semanticscience Integrated Ontology (SIO) for biomedical research and knowledge discovery". Journal of Biomedical Semantics 5:14.

 

Imprimir