Detección automática y resolución automática de conflictos de unidades de medida en datos agregados
La integración, comparación e interpretación de datos cuantitativos requiere, como primer paso, que todas las medidas estén representadas en las mismas unidades. La discordancia en unidades es común en investigación integrativa, es difícil de detectar y tiene severas consecuencias cuando no se maneja de manera eficiente. Incluso la NASA ha cometido graves y costosos errores al no detectar ni ser consciente de conflictos en unidades de medida, dando como resultado una desafortunada colisión entre la sonda 'Mars Climate' y Marte!
La biología integrativa moderna maneja conjuntos de datos complejos, multidimensionales y heterógenos, a menudo generados por grupos no coordinados. Es precisamente en esta situación donde es más probable que se cometan los errores en las unidades de medida. Este trabajo esta contextualizado en un estudio orientado a la clínica en donde necesitábamos reunir datos clínicos de un número de grupos participantes, e intentar categorizar automáticamente pacientes individuales en base a directrices de riesgo sanitario ya existentes. Antes de llevar a cabo el estudio, fuimos conscientes del potencial de los conflictos de unidades de medida en estos conjuntos de datos integrados. En vez de crear una solución 'ad hoc', intentamos definir una solución basada en la semántica, ligera y compatible con los estándares que pudiera ser reusada por otros proyectos de investigación bio/médicos de todo el mundo.
Publicación Original:
Samadian S; McManus B; Wilkinson M. 2014. "Automatic detection and resolution of measurement-unit conflicts in aggregated data". BMC Med. Genomics 7:S12.