español    español

Clasificación de la certeza de textos científicos

Las estructuras gramaticales que los investigadores usan para expresar sus ideas tienen la intención de transmitir diversos grados de certeza o especulación. Existe una gran variedad de sistemas de categorización para la certeza académica; sin embargo, estos sistemas no se han validado objetivamente, especialmente en cuanto a representar la interpretación del lector, en lugar de la intención del autor. En este estudio, se realizaron una serie de cuestionarios a los investigadores para determinar cómo catalogan diversos textos científicos, utilizando tres sistemas distintos de clasificación de la certeza. Encontramos que existen tres categorías distintas de certeza en un espectro que va de mayor a menor. Demostramos que estas categorías se pueden detectar de manera automática, utilizando un modelo de aprendizaje automático (“machine-learning”), con una precisión del 89.2% en un corpus clasificado por el autor, y una precisión del 82.2% con los resultados de los cuestionarios. Este hallazgo brinda la oportunidad de capturar metadatos contextuales relacionados con la certeza como parte de los procesos de minería de texto, que actualmente omiten estas sutiles claves lingüísticas. Finalmente proporcionamos la salida de nuestro sistema como una Nanopublicación, una representación en formato accesible para el ordenador, donde la categoría de certeza está integrada como metadato en forma de término ontológico dentro de una aserción científica extraída por minería de textos.

zoom

Publicación Original:

Prieto, M., Deus, H., Waard, A. de, Schultes, E., García-Jiménez, B., Wilkinson, M.D. 2020. Data-driven classification of the certainty of scholarly assertions. PeerJ 8, e8871. DOI: 10.7717/peerj.8871

 

Centro de Biotecnología y Genómica de Plantas UPM – INIA Parque Científico y Tecnológico de la U.P.M. Campus de Montegancedo
Autopista M-40, Km 38 - 28223 Pozuelo de Alarcón (Madrid) Tel.: +34 91 0679100 ext. 79100  Fax: +34 91 7157721. Localización y Contacto

Síguenos en: