Experiencia de clasificación automática de documentos sobre Ciencias de la Vida y Biomedicina obtenidos del Web of Science



Título del documento: Experiencia de clasificación automática de documentos sobre Ciencias de la Vida y Biomedicina obtenidos del Web of Science
Revue: Investigación bibliotecológica
Base de datos: CLASE
Número de sistema: 000530038
ISSN: 0187-358X
Autores: 1
2
Instituciones: 1Universidad Pedagógica Nacional, Biblioteca "Gregorio Torres Quintero", Ciudad de México. México
2Escuela Nacional de Biblioteconomía y Archivonomía, Ciudad de México. México
Año:
Periodo: Oct-Dic
Volumen: 36
Número: 93
Paginación: 13-32
País: México
Idioma: Español
Tipo de documento: Artículo
Enfoque: Aplicado, descriptivo
Resumen en español Este artículo brinda una experiencia en el desarrollo y prueba de un algoritmo de clasificación que asigna automáticamente un tema a un documento. Se utilizó el algoritmo de clasificación Multinomial de Naïve Bayes para analizar la correlación entre los temas de investigación en Ciencias de la Vida y Biomedicina, y los resúmenes de un corpus de 10 167 artículos recuperados del Web of Science (WoS). Se realizó una prueba del rendimiento del algoritmo aplicada a 5 581 resúmenes para medir su precisión, exhaustividad y exactitud. Los resultados demuestran su utilidad en la organización de la información respecto a la asignación automática de temas a documentos obtenidos de un repositorio digital o base de datos bibliográfica. El algoritmo propuesto puede ser utilizado como alternativa a los métodos tradicionales de clasificación de documentos en un área específica del conocimiento; esto permitirá la creación de servicios especializados orientados al desarrollo de sistemas computacionales que apoyen la gestión de información digital y electrónica
Resumen en inglés This article provides an experience in the development and proof of a classification algorithm that automatically assigns a theme to a document. The Naïve Bayes Multinomial classification was used to automatically analyze the correlation between the themes of research in Life Sciences and Biomedicine, and the result of a corpus of 10 167 articles recuperated from the Web of Science (WoS). A proof of the performance of the algorithm was applied to 5 581 reviews for measuring its precision, exhaustivity and accuracy. The results show its usefulness in the organization of information respect to the automatic assignation of themes to the documents obtained in a digital repository or a bibliographic data base. The algorithm proposed can be utilized as an alternative to the traditional methods of classification of documents in a specific area of knowledge; this will allow the creation of specialized services oriented to the development of computational services that support the digital and electronic information management
Disciplinas: Bibliotecología y ciencia de la información
Palabras clave: Tecnología de la información,
Biomedicina,
Algoritmos,
Clasificación automática de documentos,
Naive Bayes Multinomial
Keyword: Information technology,
Biomedicine,
Algorithms,
Automatic classification of documents,
Naive Bayes Multinomial
Texte intégral: Texto completo (Ver HTML) Texto completo (Ver PDF)