Técnicas de recuperación de información aplicadas a la construcción de tesauros



Document title: Técnicas de recuperación de información aplicadas a la construcción de tesauros
Journal: Transinformacao
Database: CLASE
System number: 000395457
ISSN: 0103-3786
Authors: 1
1
Institutions: 1Universidad Complutense de Madrid, Facultad de Ciencias de la Documentación, Madrid. España
Year:
Season: Ene-Mar
Volumen: 26
Number: 1
Pages: 19-26
Country: Brasil
Language: Español
Document type: Artículo
Approach: Analítico, descriptivo
Spanish abstract El artículo propone la aplicación de un conjunto de técnicas propias del ámbito de la Recuperación de Información a la elaborac ión de Tesauros. Las propuestas que se presentan se aplicaron en la selección de la terminología, en la categorización de términos mediante clusters , y en el establecimiento de relaciones semánticas entre los términos, por procedimientos de similitud, que dieron como resultado un Tesauro de Comercio Exterior, de 7.790 términos. De tales resultados se puede concluir que las técnica s utilizadas simplifican de forma considerable las tareas para la recopilación de la terminología, y pueden suponer una mejora de la calidad del Tesauro resultante, en tanto que permiten el análisis de las condiciones de la colección para la que se utilizará e l Tesauro, así como aportar información extra a los expertos que es difícilmente obtenible de forma manual
English abstract The aim of the article was to propose the application of a set of techniques used in Information Retrieval for the development of a Thesaurus. The proposed ideas have been applied in the selection of the terminology; categorization of terms by creating cluste rs; and establishment of semantic relationships between terms through semantic similarity, which resulted in a Foreign Trade Thesaurus of 7,790 terms. From these results, we concluded that the techniques used significantly simplified the tasks of obtaining the term inology, and they can improve the quality of the final thesaurus. In addition, the techniques enabled the analysis of the conditions of the collection for which the thesaurus is used and provide extra information that would be hard to obtain manually
Disciplines: Bibliotecología y ciencia de la información
Keyword: Análisis y sistematización de la información,
Tesauros,
Modelo de espacio vectorial,
Semántica latente,
Recuperación de información,
Clusters,
Terminología
Full text: Texto completo (Ver HTML)