Aplicación del algoritmo RAKE en la indización de documentos digitales



Document title: Aplicación del algoritmo RAKE en la indización de documentos digitales
Journal: Investigación bibliotecológica
Database: CLASE
System number: 000472300
ISSN: 0187-358X
Authors: 1
Institutions: 1Universidad Nacional Autónoma de México, Facultad de Filosofía y Letras, Ciudad de México. México
Year:
Season: Abr-Jun
Volumen: 32
Number: 75
Country: México
Language: Español
Document type: Artículo
Approach: Analítico, descriptivo
Spanish abstract En la actualidad existe una diversidad de documentos digitales y en particular de documentos textuales que, dada su naturaleza, permiten la aplicación de métodos automatizados de procesamiento, organización y análisis con el fin de obtener información de manera concisa y de forma eficiente. Diversas áreas de estudio, como la informática, la bibliotecología, la lingüística computacional y la minería de texto, se encargan de desarrollar métodos para el procesamiento de documentos digitales con la meta de facilitar su representación, organización y recuperación, tanto en bibliotecas digitales como en bases de datos y catálogos. Estos métodos pueden ser de tipo estadístico o lingüístico. En este artículo se estudia el método RAKE de tipo estadístico con la finalidad de identificar y extraer palabras clave multipalabra de los documentos digitales para su organización y recuperación, además de la aplicación del método en la indización automatizada de documentos
English abstract Currently there are a wide range of digital documents, particularly text documents that by their nature allow automated processing, organization and analysis methods for the purpose of retrieving information concisely and efficiently. Diverse areas of study such as computer science, library science, computational linguistics and text mining, among others, have developed digital document processing methods for the purpose of facilitating their representation, organization and retrieval in digital libraries, databases and catalogs. These methods are both statistical and linguistic in nature. In this paper, the RAKE statistical method is examined in order to identify and extract multiword keywords from digital documents to allow organization, retrieval and automated document indexing
Disciplines: Bibliotecología y ciencia de la información
Keyword: Tecnología de la información,
Análisis y sistematización de la información,
Método RAKE,
Indización automática,
Métodos automatizados
Keyword: Information technology,
Information analysis,
RAKE Method,
Automatic indexing,
Automated methods
Full text: Texto completo (Ver HTML) Texto completo (Ver PDF)