Aplicación del algoritmo RAKE en la indización de documentos digitales



Título del documento: Aplicación del algoritmo RAKE en la indización de documentos digitales
Revista: Investigación bibliotecológica
Base de datos: CLASE
Número de sistema: 000472300
ISSN: 0187-358X
Autors: 1
Institucions: 1Universidad Nacional Autónoma de México, Facultad de Filosofía y Letras, Ciudad de México. México
Any:
Període: Abr-Jun
Volum: 32
Número: 75
País: México
Idioma: Español
Tipo de documento: Artículo
Enfoque: Analítico, descriptivo
Resumen en español En la actualidad existe una diversidad de documentos digitales y en particular de documentos textuales que, dada su naturaleza, permiten la aplicación de métodos automatizados de procesamiento, organización y análisis con el fin de obtener información de manera concisa y de forma eficiente. Diversas áreas de estudio, como la informática, la bibliotecología, la lingüística computacional y la minería de texto, se encargan de desarrollar métodos para el procesamiento de documentos digitales con la meta de facilitar su representación, organización y recuperación, tanto en bibliotecas digitales como en bases de datos y catálogos. Estos métodos pueden ser de tipo estadístico o lingüístico. En este artículo se estudia el método RAKE de tipo estadístico con la finalidad de identificar y extraer palabras clave multipalabra de los documentos digitales para su organización y recuperación, además de la aplicación del método en la indización automatizada de documentos
Resumen en inglés Currently there are a wide range of digital documents, particularly text documents that by their nature allow automated processing, organization and analysis methods for the purpose of retrieving information concisely and efficiently. Diverse areas of study such as computer science, library science, computational linguistics and text mining, among others, have developed digital document processing methods for the purpose of facilitating their representation, organization and retrieval in digital libraries, databases and catalogs. These methods are both statistical and linguistic in nature. In this paper, the RAKE statistical method is examined in order to identify and extract multiword keywords from digital documents to allow organization, retrieval and automated document indexing
Disciplines Bibliotecología y ciencia de la información
Paraules clau: Tecnología de la información,
Análisis y sistematización de la información,
Método RAKE,
Indización automática,
Métodos automatizados
Keyword: Information technology,
Information analysis,
RAKE Method,
Automatic indexing,
Automated methods
Text complet: Texto completo (Ver HTML) Texto completo (Ver PDF)