An artificial immune system based on information theory for keyword extraction from text documents



Document title: An artificial immune system based on information theory for keyword extraction from text documents
Journal: Avances en sistemas e informática
Database: PERIÓDICA
System number: 000340485
ISSN: 1657-7663
Authors: 1
1
Institutions: 1Universidad Nacional de Colombia, Laboratorio de Investigación en Sistemas Inteligentes, Bogotá. Colombia
Year:
Season: Sep
Volumen: 4
Number: 2
Pages: 25-32
Country: Colombia
Language: Inglés
Document type: Artículo
Approach: Experimental, aplicado
Spanish abstract En este artículo se presenta un modelo para la extracción de palabras clave; el cual extiende los conceptos básicos usados en dicha tarea, con el fin de proporcionar un marco teórico formal que permita determinar la importancia de las palabras clave para los documentos. El modelo propuesto combina un sistema inmune artificial con un fundamento matemático basado en la teoría de la información; este nuevo modelo tiene la ventaja de no requerir ningún conocimiento del dominio, así como el uso de un diccionario o cualquier información previa acerca del contenido de los documentos. El resultado final es un conjunto de palabras clave para cada categoría en el conjunto de datos usado
English abstract This paper presents a model for keyword extraction, extending the basic concepts commonly used in this task, in order to get a formal background that allows determining the importance of the keywords to the documents. The proposed model combines an artificial immune system with a mathematical background based on information theory; this new model has the advantage that does not need any domain knowledge, neither the use of a stopword list or any previous information about the content of the documents. The final result is a set of keywords for each category into the corpus used
Disciplines: Ciencias de la computación
Keyword: Software,
Tecnología de la información,
Sistemas artificiales,
Sistemas inmunes artificiales,
Minería de datos,
Palabras clave,
Teoría de la información
Keyword: Computer science,
Software,
Information technology,
Artificial systems,
Artificial immune systems,
Data mining,
Keywords,
Information theory
Full text: Texto completo (Ver PDF)