Single-Document Keyphrase Extraction for Multi-Document Keyphrase Extraction



Título del documento: Single-Document Keyphrase Extraction for Multi-Document Keyphrase Extraction
Revista: Computación y sistemas
Base de datos: PERIÓDICA
Número de sistema: 000365505
ISSN: 1405-5546
Autors: 1
1
Institucions: 1University of Szeged, Department of Informatics, Szeged, Csongrad. Hungría
Any:
Període: Abr-Jun
Volum: 17
Número: 2
Paginació: 179-186
País: México
Idioma: Inglés
Tipo de documento: Artículo
Enfoque: Experimental, aplicado
Resumen en español En este artículo se considera el tema de asignación de términos relevantes a sub-corpus con temas y semántica relacionados y se logran resultados superiores a los del rendimiento de referencia. Los resultados obtenidos en este trabajo muestran que los conjuntos más confiables de palabras clave pueden ser asignados a subconjuntos con temas y semántica relacionados de un corpus si primero se identifican automáticamente los subconjuntos de palabras clave de documentos individuales en todo corpus. Los conjuntos de palabras clave asignados mediante el método propuesto para los talleres incluidos en ACL Anthology Corpus para el periodo de 6 años fueron considerados mejor en más de 60
Resumen en inglés Here, we address the task of assigning relevant terms to thematically and semantically related sub-corpora and achieve superior results compared to the baseline performance. Our results suggest that more reliable sets of keyphrases can be assigned to the semantically and thematically related subsets of some corpora if the automatically determined sets of keyphrases for the individual documents of an entire corpus are identified first. The sets of keyphrases assigned by our proposed method for the workshops present in the ACL Anthology Corpus over a 6-year period were considered better in more than 60% of the test cases compared to our baseline system when evaluated against an aggregation of different human judgements
Disciplines Ciencias de la computación
Paraules clau: Procesamiento de datos,
Lingüística computacional,
Análisis de información,
Palabras clave,
Documentos múltiples,
Gestión del conocimiento,
Recuperación de información
Keyword: Computer science,
Data processing,
Computing linguistics,
Information analysis,
Keywords,
Mulitple documents,
Knowledge management,
Information retrieval
Text complet: Texto completo (Ver HTML)