Un método independiente del idioma para responder preguntas de definición



Título del documento: Un método independiente del idioma para responder preguntas de definición
Revista: Computación y sistemas
Base de datos: PERIÓDICA
Número de sistema: 000341051
ISSN: 1405-5546
Autors: 1
1
1
Institucions: 1Instituto Nacional de Astrofísica, Optica y Electrónica, Coordinación de Ciencias Computacionales, Tonantzintla, Puebla. México
Any:
Període: Oct-Dic
Volum: 14
Número: 2
Paginació: 97-115
País: México
Idioma: Español
Tipo de documento: Artículo
Enfoque: Aplicado, descriptivo
Resumen en español Este trabajo describe un método para responder preguntas de definición basado exclusivamente en patrones léxicos brindando con ello independencia sobre el idioma. El método aplica dos pasos de minería de texto. El primer paso se enfoca en el descubrimiento de un conjunto de patrones léxicos superficiales a partir de ejemplos de definiciones recuperados de la Web. Posteriormente, se usan los patrones descubiertos para extraer una colección de pares concepto–descripción de una colección de documentos dada. El segundo paso de minería se aplica para determinar la respuesta más adecuada para cierta pregunta específica. Los resultados experimentales se obtuvieron con datos del foro CLEF 2005 y 2006 en tareas monolingües para el español, francés e italiano. Dichos resultados demuestran la pertinencia del método alcanzando altas precisiones para los tres idiomas
Resumen en inglés This paper describes a method for answering definition questions that is exclusively based on the use of lexical patterns, and, therefore, that is language independent. This method applies two main text–mining steps. The first step focuses on the discovery of a set of surface lexical patterns from definition examples downloaded from the Web. Subsequently, it uses these patterns to extract a set of concept–description pairs from a given target document collection. The second step applies a text–mining algorithm to determine the most adequate answer to each specific question. Experimental results were obtained using the datasets from the CLEF 2005 and 2006 for the monolingual tasks in Spanish, French and Italian. These results demonstrate the relevance of the method which showed very high precisions for the three languages
Disciplines Ciencias de la computación
Paraules clau: Tecnología de la información,
Minería de texto,
Sistemas de información,
Recuperación de información,
Software,
Preguntas de definición
Keyword: Computer science,
Information technology,
Text mining,
Information systems,
Information retrieval,
Software,
Definition questions
Text complet: Texto completo (Ver HTML)