Inference and Reconciliation in a Crowdsourced Lexical-Semantic Network



Título del documento: Inference and Reconciliation in a Crowdsourced Lexical-Semantic Network
Revue: Computación y sistemas
Base de datos: PERIÓDICA
Número de sistema: 000365501
ISSN: 1405-5546
Autores: 1
1
1
Instituciones: 1Laboratoire d'Informatique, de Robotique et de Microelectronique, Montpellier, Herault. Francia
Año:
Periodo: Abr-Jun
Volumen: 17
Número: 2
Paginación: 147-160
País: México
Idioma: Inglés
Tipo de documento: Artículo
Enfoque: Experimental, aplicado
Resumen en español Construcción y validación de una red léxica y semántica es un reto en el procesamiento de lenguaje natural. Para todas las estrategias usadas de construcción, un método de mejorar la calidad general del recurso es la inferencia automática de relaciones nuevas a partir de las existentes, lo cual resulta en el aumento de la densidad de la red. En este contexto un motor de inferencia tiene el objetivo de deducir las conclusiones nuevas, es decir, relaciones entre términos, a partir de las premisas existentes (también relaciones) en la red. En este artículo se diseña un motor de inferencia para la red léxica JeuxDeMots, la cual contiene términos y relaciones definidas entre términos. En el proyecto JeuxDeMots la red léxica se construye mediante un juego con propósito y miles de jugadores. Términos polisémicos pueden ser refinados en varios significados (un banco puede ser una institución financiara y una mueble) pero como la red se está construyendo de manera infinita (en el contexto del enfoque "Aprendizaje que Nunca Termina"), algunos significados pueden faltar. El enfoque propuesto se basa en el método de triangulación implementando la transitividad semántica con el mecanismo de bloqueo para evitar las propuestas de relaciones nuevas dudosas. Las relaciones inferidas se proponen a los contribuyentes para validarlas. En el proceso de validación se puede emplear la estrategia de reconciliación con el fin de identificar la causa de una inferencia incorrecta: una excepción, un error en las premisas o una confusión de transitividad por la polisemia cuando es necesario identificar los significados apropiados de palabras
Resumen en inglés Lexical-semantic network construction and validation is a major issue in NLP. No matter the construction strategies used, automatically inferring new relations from already existing ones is a way to improve the global quality of the resource by densifying the network. In this context, the purpose of an inference engine is to formulate new conclusions (i.e. relations between terms) from already existing premises (also relations) on the network. In this paper we devise an inference engine for the JeuxDeMots lexical network which contains terms and typed relations between terms. In the JeuxDeMots project, the lexical network is constructed with the help of a game with a purpose and thousands of players. Polysemous terms may be refined in several senses (bank may be a bank-financial institution or a bank-river) but as the network is indefinitely under construction (in the context of a Never Ending Learning approach) some senses may be missing. The approach we propose is based on the triangulation method implementing semantic transitivity with a blocking mechanism for avoiding proposing dubious new relations. Inferred relations are proposed to contributors to be validated. In case of invalidation, a reconciliation strategy is undertaken to identify the cause of the wrong inference: an exception, an error in the premises or a transitivity confusion due to polysemy with the identification of the proper word senses at stake
Disciplinas: Ciencias de la computación
Palabras clave: Procesamiento de datos,
Lingüística computacional,
Redes léxicas,
Procesamiento de lenguaje natural,
Inferencia
Keyword: Computer science,
Data processing,
Computing linguistics,
Lexical networks,
Natural language processing,
Inference
Texte intégral: Texto completo (Ver HTML)