Redes de palabras alineadas como recurso en la extracción de equivalencias léxicas de traducción y su aplicación en la alineación



Título del documento: Redes de palabras alineadas como recurso en la extracción de equivalencias léxicas de traducción y su aplicación en la alineación
Revista: Polibits
Base de datos: PERIÓDICA
Número de sistema: 000373720
ISSN: 1870-9044
Autores: 1
1
1
1
1
Instituciones: 1Instituto Politécnico Nacional, Centro de Investigación en Computación, México, Distrito Federal. México
Año:
Periodo: Jul-Dic
Número: 46
Paginación: 39-47
País: México
Idioma: Español
Tipo de documento: Artículo
Enfoque: Experimental, aplicado
Resumen en español La equivalencia léxica de traducción se define mediante correspondencias establecidas entre dos lenguas, comúnmente denominadas lengua de origen y lengua meta. Este artículo propone un método de extracción de dichas equivalencias en palabras no funcionales. El algoritmo se basa en dos recursos principales: 1) MultiWordNet como léxico especializado para cada uno de los idiomas involucrados y 2) textos paralelos como información adicional para proporcionar diversas lexicalizaciones de las palabras a corresponder. Utiliza como fundamento principal el hecho de que las redes de palabras que conforman MultiWordNet estan alineadas. Adeirms, se presenta la reutilización del repositorio de pares léxicos obtenidos, señalando la forma en que esta información es susceptible de ser usada en un sistema de alineación a nivel de palabras. Para realizar los experimentos se emplearon textos paralelos bilingües sin notación morfosintáctica alguna, alineados a nivel de oración en los pares de idiomas español / inglés y español / italiano
Resumen en inglés The notion of lexical translation equivalent is defined via correspondence established between two languages conventionally called source and target languages. We propose a method for extraction such equivalents for non–functional words. Our algorithm is based in two main resources: (1) MultiWordNet as a specialized lexicon for each one of the two languages in question and (2) a parallel text corpus as a source of additional information that provides various lexicalizations of the words that are being aligned. Our method is based on the fact that the word networks that form MultiWordNet are aligned. In addition, we discuss an application of the obtained list of word pairs in a word–level text alignment system. In our experiments we used bilingual sentence–level aligned parallel texts, without any morphosyntactic annotation, for word pairs Spanish / English and Spanish / Italian
Disciplinas: Ciencias de la computación
Palabras clave: Procesamiento de datos,
Lingüística computacional,
Equivalencias léxicas,
Textos paralelos,
Traducción
Keyword: Computer science,
Data processing,
Computing linguistics,
Translation equivalents,
Parallel texts,
Translation
Texto completo: Texto completo (Ver HTML)