Revista: | Polibits |
Base de datos: | PERIÓDICA |
Número de sistema: | 000373720 |
ISSN: | 1870-9044 |
Autores: | Cendejas, Eduardo1 Barceló, Grettel1 Sidorov, Grigori1 Gelbukh, Alexander1 Chanona Hernández, Liliana1 |
Instituciones: | 1Instituto Politécnico Nacional, Centro de Investigación en Computación, México, Distrito Federal. México |
Año: | 2012 |
Periodo: | Jul-Dic |
Número: | 46 |
Paginación: | 39-47 |
País: | México |
Idioma: | Español |
Tipo de documento: | Artículo |
Enfoque: | Experimental, aplicado |
Resumen en español | La equivalencia léxica de traducción se define mediante correspondencias establecidas entre dos lenguas, comúnmente denominadas lengua de origen y lengua meta. Este artículo propone un método de extracción de dichas equivalencias en palabras no funcionales. El algoritmo se basa en dos recursos principales: 1) MultiWordNet como léxico especializado para cada uno de los idiomas involucrados y 2) textos paralelos como información adicional para proporcionar diversas lexicalizaciones de las palabras a corresponder. Utiliza como fundamento principal el hecho de que las redes de palabras que conforman MultiWordNet estan alineadas. Adeirms, se presenta la reutilización del repositorio de pares léxicos obtenidos, señalando la forma en que esta información es susceptible de ser usada en un sistema de alineación a nivel de palabras. Para realizar los experimentos se emplearon textos paralelos bilingües sin notación morfosintáctica alguna, alineados a nivel de oración en los pares de idiomas español / inglés y español / italiano |
Resumen en inglés | The notion of lexical translation equivalent is defined via correspondence established between two languages conventionally called source and target languages. We propose a method for extraction such equivalents for non–functional words. Our algorithm is based in two main resources: (1) MultiWordNet as a specialized lexicon for each one of the two languages in question and (2) a parallel text corpus as a source of additional information that provides various lexicalizations of the words that are being aligned. Our method is based on the fact that the word networks that form MultiWordNet are aligned. In addition, we discuss an application of the obtained list of word pairs in a word–level text alignment system. In our experiments we used bilingual sentence–level aligned parallel texts, without any morphosyntactic annotation, for word pairs Spanish / English and Spanish / Italian |
Disciplinas: | Ciencias de la computación |
Palabras clave: | Procesamiento de datos, Lingüística computacional, Equivalencias léxicas, Textos paralelos, Traducción |
Keyword: | Computer science, Data processing, Computing linguistics, Translation equivalents, Parallel texts, Translation |
Texto completo: | Texto completo (Ver HTML) |