Proposición de un modelo para la acentuación automática de palabras ambiguas del español, utilizando etiquetado de texto



Document title: Proposición de un modelo para la acentuación automática de palabras ambiguas del español, utilizando etiquetado de texto
Journal: Programación matemática y software
Database:
System number: 000572989
ISSN: 2007-3283
Authors: 1
1
1
1
Institutions: 1División de Estudios de Posgrado e Investigación, Instituto Tecnológico de Apizaco, MÉXICO,
Year:
Volumen: 2
Number: 1
Pages: 32-43
Country: México
Language: Español
English abstract The process of accentuating words when writing a text in Spanish, is a problem of ambiguity, because there are many words that can be accentuated or not depending on the context of the sentence. The problem of ambiguity of words is related to the process of assigning tags or grammatical categories to the words in the sentence, that is, indicating wheter a Word is a verb , noun, etc. In this work, we propose a model, which helps to automatically determine wheter a word with diacritic accent should carry or not orthografic accent based on the tagging by means of application of hibryd methods ( supervised and unsupervised algorithms). After this method is applied to design a software that will support in teaching the rules of acentuation and for automatic acentuation of ambiguous words; which can be implemented as a tool at a word processor.
Spanish abstract La acentuación de palabras cuando se escribe un texto en español es un problema de ambigüedad, debido a que muchas palabras llevan acento o no dependiendo del contexto de la frase. El problema de la ambigüedad está relacionado con la asignación de etiquetas o categorías gramaticales a las palabras dentro de una frase, es decir, cuando se indica si se trata de un verbo, un sustantivo, etcétera. En el presente artículo se propone un modelo que ayuda a determinar en forma automática si una palabra con acento diacrítico debe llevar o no acento ortográfico, con base en la asignación de etiquetas y mediante la aplicación de métodos híbridos —algoritmos supervisado y no supervisado. Posteriormente, el método se aplica en el diseño de un programa de cómputo cuya función es de apoyo en la enseñanza de las reglas de acentuación y con el cual se realiza la acentuación automática de palabras ambiguas. Este método podría ser una herramienta en un procesador de palabras.
Keyword: desambiguación del sentido de la palabra (DSA)
Keyword: word sense disambiguation,
accent restoration,
part of speech tagger
Full text: Texto completo (Ver PDF)