Predicción del error de concordancia plural en cuatro aprendientes italianos de ELE



Título del documento: Predicción del error de concordancia plural en cuatro aprendientes italianos de ELE
Revista: RASAL Lingüística
Base de datos: CLASE
Número de sistema: 000515612
ISSN: 2250-7353
Autores: 1
Instituciones: 1Universidad Nacional de Córdoba, Facultad de Lenguas, Córdoba. Argentina
Año:
Número: 2
Paginación: 89-117
País: Argentina
Idioma: Español
Tipo de documento: Artículo
Enfoque: Analítico
Resumen en español Mediante técnicas de minería de datos se predijo la presencia del error de concordancia plural en cuatro aprendientes italianos de español como lengua extranjera. Se crearon atributos provenientes de redes complejas, atributos que caracterizaban los casos de concordancia y atributos que tenían en cuenta una componente temporal. Se aplicaron diferentes estrategias para lidiar con el desbalance de clase y la selección de atributos. Por último, se aplicó un clustering por mixtura de distribuciones para distinguir entre sesiones con mayor y menor intensidad de error. Se seleccionaron atributos relevantes mediante un modelo mixto con regularización y se ajustó a los datos de cada cluster un modelo mixto generalizado. Se llegó a obtener una precisión balanceada del 80 %. Los atributos derivados de los grafos fueron seleccionados en todos los alumnos. El cluster con mayor error reveló que influían en la chance de cometerlo los controladores animados, que la concordancia incluyera un adjetivo y un determinante, y la presencia de posesivos. Fue facilitadora una estrategia para evitar los plurales en -es
Resumen en inglés Using data mining techniques we predict the presence of plural agreement error in four Italian learners of Spanish as a foreign language. Predictors were created from complex networks, from attributes characterizing the agreement instances and from attributes which involved a temporal component. A set of strategies was employed to deal with class imbalance and attribute selection. After that, a clustering with mixed distributions was applied. The attribute selection was made using a mixed model with regularization. A generalized linear mixed model was adjusted to each cluster. The maximum balanced accuracy obtained was 80%. The attributes derived from graphs were selected in all students. The cluster with more error intensity revealed that the error chance increased with animate controllers, instances of agreement including an adjective or determinant and the presence of possessives. A strategy oriented to avoid plurals in -es diminished the chance of error
Disciplinas: Literatura y lingüística
Palabras clave: Lingüística aplicada,
Tecnología de la información,
Italianos,
Español,
Español como segunda lengua,
Corpus de español,
Concordancia,
Números,
Minería de datos,
Plural
Keyword: Applied linguistics,
Information technology,
Italians,
Spanish,
Spanish foreign language,
Corpus for Spanish,
Agreement,
Numbers,
Data mining,
Plural
Texto completo: Texto completo (Ver PDF) Texto completo (Ver HTML)