Revista: | Programación matemática y software |
Base de datos: | |
Número de sistema: | 000573191 |
ISSN: | 2007-3283 |
Autores: | Oropeza Martínez, Peter Savier1 Hernández Aguilar, José Alberto1 Ochoa Ortiz Zezzatti, Carlos Alberto2 Cossio Franco, Edgar Gonzalo3 Ponce Gallegos, Julio César4 |
Instituciones: | 1Universidad Autónoma del Estado de Morelos, Av. Universidad 1001, Col. Chamilpa. Cuernavaca, Morelos, C.P. 62209. México, 2Universidad Autónoma de Ciudad Juárez, 3Universidad Enrique Díaz de León, 4Universidad Autónoma de Aguascalientes, |
Año: | 2019 |
Volumen: | 11 |
Número: | 1 |
Paginación: | 9-14 |
País: | México |
Idioma: | Español |
Resumen en inglés | This research is oriented to classify text using Artificial Neural Networks (ANN) specifically Multilayer Perceptron (MLP) with basic word embedding techniques. The classification consists in determining whether the text has criminal background or not by pattern recognition. The MLP was trained under supervised training and so far with a short range of vocabulary and training records, which each one has a maximum length of 300 words to make the classification process. Analyzing these types of text could help security forces of government, military, etc. to easily detect people who could harm the population and predict possible attacks and prevent them. The developed software needs more word embedding techniques, a larger vocabulary and more training records to be more efficient. The dataset consist of two main classes that are organized as crime and regular type of text. |
Resumen en español | Esta investigación está orientada a clasificar textos usando Redes Neuronales Artificiales (RNA) específicamente el Perceptron Multicapa (PMC) con Técnicas básicas de palabras embebidas. La clasificación consiste en determinar ya sea que el texto tenga un contexto criminal o no por medio de reconocimiento de patrones. El PMC fue entrenado bajo entrenamiento supervisado y en un rango corto de vocabulario y registros de entrenamiento, cada uno de los cuales tiene una longitud máxima de 300 palabras para hacer procesos de clasificación. Analizar estos tipos de textos podría ayudar a las fuerzas de seguridad del gobierno, a los militares, etc. para fácilmente detectar gente que podría dañar a la población y predecir posibles ataques y prevenirlos. El software desarrollado necesita más técnicas de palabras embebidas, un vocabulario más grande y más registros de entrenamiento para ser más eficiente. El conjunto de datos consiste de dos clases principales que están organizadas como textos de tipo criminal y regular. |
Palabras clave: | RNA, Actividades Criminales, Detección y Reconocimiento, Clasificación de patrones, PMC |
Keyword: | ANN, Criminal Actitivities, Detection and Recognition, Pattern classification, MLP |
Texto completo: | Texto completo (Ver PDF) |