Determinación de Criminales Potenciales en Análisis de Textos: Caso de Estudio

Oropeza Martínez, Peter Savier; Hernández Aguilar, José Alberto; Ochoa Ortiz Zezzatti, Carlos Alberto; Cossio Franco, Edgar Gonzalo; Ponce Gallegos, Julio César


Título del documento:	Determinación de Criminales Potenciales en Análisis de Textos: Caso de Estudio
Revista:	Programación matemática y software
Base de datos:
Número de sistema:	000573191
ISSN:	2007-3283
Autores:	Oropeza Martínez, Peter Savier¹ Hernández Aguilar, José Alberto¹ Ochoa Ortiz Zezzatti, Carlos Alberto² Cossio Franco, Edgar Gonzalo³ Ponce Gallegos, Julio César⁴
Instituciones:	¹Universidad Autónoma del Estado de Morelos, Av. Universidad 1001, Col. Chamilpa. Cuernavaca, Morelos, C.P. 62209. México, ²Universidad Autónoma de Ciudad Juárez, ³Universidad Enrique Díaz de León, ⁴Universidad Autónoma de Aguascalientes,
Año:	2019
Volumen:	11
Número:	1
Paginación:	9-14
País:	México
Idioma:	Español
Resumen en inglés	This research is oriented to classify text using Artificial Neural Networks (ANN) specifically Multilayer Perceptron (MLP) with basic word embedding techniques. The classification consists in determining whether the text has criminal background or not by pattern recognition. The MLP was trained under supervised training and so far with a short range of vocabulary and training records, which each one has a maximum length of 300 words to make the classification process. Analyzing these types of text could help security forces of government, military, etc. to easily detect people who could harm the population and predict possible attacks and prevent them. The developed software needs more word embedding techniques, a larger vocabulary and more training records to be more efficient. The dataset consist of two main classes that are organized as crime and regular type of text.
Resumen en español	Esta investigación está orientada a clasificar textos usando Redes Neuronales Artificiales (RNA) específicamente el Perceptron Multicapa (PMC) con Técnicas básicas de palabras embebidas. La clasificación consiste en determinar ya sea que el texto tenga un contexto criminal o no por medio de reconocimiento de patrones. El PMC fue entrenado bajo entrenamiento supervisado y en un rango corto de vocabulario y registros de entrenamiento, cada uno de los cuales tiene una longitud máxima de 300 palabras para hacer procesos de clasificación. Analizar estos tipos de textos podría ayudar a las fuerzas de seguridad del gobierno, a los militares, etc. para fácilmente detectar gente que podría dañar a la población y predecir posibles ataques y prevenirlos. El software desarrollado necesita más técnicas de palabras embebidas, un vocabulario más grande y más registros de entrenamiento para ser más eficiente. El conjunto de datos consiste de dos clases principales que están organizadas como textos de tipo criminal y regular.
Palabras clave:	RNA, Actividades Criminales, Detección y Reconocimiento, Clasificación de patrones, PMC
Keyword:	ANN, Criminal Actitivities, Detection and Recognition, Pattern classification, MLP
Texto completo:	Texto completo (Ver PDF)

Determinación de Criminales Potenciales en Análisis de Textos: Caso de Estudio

Espere un momento...