Reconocimiento robusto de lugares mediante redes neuronales convolucionales



Título del documento: Reconocimiento robusto de lugares mediante redes neuronales convolucionales
Revista: Computación y sistemas
Base de datos:
Número de sistema: 000560547
ISSN: 1405-5546
Autores: 1
2
1
Instituciones: 1Instituto Politécnico Nacional, Centro de Investigación en Computación, Ciudad de México. México
2Instituto Tecnológico y de Estudios Superiores de Monterrey, Monterrey, Nuevo León. México
Año:
Periodo: Oct-Dic
Volumen: 24
Número: 4
Paginación: 1589-1605
País: México
Idioma: Español
Tipo de documento: Artículo
Resumen en español En este trabajo se propone utilizar una red neuronal convolucional para el reconocimiento visual de lugares. El trabajo se enfoca en la identificación y extracción automática de regiones de interés a partir de una imagen consulta. Estas regiones de interés se usan para construir la codificación de la imagen mediante un vector de descriptores localmente agregados, el cual es usado para la recuperación de imágenes. A diferencia de otros métodos, donde la imagen completa es utilizada para crear la codificación, el enfoque propuesto solo usa las regiones de interés más importantes en la imagen. Esto otorga una mejor robustez ante cambios extremos de vista en la imagen, condiciones de iluminación y oclusiones. Otra aportación de este trabajo consiste en la integración de un transformador convolucional espacial de acuerdo a la arquitectura de la red neuronal convolucional. Este transformador es usado para la normalización de las regiones de interés, lo que favorece una mayor robustez en la codificación. También se propone una función de pérdida que se usa para entrenar la red neuronal artificial para identificar las regiones de manera automática. Para medir la eficiencia del modelo propuesto, se realizó una variedad de experimentos con un conjunto desafiante de datos desafiantes. Los resultados reportados muestran que el método propuesto produce resultados superiores respecto a los otros métodos del estado del arte.
Resumen en inglés In this work, we propose using Convolutional Neural Network for place visual recognition. The work focuses on the identification and automatic extraction of interest regions from a query image. These regions are used to build an image encoding through a vector of locally aggregated descriptors, which is turn used for image recovery. Unlike other methods, where the entire image is used to create the encoding, our approach only uses the most important image interest regions. This provides better invariance to changes at extreme view points of view, lighting and occlusions. Another contribution of the work consists in the integration of a totally convolutional spatial transformer according to the convolutional neural network architecture. This transformer is used for normalizing these interest regions, which allows achieving a greater robustness during coding. A loss function is also proposed that is used to train the artificial neural network to identify automatically regions. To measure the efficiency of the proposed model, a variety of experiments were carried out with challenging data sets. The reported results show that the proposed method produces superior results than other state of the art methods.
Disciplinas: Ciencias de la computación
Palabras clave: Red neuronal convolucional,
Vector de descriptores localmente agregados,
Reconocimiento visual de lugares,
Inteligencia artificial
Keyword: Convolutional neural network,
Vector of locally aggregated descriptors,
Visual place recognition,
Artificial intelligence
Texto completo: Texto completo (Ver HTML) Texto completo (Ver PDF)