Revista: | Revista politécnica |
Base de datos: | PERIÓDICA |
Número de sistema: | 000435339 |
ISSN: | 1900-2351 |
Autores: | Castillo, Fabián1 Bautista, Lola1 Martínez, Fabio1 |
Instituciones: | 1Universidad Industrial de Santander, Laboratorio de Imagenelogía Biomédica, Visión y Aprendizaje, Bucaramanga, Santander. Colombia |
Año: | 2019 |
Periodo: | Jul-Dic |
Volumen: | 15 |
Número: | 29 |
Paginación: | 82-94 |
País: | Colombia |
Idioma: | Español |
Tipo de documento: | Artículo |
Enfoque: | Aplicado, descriptivo |
Resumen en español | Los sensores RGB-D han permitido atacar de forma novedosa muchos de los problemas clásicos en visión por computador, tales como la segmentación, la representación de escenas, la interacción humano-computador, entre otros. Con respecto a la caracterización de movimiento, las estrategias típicas en RGB-D están limitadas al análisis dinámico de formas globales y a la captura de flujos de escena. Estas estrategias, sin embargo, solo recuperan información dinámica entre cuadros consecutivos, limitando el análisis de largos desplazamientos. Este trabajo presenta una estrategia para el cálculo de trayectorias (3D+t), las cuales son fundamentales para la descripción cinemática local, permitiendo una descripción densa de movimiento. Cada trayectoria permite modelar palabras cinemáticas, las cuales en conjunto, describen gestos complejos en los videos. Estas palabras cinemáticas fueron procesadas dentro de un esquema de bolsa-de-palabras para obtener un descriptor basado ocurrencias. Este descriptor de trayectorias logró una exactitud del 80% en 5 gestos y 100 videos |
Resumen en inglés | RGB-D sensors have allowed attacking many classical problems in computer vision such as segmentation, scene representations and human interaction, among many others. Regarding motion characterization, typical RGB-D strategies are limited to namely analyze global shape changes and capture scene flow fields to describe local motions in depth sequences. Nevertheless, such strategies only recover motion information among a couple of frames, limiting the analysis of coherent large displacements along time. This work presents a novel strategy to compute 3D+t dense and long motion trajectories as fundamental kinematic primitives to represent video sequences. Each motion trajectory models kinematic words primitives that together can describe complex gestures developed along videos. Such kinematic words were processed into a bag-of-kinematic-words framework to obtain an occurrence video descriptor. The novel video descriptor based on 3D+t motion trajectories achieved an average accuracy of 80% in a dataset of 5 gestures and 100 videos |
Disciplinas: | Ciencias de la computación, Física y astronomía |
Palabras clave: | Optica, Procesamiento de datos, Visión por computadora, Sensores RGB-D, Flujo de escena, Trayectorias densas de movimiento, Características cinemáticas, Seguimiento |
Keyword: | Optics, Data processing, Computer vision, RGB-D sensors, Scene flow, Dense motion trajectories, Kinematic features, Tracking |
Texto completo: | http://biblat.unam.mx/hevila/Revistapolitecnica/2019/vol15/no29/7.pdf |