Trayectorias de movimiento densas 3d+t como primitivas cinemáticas para el análisis de secuencias de video de profundidad



Título del documento: Trayectorias de movimiento densas 3d+t como primitivas cinemáticas para el análisis de secuencias de video de profundidad
Revista: Revista politécnica
Base de datos: PERIÓDICA
Número de sistema: 000435339
ISSN: 1900-2351
Autores: 1
1
1
Instituciones: 1Universidad Industrial de Santander, Laboratorio de Imagenelogía Biomédica, Visión y Aprendizaje, Bucaramanga, Santander. Colombia
Año:
Periodo: Jul-Dic
Volumen: 15
Número: 29
Paginación: 82-94
País: Colombia
Idioma: Español
Tipo de documento: Artículo
Enfoque: Aplicado, descriptivo
Resumen en español Los sensores RGB-D han permitido atacar de forma novedosa muchos de los problemas clásicos en visión por computador, tales como la segmentación, la representación de escenas, la interacción humano-computador, entre otros. Con respecto a la caracterización de movimiento, las estrategias típicas en RGB-D están limitadas al análisis dinámico de formas globales y a la captura de flujos de escena. Estas estrategias, sin embargo, solo recuperan información dinámica entre cuadros consecutivos, limitando el análisis de largos desplazamientos. Este trabajo presenta una estrategia para el cálculo de trayectorias (3D+t), las cuales son fundamentales para la descripción cinemática local, permitiendo una descripción densa de movimiento. Cada trayectoria permite modelar palabras cinemáticas, las cuales en conjunto, describen gestos complejos en los videos. Estas palabras cinemáticas fueron procesadas dentro de un esquema de bolsa-de-palabras para obtener un descriptor basado ocurrencias. Este descriptor de trayectorias logró una exactitud del 80% en 5 gestos y 100 videos
Resumen en inglés RGB-D sensors have allowed attacking many classical problems in computer vision such as segmentation, scene representations and human interaction, among many others. Regarding motion characterization, typical RGB-D strategies are limited to namely analyze global shape changes and capture scene flow fields to describe local motions in depth sequences. Nevertheless, such strategies only recover motion information among a couple of frames, limiting the analysis of coherent large displacements along time. This work presents a novel strategy to compute 3D+t dense and long motion trajectories as fundamental kinematic primitives to represent video sequences. Each motion trajectory models kinematic words primitives that together can describe complex gestures developed along videos. Such kinematic words were processed into a bag-of-kinematic-words framework to obtain an occurrence video descriptor. The novel video descriptor based on 3D+t motion trajectories achieved an average accuracy of 80% in a dataset of 5 gestures and 100 videos
Disciplinas: Ciencias de la computación,
Física y astronomía
Palabras clave: Optica,
Procesamiento de datos,
Visión por computadora,
Sensores RGB-D,
Flujo de escena,
Trayectorias densas de movimiento,
Características cinemáticas,
Seguimiento
Keyword: Optics,
Data processing,
Computer vision,
RGB-D sensors,
Scene flow,
Dense motion trajectories,
Kinematic features,
Tracking
Texto completo: http://biblat.unam.mx/hevila/Revistapolitecnica/2019/vol15/no29/7.pdf