Solving Multiple Queries through a Permutation Index in GPU



Título del documento: Solving Multiple Queries through a Permutation Index in GPU
Revista: Computación y sistemas
Base de datos: PERIÓDICA
Número de sistema: 000367370
ISSN: 1405-5546
Autores: 1
1
1
1
Instituciones: 1Universidad Nacional de San Luis, Laboratorio de Investigación y Desarrollo en Inteligencia Computacional, San Luis. Argentina
Año:
Periodo: Jul-Sep
Volumen: 17
Número: 3
Paginación: 341-356
País: México
Idioma: Inglés
Tipo de documento: Artículo
Enfoque: Experimental, aplicado
Resumen en español Realizar consultas por contenido, a través de búsquedas de similitud, es una operación fundamental para aplicaciones relacionadas con datos multimedia. En este tipo de consultas no tiene sentido buscar elementos exactamente iguales a uno dado como consulta. En su lugar, es necesario medirla disimilitud entre el objeto de consulta y cada objeto de la base de datos. El modelo de espacio métrico es un paradigma que permite modelar todos los problemas de búsqueda por similitud. Las bases de datos métricas permiten el almacenamiento de objetos de un espacio métrico y responder consultas por similitud de manera eficiente, generalmente, mediante la reducción del número de evaluaciones de distancia. En consecuencia, el objetivo es pre-procesar el conjunto de datos de manera que las consultas pueden ser respondidas con el menor número posible de cálculos de distancia. Más aún, para grandes bases de datos métricas no basta con procesar previamente el conjunto de datos mediante la creación de un índice, también es necesario acelerar las consultas mediante el uso de computación de alto desempeño, una alternativa es utilizar GPU. En este trabajo se muestra una implementación de una arquitectura de GPU pura para construir el Pemutation Index, el cual nos permite resolver en paralelo múltiples consultas por similitud aproximadas en bases de datos de diferente naturaleza. Además se evalúa el compromiso entre la calidad de respuesta y el desempeño de nuestra aplicación. Finalmente se presentan resultados experimentales
Resumen en inglés Query-by-content by means of similarity search is a fundamental operation for applications that deal with multimedia data. For this kind of query it is meaningless to look for elements exactly equal to the one given as query. Instead, we need to measure dissimilarity between the query object and each database object. The metric space model is a paradigm that allows modeling all similarity search problems. Metric databases permit to store objects from a metric space and efficiently perform similarity queries over them, in general, by reducing the number of distance evaluations needed. Therefore, the goal is to preprocess a particular dataset in such a way that queries can be answered with as few distance computations as possible. Moreover, for a very large metric database it is not enough to preprocess the dataset by building an index, it is also necessary to speed up the queries via high performance computing using GPU. In this work we show an implementation of a pure GPU architecture to build a Permutation Index used for approximate similarity search on databases of different data nature and to solve many queries at the same time. Besides, we evaluate the tradeoff between the answer quality and time performance of our implementation
Disciplinas: Ciencias de la computación
Palabras clave: Procesamiento de datos,
Unidades de procesamiento gráfico,
Búsqueda de información,
Espacio métrico,
Indice de permutación,
Cómputo de alto rendimiento
Keyword: Computer science,
Data processing,
Graphics processing units,
Information searching,
Metric space,
Permutation index,
High performance computing
Texto completo: Texto completo (Ver HTML)