Clasificación kNN de documentos usando GPU



Document title: Clasificación kNN de documentos usando GPU
Journal: Computación y sistemas
Database: PERIÓDICA
System number: 000352305
ISSN: 1405-5546
Authors: 1
2
Institutions: 1Desarrollo de Aplicaciones, Tecnologías y Sistemas, Santiago de Cuba. Cuba
2Universidad de Oriente, Centro de Estudios de Reconocimiento de Patrones y Minería de Datos, Santiago de Cuba. Cuba
Year:
Season: Jul-Sep
Volumen: 15
Number: 1
Pages: 63-77
Country: México
Language: Español
Document type: Artículo
Approach: Aplicado, descriptivo
Spanish abstract La búsqueda de los k vecinos más cercanos, ha sido aplicada a una amplia variedad de aplicaciones en el campo de la Minería de Textos y la Recuperación de Información por su simplicidad y precisión. Sin embargo, estas áreas del conocimiento en general manipulan objetos con altas dimensiones de rasgos que hacen que el proceso de encontrar los k objetos más similares a uno dado tenga una intensidad computacional elevada, debido a la gran cantidad de operaciones que se realizan para calcular la semejanza entre todos los objetos implicados. En este trabajo se proponen dos métodos de multiplicación paralela de matrices dispersas usando una GPU, que minimizan el tiempo empleado en el cálculo de semejanzas entre objetos del algoritmo kNN para clasificar documentos
English abstract The search for the k nearest neighbors, has been applied to a wide variety of applications in the field of Text Mining and Information Retrieval for its simplicity and accuracy. However, these general areas of knowledge in handling high–dimensional objects with features that make the process of finding the k most similar objects to a given computer has a high intensity, due to the large number of operations performed to calculate the similarity between all the objects involved. In this paper we propose two methods for parallel sparse matrix multiplication using a GPU, which minimize the time spent in the calculation of similarities between objects in the kNN algorithm to classify documents
Disciplines: Ciencias de la computación,
Bibliotecología y ciencia de la información
Keyword: Tecnología de la información,
Clasificación de documentos,
Minería de datos,
Recuperación de información,
Análisis de textos,
Matrices dispersas
Keyword: Computer science,
Library and information science,
Information technology,
Document classification,
Data mining,
Information retrieval,
Text analysis,
Sparse matrix
Full text: Texto completo (Ver HTML)