Sistemas para almacenar grandes volúmenes de datos



Título del documento: Sistemas para almacenar grandes volúmenes de datos
Revista: Gerencia tecnológica informática
Base de datos: PERIÓDICA
Número de sistema: 000415451
ISSN: 1657-8236
Autores: 1
2
Instituciones: 1Universidad del Quindío, Programa de Ingeniería de Sistemas y Computación, Armenia, Quindío. Colombia
2Universidad Pontificia Bolivariana, Facultad de Ingeniería Informática y Telecomunicaciones, Bogotá. Colombia
Año:
Periodo: Sep-Dic
Volumen: 13
Número: 37
Paginación: 17-28
País: Colombia
Idioma: Español
Tipo de documento: Artículo
Enfoque: Aplicado, descriptivo
Resumen en español La necesidad de almacenar y procesar grandes volúmenes de datos ha dado origen al término Big Data. Estos sistemas manejan información obtenida desde diversas fuentes y formatos, como es el caso de páginas web, redes sociales, el análisis del genoma humano, la física de partículas, entre otros. Estos almacenes de datos presentan dificultades que no pueden ser resueltas mediante el uso de sistemas de gestión de bases de datos tradicionales. El objetivo de este artículo es revisar el estado del arte en lo referente a técnicas para el almacenamiento de grandes cantidades de datos. Se comparan las características de las bases de datos relacionales y los modelos NoSQL, que han captado la atención durante los últimos años. Todos estos sistemas deben adoptar soluciones de compromiso para lograr características críticas tales como: escalabilidad, fiabilidad, durabilidad, tiempo de respuesta, interfaz de consulta, estructura de los datos almacenados (o carencia de la misma) y esquemas de particionamiento de datos. Se presenta una revisión de las técnicas más representativas y de cómo cada una de ellas permite manejar las características indicadas previamente. Para concluir se presenta un análisis de las ventajas y limitaciones de los modelos estudiados. Así mismo, se identifican algunos de los problemas que son objeto de investigación activa en el área
Resumen en inglés The need to store and process very large databases has given origin to the term “big data stores”. These are systems that handle information obtained from crawling the web, social networks, the analysis of the genome, particle physics, and many more. These data stores pose many challenging problems that cannot be handled by traditional database management systems. The goal of this survey is to explore the current state-of-the-art solutions to the problem of managing information stores of this scale. In this paper we compare the characteristics of relational databases against those of newly proposed NoSQL models. This latter has been the center of interest in recent years. All these systems exhibit different trade-offs around critical characteristics of the data store, such as scalability, reliability, durability, response time, query interface, structure (or the lack of) of the stored data, and data partitioning schemes. We present a review of the most representative techniques and how they handle each of these problems. We conclude by presenting and analysis of the different trade-offs and identifying some of the problems that are still active subject of research
Disciplinas: Ciencias de la computación
Palabras clave: Procesamiento de datos,
Almacenamiento de datos,
Big data,
Bases de datos,
Data warehouse
Keyword: Computer science,
Data processing,
Data storage,
Big data,
Data bases,
Data warehouse
Texto completo: Texto completo (Ver PDF)