A produção científica sobre qualidade de dados em big data: um estudo na base de dados Web of Science



Título del documento: A produção científica sobre qualidade de dados em big data: um estudo na base de dados Web of Science
Revue: RDBCI
Base de datos: CLASE
Número de sistema: 000521198
ISSN: 1678-765X
Autores: 1
1
1
Instituciones: 1Dígitro Tecnologia, Florianopolis, Santa Catarina. Brasil
Año:
Volumen: 16
Número: 1
Paginación: 194-210
País: Brasil
Idioma: Portugués
Tipo de documento: Artículo
Enfoque: Analítico, descriptivo
Resumen en inglés More and more, the big data theme has attracted interest in researchers from different areas of knowledge, among them information scientists who need to understand their concepts and applications in order to contribute with new proposals for the management of the information generated from the data stored in these environments. The objective of this article is to present a survey of publications about data quality in big data in the Web of Science database until the year 2016. Will be presented the total number of publications indexed in the database, the number of publications per year, the location the origin of the research and a synthesis of the studies found. The survey in the database was conducted in July 2017 and resulted in a total of 23 publications. In order to make it possible to present a summary of the publications in this article, searches were made of the full texts of all the publications on the Internet and read the ones that were available. With this survey it was possible to conclude that the studies on data quality in big data had their publications starting in 2013, most of which present literature reviews and few effective proposals for the monitoring and management of data quality in environments with large volumes of data. Therefore, it is intended with this survey to contribute and foster new research on the context of data quality in big data environments
Otro resumen Cada vez más el tema big data ha despertado interés en investigadores de las más diversas áreas del conocimiento, entre ellos los científicos de la información que necesitan comprender sus conceptos y aplicaciones para poder contribuir con nuevas propuestas para la gestión de las informaciones generadas a partirde los datos almacenados en estos datos los ambientes. El objetivo de este artículo es presentar un relevamiento de las publicaciones relacionadas con la calidad de datos en big data en la base de datos Web of Science hasta elaño 2016. Se presentarán el total de publicaciones indexadas en la base, la cantidad de publicaciones al año, el local de origen de las investigaciones y una síntesis de los estudios encontrados. La investigación en la base de datos se realizó en julio de 2017 y resultó en un total de 23 publicaciones. Con el fin de posibilitar la presentación de un resumen de las publicaciones, se realizaron búsquedas por los textos completos de todas las publicaciones en internet y la lectura de los que se encontraban disponibles. Con este levantamiento fue posible concluir que los estudios sobre calidad de datos en big data tuvieron sus publicaciones a partir de 2013, siendo que su mayoría presenta revisiones de la literatura y pocas propuestas efectivas para el monitoreo y gestión de lacalidad de datos en ambientes con grandes volúmenes de datos
Resumen en portugués Cada vez mais o tema big data tem despertado interesse em pesquisadores das mais diferentes áreas do conhecimento, entre eles os cientistas da informação que necessitam compreender seus conceitos e aplicações para poderem contribuir com novas propostas para a gestão das informações geradas a partir dos dados armazenado nestes ambientes. O objetivo deste artigo é apresentar um levantamento das publicações relacionadas a qualidade de dados em big data na base de dados Web of Science até o ano de 2016. Serão apresentados o total de publicações indexadas na base, a quantidade de publicações por ano, o local de origem das pesquisas e uma síntese dos estudos encontrados. A pesquisa na base de dados foi realizada em julho de 2017 e resultou em um total de 23 publicações. A fim de possibilitar a apresentação de um resumo das publicações neste artigo foram realizadas buscas pelos textos completos de todas as publicações na internet e feita a leitura dos que se encontravam disponíveis. Com este levantamento foi possível concluir que os estudos sobre qualidade de dados em big data tiveram suas publicações a partir de 2013, sendo que a sua maioria apresenta revisões da literatura e poucas propostas efetivas para o monitoramento e gestão da qualidade de dados em ambientes com grandes volumes de dados. Sendo assim, pretende-se com este levantamento contribuir e fomentar novas pesquisas sobre o contexto qualidade de dados em ambientes big data
Disciplinas: Bibliotecología y ciencia de la información
Palabras clave: Sistemas de información,
Calidad de los datos,
Big Data,
Gestión de la calidad,
Web of Science (WoS)
Keyword: Information systems,
Data quality,
Data management,
Web of Science (WoS)
Texte intégral: Texto completo (Ver PDF)