Caracterización de riesgos urbanos en prensa aplicando minería de texto para el enriquecimiento de datos abiertos



Título del documento: Caracterización de riesgos urbanos en prensa aplicando minería de texto para el enriquecimiento de datos abiertos
Revista: Investigación bibliotecológica
Base de datos: CLASE
Número de sistema: 000528978
ISSN: 0187-358X
Autores: 1
2
Instituciones: 1Instituto Politécnico Nacional, Centro de Investigación en Computación, Ciudad de México. México
2Universidad de la República, Facultad de Información y Comunicación, Montevideo. Uruguay
Año:
Periodo: Abr-Jun
Volumen: 36
Número: 91
Paginación: 85-107
País: México
Idioma: Español
Tipo de documento: Artículo
Enfoque: Analítico, descriptivo
Resumen en español Las noticias se difunden libremente y con amplia disponibilidad para los usuarios de internet con mucha más facilidad que con los medios tradicionales. En estas noticias se pueden encontrar infinidad de “datos menores” ocultos que pueden suministrar valiosa información no recogida en otras fuentes de información. En este contexto, en este artículo nos ha interesado analizar y caracterizar los riesgos urbanos recogidos en prensa abierta en el contexto nacional uruguayo utilizando técnicas de minería de texto. Esta propuesta permite conformar un corpus de noticias que parte de eventos de riesgo contenidos en datos abiertos. El corpus abarca el periodo 2003-2019 y proviene de periódicos digitales abiertos (El Eco Digital, Montevideo Portal y La Red 21). Sobre este corpus se aplican diversas técnicas de minería de texto empleando el software QDA-MinerLite y el lenguaje Python (mediante la librería Scattertext) para identificar, caracterizar y descubrir conocimiento sobre estos eventos. Los resultados obtenidos del procesamiento del corpus ayudan a enriquecer los datos abiertos existentes sobre riesgos en Uruguay, incorporando información sobre sus efectos, actores e intervenciones asociadas
Resumen en inglés News is freely spread and widely available to Internet users much more easily than traditional media. In the news, we can find an infinite number of hidden “minor data,” that can provide valuable information not collected in other sources of information. In this context, we have been interested in analyzing and characterizing the urban risks contained in the Uruguayan open newspapers using text mining techniques. This proposal makes it possible to create a news corpus based on risk events included in open data. The corpus covers 2003-2019 and is built from the digital open newspapers El Eco Digital, Montevideo Portal, and La Red 21. Various text mining techniques are applied to this corpus using the QDA-MinerLite software and the Python language (concretely, through the Scattertext library) to identify, characterize, and discover insights on these events. The corpus processing results help enrich the existing open data on risks in Uruguay, incorporating information on their effects, actors, and associated interventions
Disciplinas: Bibliotecología y ciencia de la información
Palabras clave: Sistemas de información,
Riesgo urbano,
Minería de textos,
Prensa digital,
Datos abiertos
Keyword: Information systems,
Urban risk,
Text mining,
Digital newspapers,
Open data
Texto completo: Texto completo (Ver HTML) Texto completo (Ver PDF)