Caracterización de riesgos urbanos en prensa aplicando minería de texto para el enriquecimiento de datos abiertos



Document title: Caracterización de riesgos urbanos en prensa aplicando minería de texto para el enriquecimiento de datos abiertos
Journal: Investigación bibliotecológica
Database: CLASE
System number: 000528978
ISSN: 0187-358X
Authors: 1
2
Institutions: 1Instituto Politécnico Nacional, Centro de Investigación en Computación, Ciudad de México. México
2Universidad de la República, Facultad de Información y Comunicación, Montevideo. Uruguay
Year:
Season: Abr-Jun
Volumen: 36
Number: 91
Pages: 85-107
Country: México
Language: Español
Document type: Artículo
Approach: Analítico, descriptivo
Spanish abstract Las noticias se difunden libremente y con amplia disponibilidad para los usuarios de internet con mucha más facilidad que con los medios tradicionales. En estas noticias se pueden encontrar infinidad de “datos menores” ocultos que pueden suministrar valiosa información no recogida en otras fuentes de información. En este contexto, en este artículo nos ha interesado analizar y caracterizar los riesgos urbanos recogidos en prensa abierta en el contexto nacional uruguayo utilizando técnicas de minería de texto. Esta propuesta permite conformar un corpus de noticias que parte de eventos de riesgo contenidos en datos abiertos. El corpus abarca el periodo 2003-2019 y proviene de periódicos digitales abiertos (El Eco Digital, Montevideo Portal y La Red 21). Sobre este corpus se aplican diversas técnicas de minería de texto empleando el software QDA-MinerLite y el lenguaje Python (mediante la librería Scattertext) para identificar, caracterizar y descubrir conocimiento sobre estos eventos. Los resultados obtenidos del procesamiento del corpus ayudan a enriquecer los datos abiertos existentes sobre riesgos en Uruguay, incorporando información sobre sus efectos, actores e intervenciones asociadas
English abstract News is freely spread and widely available to Internet users much more easily than traditional media. In the news, we can find an infinite number of hidden “minor data,” that can provide valuable information not collected in other sources of information. In this context, we have been interested in analyzing and characterizing the urban risks contained in the Uruguayan open newspapers using text mining techniques. This proposal makes it possible to create a news corpus based on risk events included in open data. The corpus covers 2003-2019 and is built from the digital open newspapers El Eco Digital, Montevideo Portal, and La Red 21. Various text mining techniques are applied to this corpus using the QDA-MinerLite software and the Python language (concretely, through the Scattertext library) to identify, characterize, and discover insights on these events. The corpus processing results help enrich the existing open data on risks in Uruguay, incorporating information on their effects, actors, and associated interventions
Disciplines: Bibliotecología y ciencia de la información
Keyword: Sistemas de información,
Riesgo urbano,
Minería de textos,
Prensa digital,
Datos abiertos
Keyword: Information systems,
Urban risk,
Text mining,
Digital newspapers,
Open data
Full text: Texto completo (Ver HTML) Texto completo (Ver PDF)