Inferência de tópicos para identificação de subáreas temáticas de projetos culturais



Título del documento: Inferência de tópicos para identificação de subáreas temáticas de projetos culturais
Revista: Perspectivas em ciencia da informacao
Base de datos: CLASE
Número de sistema: 000506533
ISSN: 1413-9936
Autores: 1
2
1
1
Instituciones: 1Universidade Federal de Goias, Goiania, Goias. Brasil
2Universidade Federal de Catalao, Catalao, Goias. Brasil
Año:
Periodo: Ene-Mar
Volumen: 26
Número: 1
País: Brasil
Idioma: Portugués
Tipo de documento: Artículo
Enfoque: Analítico, descriptivo
Resumen en inglés Open government data can be considered as an important initiative of institutions of civil society, promoting transparency and allowing its reuse as an input in the development of innovation projects. However, it is common for certain databases to require the application of specific treatments, so that the data can be used more efficiently, such as the case of classification using Data Mining. In this scenario, this paper presents an automatic topic inference proposal using the Latent Dirichlet Allocation method to classify cultural projects in their thematic areas, by identifying the similarity in their data. The results demonstrate the feasibility of the approach in the context of open government data
Resumen en portugués Os dados abertos governamentais podem ser vistos como uma importante iniciativa de órgãos e instituições da sociedade civil, voltados à promoção da transparência e permitindo, além disso, sua reutilização como insumo no desenvolvimento de projetos de inovação. Entretanto, é comum que determinados conjuntos de dados demandem a aplicação de tratamentos específicos, para que os mesmos possam ser utilizados de forma mais eficaz, como é o caso da necessidade de classificação destes dados através de Mineração de Dados. Neste cenário, este trabalho apresenta uma proposta de inferência de tópicos automática utilizando o método Latent Dirichlet Allocation para a classificação de projetos culturais em áreas temáticas, por meio da identificação da similaridade entre seus dados. Os resultados apresentados demonstram a viabilidade da abordagem no contexto de dados abertos governamentais
Disciplinas: Bibliotecología y ciencia de la información
Palabras clave: Información y sociedad,
Tecnología de la información,
Datos abiertos,
Temas,
Minería de datos,
Proyectos culturales
Keyword: Information and society,
Information technology,
Open government data,
Topic inference,
Data mining,
Cultural projects
Texto completo: Texto completo (Ver HTML) Texto completo (Ver PDF)