Normalização de nomes de autores em fontes de informação institucionais: proposta de um método automático de verificação de erros



Título del documento: Normalização de nomes de autores em fontes de informação institucionais: proposta de um método automático de verificação de erros
Revista: Em questao
Base de datos: CLASE
Número de sistema: 000422903
ISSN: 1808-5245
Autores: 1

2
3
Instituciones: 1Universidade de Sao Paulo, Escola de Artes, Ciencias e Humanidades, Sao Paulo. Brasil
2Universidade de Sao Paulo, Departamento Tecnico do Sistema Integrado de Bibliotecas, Sao Paulo. Brasil
3Universidade de Sao Paulo, Faculdade de Filosofia, Ciencias e Letras, Ribeirao Preto, Sao Paulo. Brasil
Año:
Periodo: Dic
Volumen: 18
Paginación: 263-279
País: Brasil
Idioma: Portugués
Tipo de documento: Artículo
Enfoque: Analítico, descriptivo
Resumen en inglés The recovery of scientific literature by authoring is a challenge for many maintainers of databases, due to the ambiguity cau - sed by problems originated from lack of control at the time of indexing. This paper presents an automatic approach of checking for errors in authorship metadata of University of São Paulo scientific production database (Dedalus) comparing these data with data recovered from the human resources database. Using approximate string matching algorithms, these data from human resources is compared with the scientific production data of four institutes from USP (covering the period 2006-2010). Based on this pilot study it was possible to establish interoperability mecha - nisms between Dedalus database and the USP human resources database. As an immediate result, it was possible to map the percentage of errors and to create mechanisms of interference, establish a timeline to expand the study to other institutes from USP, and standardization procedures
Resumen en portugués A recuperação da produção científica por autoria é um desafio para diversos mantenedores de bases de dados, devido à ambi - guidade causada por problemas derivados da falta de controle no momento da indexação. Este estudo apresenta um método automático para verificação de ocorrência de erros em dados de autorias da base de produção científica da Universidade de São Paulo (Dedalus) tomando como base o banco institucional de recursos humanos. Por meio de algoritmos de busca aproximada, compararam-se esses dados com os dados de autoria registrados no banco de produção científica de quatro unidades da USP (período de 2006-2010). Com base nesse estudo piloto foi possível estabelecer mecanismos de interoperabilidade entre o banco da produção e os bancos institucionais de recursos humanos, além de permitir mapear a porcentagem de erros, desenvolver mecanismos de interferência e estabelecer um cronograma para ampliar o estudo as demais unidades USP, bem como procedimentos de normalização
Disciplinas: Bibliotecología y ciencia de la información
Palabras clave: Fuentes documentales,
Producción científica,
Bases de datos,
Recuperación de información,
Análisis y sistematización de la información,
Indización,
Universidade de Sao Paulo (USP),
Normalización,
Normas,
Interoperabilidad
Texto completo: Texto completo (Ver HTML)