Normalização de nomes de autores em fontes de informação institucionais: proposta de um método automático de verificação de erros



Document title: Normalização de nomes de autores em fontes de informação institucionais: proposta de um método automático de verificação de erros
Journal: Em questao
Database: CLASE
System number: 000422903
ISSN: 1808-5245
Authors: 1

2
3
Institutions: 1Universidade de Sao Paulo, Escola de Artes, Ciencias e Humanidades, Sao Paulo. Brasil
2Universidade de Sao Paulo, Departamento Tecnico do Sistema Integrado de Bibliotecas, Sao Paulo. Brasil
3Universidade de Sao Paulo, Faculdade de Filosofia, Ciencias e Letras, Ribeirao Preto, Sao Paulo. Brasil
Year:
Season: Dic
Volumen: 18
Pages: 263-279
Country: Brasil
Language: Portugués
Document type: Artículo
Approach: Analítico, descriptivo
English abstract The recovery of scientific literature by authoring is a challenge for many maintainers of databases, due to the ambiguity cau - sed by problems originated from lack of control at the time of indexing. This paper presents an automatic approach of checking for errors in authorship metadata of University of São Paulo scientific production database (Dedalus) comparing these data with data recovered from the human resources database. Using approximate string matching algorithms, these data from human resources is compared with the scientific production data of four institutes from USP (covering the period 2006-2010). Based on this pilot study it was possible to establish interoperability mecha - nisms between Dedalus database and the USP human resources database. As an immediate result, it was possible to map the percentage of errors and to create mechanisms of interference, establish a timeline to expand the study to other institutes from USP, and standardization procedures
Portuguese abstract A recuperação da produção científica por autoria é um desafio para diversos mantenedores de bases de dados, devido à ambi - guidade causada por problemas derivados da falta de controle no momento da indexação. Este estudo apresenta um método automático para verificação de ocorrência de erros em dados de autorias da base de produção científica da Universidade de São Paulo (Dedalus) tomando como base o banco institucional de recursos humanos. Por meio de algoritmos de busca aproximada, compararam-se esses dados com os dados de autoria registrados no banco de produção científica de quatro unidades da USP (período de 2006-2010). Com base nesse estudo piloto foi possível estabelecer mecanismos de interoperabilidade entre o banco da produção e os bancos institucionais de recursos humanos, além de permitir mapear a porcentagem de erros, desenvolver mecanismos de interferência e estabelecer um cronograma para ampliar o estudo as demais unidades USP, bem como procedimentos de normalização
Disciplines: Bibliotecología y ciencia de la información
Keyword: Fuentes documentales,
Producción científica,
Bases de datos,
Recuperación de información,
Análisis y sistematización de la información,
Indización,
Universidade de Sao Paulo (USP),
Normalización,
Normas,
Interoperabilidad
Full text: Texto completo (Ver HTML)