Processamento de linguagem natural e acoplamento bibliográfico: uma análise da proximidade entre os artigos mais acessados do periódico Scientometrics



Título del documento: Processamento de linguagem natural e acoplamento bibliográfico: uma análise da proximidade entre os artigos mais acessados do periódico Scientometrics
Revista: Informacao & informacao
Base de datos:
Número de sistema: 000607604
ISSN: 1414-2139
Autores: 1
2
Instituciones: 1Universidade Estadual Paulista "Júlio de Mesquita Filho", Marília, São Paulo. Brasil
2Universidade de Marília, Marília, São Paulo. Brasil
Año:
Volumen: 27
Número: 3
Paginación: 262-287
País: Brasil
Idioma: Portugués
Tipo de documento: Artículo
Resumen en inglés Objective: to compare the methods of Natural Language Processing and Bibliographic Coupling normalized via Salton Cosine applied to the ten most accessed articles of 2020 in the Scientometrics journal. Methodology: It calculates the similarity between all articles according to five perspectives, namely: similarities between active forms of the full text, active forms of abstracts, keywords in common, bibliographic coupling between documents and bibliographic coupling of authors. Furthermore, it calculates the Pearson and Spearman correlations, applies the Wilcoxon non-parametric test at a 5% significance level, and represents the normalized values in a boxplot. Results: It finds that the specificities of each method significantly influence the achievement of a significant correlation between the measures in which the two coupling calculations would correlate more strongly with each other, as well as two calculations based on natural language processing. Note that the coupling calculations correlated significantly, as for each document coupling value there is necessarily at least one author coupling value. About calculations based on natural language processing, there is a strong correlation between full texts and abstracts, as there is a content dependence between both. The Wilcoxon test measured significant differences between all pairs of compared measurements. Conclusions: It concludes a strong correlation between full texts and abstracts, and between bibliographic coupling methods. However, there is a significant difference between the calculated values.
Resumen en español Objetivo: compara los métodos de Procesamiento del Lenguaje Natural y Acoplamiento Bibliográfico normalizados a través del Coseno de Salton aplicados a los diez artículos más consultados de 2020 de la revista Scientometrics. Metodología: Calcular una similitud entre todos los artigos segundo cinco perspectivas, sendo elas: similitudes entre formas activas do texto completo, formas activas dos resumos, palavravas-chaves em comum, acoplamento bibliográfico entre documentos e acoplamento bibliográfico de autores. Además, calcula las correlaciones de Pearson y Spearman, aplica la prueba no paramétrica de Wilcoxon a un nivel de 5% de significancia y representa los valores normalizados en el diagrama de caja. Resultados: Encuentra que las especificidades de cada método influyen significativamente en el logro de una correlación significativa entre las medidas en las que los dos cálculos de acoplamiento se correlacionarían más fuertemente entre sí, así como dos cálculos basados en el procesamiento del lenguaje natural. Tenga en cuenta que los cálculos de acoplamiento se correlacionaron significativamente, ya que para cada valor de acoplamiento de documento hay necesariamente al menos un valor de acoplamiento de autor. En cuanto a los cálculos basados en el procesamiento del lenguaje natural, existe una fuerte correlación entre los textos completos y los resúmenes, ya que existe una dependencia de contenido entre ambos. La prueba de Wilcoxon midió diferencias significativas entre todos los pares de medidas comparadas. Conclusiones: Concluye una fuerte correlación entre textos completos y resúmenes, y entre métodos de acoplamiento bibliográfico. Sin embargo, existe una diferencia significativa entre los valores calculados.
Resumen en portugués Objetivo: compara os métodos de Processamento de Linguagem Natural e Acoplamento Bibliográfico normalizados via Cosseno de Salton aplicados aos dez artigos mais acessados de 2020 do periódico Scientometrics. Metodologia: Calcula a similaridade entre todos os artigos segundo cinco perspectivas, sendo elas: similaridades entre formas ativas do texto completo, formas ativas dos resumos, palavravas-chaves em comum, acoplamento bibliográfico entre documentos e acoplamento bibliográfico de autores. Ademais, calcula as correlações de Pearson e Spearman, aplica o teste não [S. lparamétrico de Wilcoxon a nível de 5% de significância e representa os valores normalizados em boxplot. Resultados: Constata que as especificidades de cada método influenciam significativamente na obtenção de correlação significativa entre as medidas em que os dois cálculos de acoplamento se correlacionariam de maneira mais forte entre si, assim como dois cálculos baseados no processamento de linguagem natural. Observa que os cálculos de acoplamento, correlacionaram-se de maneira significativo, pois, para cada valor de acoplamento de documentos há necessariamente, ao menos um valor de acoplamento de autores. Com relação aos cálculos baseados no processamento de linguagem natural, verifica forte correlação entre textos completos e resumos, visto que há uma dependência de conteúdo entre ambos. O teste de Wilcoxon, aferiu diferenças significativas entre todos os pares de medidas comparadas. Conclusão: Conclui forte correlação entre textos completos e resumos, e, entre os métodos de acoplamento bibliográfico. Entretanto, guarda distinção significativa entre os valores calculados.
Disciplinas: Bibliotecología y ciencia de la información
Palabras clave: Acoplamiento bibliográfico,
ndice de similitud,
Procesamiento natural del lenguaje,
Análisis y sistematización de la información
Keyword: Bibliographic coupling,
Similarity index,
Natural language processing,
Information analysis
Texto completo: Texto completo (Ver PDF) Texto completo (Ver HTML)