A terminologia em Sistemas de Recuperação da Informação baseada na WORDNET.PT



Document title: A terminologia em Sistemas de Recuperação da Informação baseada na WORDNET.PT
Journal: Informacao & sociedade
Database: CLASE
System number: 000514767
ISSN: 0104-0146
Authors: 1
1
Institutions: 1Universidade Federal de Sao Carlos, Departamento de Ciencia da Informacao, Sao Carlos, Sao Paulo. Brasil
Year:
Season: Abr-Jun
Volumen: 3
Number: 2
Pages: P-P
Country: Brasil
Language: Portugués
Document type: Artículo
Approach: Analítico, descriptivo
English abstract The article results from post-doctoral research conducted in Universidade Federal de Santa Catarina. The goal is to propose information retrieval strategies based on natural language processing, to extract semantic relations from WordNet.Pt, and use them to represent documents and users’ search expressions. The approach is qualitative, exploratory and applied to ambiguity problems in information retrieval. As for the procedures used, it is a bibliographic search. The discussion is motivated by the problem of low precision and high recall in user searches, influenced both by the absence of semantic correspondence between search expressions and terms used in indexing and by the lack of determination of the semantic similarity between document terms that, even being lexicographically different, have the same meaning. The research core is justified by the advantage of developing systems that combine natural language and controlled language, for an interactive search. Although in a partial way, the research points to important results in the solution of lexical ambiguity, through semantic relationships in the representation of documents and user search. On the one hand, this success guarantees the restriction of the search space and, consequently, precision. On the other hand, the expansion of consultations by suggesting equivalent terms from controlled vocabularies and the natural language and its variants
Portuguese abstract O objetivo deste trabalho é propor um sistema de recuperação da informação baseado no processamento da linguagem para extrair lexicalizações da WordNet.Pt e relacioná-las aos termos do vocabulário controlado e das expressões de busca dos usuários. O enfoque é qualitativo, exploratório e aplicado à solução de problemas sobre a ambiguidade na recuperação da informação. Quanto aos procedimentos utilizados, trata-se de uma pesquisa bibliográfica. A discussão é motivada pelo problema da alta revocação, determinada pelo grau de similaridade entre as expressões de busca dos usuários e os documentos do corpus, sem a determinação precisa da semântica envolvida. O núcleo de pesquisa justifica-se pela vantagem de desenvolvimento de sistemas que combinam a linguagem natural e a linguagem controlada orientada, para uma busca interativa. Embora de forma parcial, a pesquisa aponta para resultados importantes na solução da ambiguidade lexical, por meio de relacionamentos semânticos entre termos da linguagem natural e artificial. Por um lado, este sucesso garante a restrição do espaço da busca e, consequentemente, a precisão. Por outro, a expansão de consultas por meio de sugestão de termos equivalentes de vocabulários controlados e da língua natural e suas variantes
Disciplines: Bibliotecología y ciencia de la información
Keyword: Análisis y sistematización de la información,
WordNet.Pt,
Procesamiento de lenguajes naturales,
Recuperación de información,
Ambigüedad,
Relevancia
Full text: https://periodicos.ufpb.br/ojs2/index.php/ies/article/view/50756/30385