Ontology lexicalization: Relationship between content and meaning in the context of Information Retrieval



Título del documento: Ontology lexicalization: Relationship between content and meaning in the context of Information Retrieval
Revue: Transinformacao
Base de datos: CLASE
Número de sistema: 000452275
ISSN: 0103-3786
Autores: 1
Instituciones: 1Universidade de Brasilia, Faculdade de Ciencia da Informacao, Brasilia, Distrito Federal. Brasil
2Universidade Federal de Santa Catarina, Departamento de Ciencia da Informacao, Florianopolis, Santa Catarina. Brasil
Año:
Periodo: Ene-Abr
Volumen: 29
Número: 1
Paginación: 57-72
País: Brasil
Idioma: Portugués
Tipo de documento: Artículo
Enfoque: Analítico, descriptivo
Resumen en inglés The proposal presented in this study seeks to properly represent natural language to ontologies and vice-versa. Therefore, the semi-automatic creation of a lexical database in Brazilian Portuguese containing morphological, syntactic, and semantic information that can be read by machines was proposed, allowing the link between structured and unstructured data and its integration into an information retrieval model to improve precision. The results obtained demonstrated that the methodology can be used in the risco financeiro (financial risk) domain in Portuguese for the construction of an ontology and the lexical-semantic database and the proposal of a semantic information retrieval model. In order to evaluate the performance of the proposed model, documents containing the main definitions of the financial risk domain were selected and indexed with and without semantic annotation. To enable the comparison between the approaches, two databases were created based on the texts with the semantic annotations to represent the semantic search. The first one represents the traditional search and the second contained the index built based on the texts with the semantic annotations to represent the semantic search. The evaluation of the proposal was based on recall and precision. The queries submitted to the model showed that the semantic search outperforms the traditional search and validates the methodology used. Although more complex, the procedure proposed can be used in all kinds of domains
Resumen en portugués Esta proposta visa representar a linguagem natural na forma adequada às ontologias e vice-versa. Para tanto, propõe-se à criação semiautomática de base de léxicos em português brasileiro, contendo informações morfológicas, sintáticas e semânticas apropriadas para a leitura por máquinas, permitindo vincular dados estruturados e não estruturados, bem como integrar a leitura em modelo de recuperação da informação para aumentar a precisão. Os resultados alcançados demonstram a utilização da metodologia, no domínio de risco financeiro em português, para a elaboração da ontologia, da base léxico-semântica e da proposta do modelo de recuperação da informação semântica. Para avaliar a performance do modelo proposto, foram selecionados documentos contendo as principais definições do domínio de risco financeiro. Esses foram indexados com e sem anotação semântica. Para possibilitar a comparação entre as abordagens, foram criadas duas bases, a primeira representando a busca tradicional, e a segunda contendo o índice construído, a partir dos textos com as anotações semânticas para representar a busca semântica. A avaliação da proposta é baseada na revocação e na precisão. As consultas submetidas ao modelo mostram que a busca semântica supera o desempenho da tradicional e validam a metodologia empregada. O procedimento, embora adicione complexidade em sua elaboração, pode ser reproduzido em qualquer outro domínio
Disciplinas: Bibliotecología y ciencia de la información
Palabras clave: Análisis y sistematización de la información,
Ontologías,
Recuperación de información,
Organización de la información,
Web semántica,
Lexicología
Texte intégral: Texto completo (Ver PDF)