Avaliação de critérios para seleção de sintagmas nominais com valor para a recuperação da informação



Título del documento: Avaliação de critérios para seleção de sintagmas nominais com valor para a recuperação da informação
Revista: Transinformacao
Base de datos: CLASE
Número de sistema: 000500698
ISSN: 0103-3786
Autores: 1
2
Instituciones: 1Universidade Federal de Campina Grande, Biblioteca Central, Campina Grande, Paraiba. Brasil
2Universidade Federal de Pernambuco, Centro de Artes e Comunicacao, Recife, Pernambuco. Brasil
Año:
Periodo: May-Ago
Volumen: 30
Número: 2
País: Brasil
Idioma: Portugués
Tipo de documento: Artículo
Enfoque: Analítico, descriptivo
Resumen en inglés This study assesses the criteria for selecting the most representative noun phrases from documents written in Portuguese in the field of law. The research methods were literature review and an experiment. In the experiment, ten selection criteria were applied to noun phrases extracted from a set of abstracts of theses and dissertations. The effectiveness of the criteria was assessed regarding the selection of noun phrases relevant for information retrieval. Through the experiment, the most effective criteria identified were removal of noun phrases with stopwords value or noun phrases containing pronouns, the selection criteria of noun phrases based on position of occurrence, level of the noun phrase, inverse document frequency, and document occurrence frequency
Resumen en portugués O presente estudo avalia critérios para seleção de sintagmas nominais mais representativos do conteúdo de documentos jurídicos em língua portuguesa. A metodologia da pesquisa consistiu em revisão de literatura brasileira e experimento. No experimento foram aplicados dez critérios de seleção aos sintagmas nominais extraídos de um conjunto de resumos de teses e dissertações. Os critérios foram avaliados quanto à eficácia na seleção de sintagmas nominais relevantes para a recuperação da informação. Por meio do experimento, foram identificados como mais eficazes os critérios de eliminação de sintagmas nominais considerados stopwords ou contendo pronomes no núcleo, e os critérios de seleção por posição de ocorrência, nível do sintagma nominal, inverso da frequência nos documentos e frequência de ocorrência em um documento
Disciplinas: Bibliotecología y ciencia de la información
Palabras clave: Análisis y sistematización de la información,
Indización automática,
Información legal,
Representación de la información,
Sintagmas nominales
Keyword: Information analysis,
Automatic indexing,
Legal information,
Information representation,
Noun phrases
Texto completo: Texto completo (Ver HTML) Texto completo (Ver PDF)