Título del documento: Anaphora resolution without world knowledge
Revista: DELTA. Documentacao de estudos em linguistica teorica e aplicada
Base de datos: CLASE
Número de sistema: 000281206
ISSN: 0102-4450
Autors: 1
Institucions: 1Universidade Catolica de Pelotas, Pelotas, Rio Grande do Sul. Brasil
Any:
Volum: 19
Número: 1
Paginació: 181-200
País: Brasil
Idioma: Inglés
Tipo de documento: Artículo
Enfoque: Analítico, descriptivo
Resumen en inglés A typical problem in the resolution of pronominal anaphora is the presence of more than one candidate for the antecedent of the pronoun. Considering two English sentences like (1) "People buy expensive cars because they offer more status" and (2) "People buy expensive cars because they want more status" we can see that the two NPs "people" and "expensive cars", from a purely syntactic perspective, are both legitimate candidates as antecedents for the pronoun "they". This problem has been traditionally solved by using world knowledge (e.g. schema theory), where, through an internal representation of the world, we "know" that cars "offer" status and people "want" status. The assumption in this paper is that the use of world knowledge does not explain how the disambiguation process works and alternative explanations should be explored. Using a knowledge poor approach (explicit information from the text rather than implicit world knowledge) the study investigates to what extent syntactic and semantic constraints can be used to resolve anaphora. For this purpose, 1,400 examples of the word "they" were randomly selected from a corpus of 10,000,000 words of expository text in English. Antecedent candidates for each case were then analyzed and classified in terms of their syntactic functions in the sentence (subject, object, etc.) and semantic features (+ human, + animate, etc.). It was found that syntactic constraints resolved 85% of the cases. When combined with semantic constraints the resolution rate rose to 98%. The implications of the findings for Natural Language Processing are discussed
Resumen en portugués Um problema típico na resolução da anáfora pronominal é a presença de mais de um candidato para antecedente do pronome. Considerando duas frases como (1) "As pessoas compram casas de luxo porque elas oferecem status" e (2) "As pessoas compram casas de luxo porque elas querem status", podemos perceber que os dois SNs "pessoas" e "casas de luxo", de uma perspectiva estritamente sintática, são ambos candidatos legítimos para antecedente do pronome "elas". Este problema tem sido tradicionalmente resolvido pelo uso do conhecimento de mundo (Teoria de Esquemas, por exemplo), onde, através de uma representação interna do mundo, "sabemos" que casas "dão" status e que as pessoas "querem" status. O pressuposto neste trabalho é de que o uso do conhecimento de mundo não explica como o processo desambiguador funciona e explicações alternativas precisam ser exploradas. Usando uma abordagem pobre em conhecimento de mundo (informação explícita do texto em vez de conhecimento de mundo implícito) este estudo procura investigar até que ponto restrições sintáticas e semânticas podem ser usadas para resolver a anáfora. Para isso, 1.400 exemplos da palavra "they" foram aleatoriamente selecionados de um corpus de 10.000.000 de palavras de texto expositivo em língua inglesa. Os candidatos a antecedente em cada caso foram analisados e classificados de acordo com sua função sintática (sujeito, objeto, etc.) e seus traços semânticos (+ humano, + animado, etc.). Os resultados mostraram que as restrições sintáticas resolveram 85% dos casos. Quando essas restrições foram combinadas com as restrições semânticas, o percentual de resolução aumentou para 98%. Discutem-se, finalmente, as implicações desses resultados para o Processamento da Língua Natural
Disciplines Literatura y lingüística
Paraules clau: Lingüística aplicada,
Anáfora,
Ambigüedad,
Semántica,
Sintaxis
Text complet: Texto completo (Ver HTML)