Resolución de correferencias para la captura de eventos



Document title: Resolución de correferencias para la captura de eventos
Journal: Revista pilquen. Sección ciencias sociales
Database: CLASE
System number: 000493955
ISSN: 1851-3123
Authors: 1
2
2
2
2
Institutions: 1Universidad Nacional del Sur, Bahía Blanca, Buenos Aires. Argentina
2Universidad de Deusto, Bilbao, Vizcaya. España
Year:
Season: Ago
Volumen: 18
Number: 2
Pages: 40-49
Country: Argentina
Language: Español
Document type: Artículo
Approach: Analítico
Spanish abstract El algoritmo Stanford Multi Sieve Pass (propuesto por Raghunathan et al. 2010) realiza secuencialmente una serie de pasos de reconocimiento que de manera incremental terminan proponiendo correferencias entre las entidades candidatas identificadas en el texto. En este artículo, presentamos brevemente los trabajos de adaptación de este algoritmo y de otras herramientas de análisis (p. e., OpeNER) a textos en español (Agerri et al. 2013; Bermúdez 2013). A fin de avanzar en el desarrollo de estas herramientas para el Procesamiento del Lenguaje Natural (PLN), aplicamos estas directrices manualmente sobre un corpus experimental extraído de Wikipedia, con los que se pueden configurar textos breves (como por ejemplo tuits u otro tipo de microcontenidos) con sentido pleno. Como resultado, se ofrece un ejemplo de análisis manual que será automatizado en etapas posteriores de la investigación
English abstract The algorithm (proposed by Raghunathan et al. 2010) sequentially performs a series of pass of recognition, and allows to go incrementally proposing candidates to coreferenced between named entities in the text. The article briefly presents the work of adapting the algorithm Stanford Multi Pass Sieve and other analysis tools (OpeNer) to texts in Spanish (and other Agerri 2013, Bermúdez 2013). The result is a fragmented speech in sentences with full sense, that even being independent of the speech have not lost the discursive framework they belong (to inherit metadata documentaries). This can feed the event-based knowledge systems, or be linked to deposits of open data, or published independently (vg. as tweets). As a result, the article offers an example of manual analysis that, in further research, will be automatic
Disciplines: Literatura y lingüística
Keyword: Lingüística aplicada,
Tecnología de la información,
Procesamiento de lenguajes naturales,
Correferencia,
Captura de eventos,
Algoritmos de resolución,
Simple Knowledge Organization System (SKOS),
Datos vinculados,
Textos,
Español,
Wikipedia
Full text: http://www.scielo.org.ar/scielo.php?script=sci_arttext&pid=S1851-31232015000200004&lng=es&nrm=iso&tlng=es