Graph Mining under Linguistic Constraints for Exploring Large Texts



Título del documento: Graph Mining under Linguistic Constraints for Exploring Large Texts
Revue: Computación y sistemas
Base de datos: PERIÓDICA
Número de sistema: 000365511
ISSN: 1405-5546
Autores: 1
2
3
3
Instituciones: 1L'Universite Nantes Angers Le Mans, Nantes, Loire-Atlantique. Francia
2Institut National des Sciences Appliquees de Rennes, Rennes, Ille-et-Vilaine. Francia
3Universite de Caen Basse–Normandie, Caen, Calvados. Francia
Año:
Periodo: Abr-Jun
Volumen: 17
Número: 2
Paginación: 239-250
País: México
Idioma: Inglés
Tipo de documento: Artículo
Enfoque: Experimental, aplicado
Resumen en español En este artículo se propone el enfoque para la exploración de textos grandes destacando las sub-partes coherentes. El método de exploración se basa en la representación del texto mediante un gráfo de acuerdo con el modelo lingüístico de Hoey, el cual permite la selección y vinculación de frases adyacentes y no adyacentes. La principal aportación de este trabajo es la propuesta del método basado en el modelo lingüístico de Hoey por un lado y por otro lado en la técnica especial de minería de grafos llamada minería CoHoP, con el fin de extraer las sub-partes coherentes de la representación gráfica del texto. Se realizaron unos experimentos sobre varios textos en inglés mostrando el interés del enfoque propuesto
Resumen en inglés In this paper, we propose an approach to explore large texts by highlighting coherent sub-parts. The exploration method relies on a graph representation of the text according to Hoey's linguistic model which allows the selection and the binding of adjacent and non-adjacent sentences. The main contribution of our work consists in proposing a method based on both Hoey's linguistic model and a special graph mining technique, called CoHoP mining, to extract coherent sub-parts of the graph representation of the text. We have conducted some experiments on several English texts showing the interest of the proposed approach
Disciplinas: Ciencias de la computación
Palabras clave: Procesamiento de datos,
Lingüística computacional,
Minería de texto,
Coherencia de texto,
Modelos lingüísticos
Keyword: Computer science,
Data processing,
Computing linguistics,
Text mining,
Text coherence,
Linguistic models
Texte intégral: Texto completo (Ver HTML)