Minería de texto empleando la semejanza entre estructuras semánticas



Título del documento: Minería de texto empleando la semejanza entre estructuras semánticas
Revista: Computación y sistemas
Base de datos: PERIÓDICA
Número de sistema: 000247817
ISSN: 1405-5546
Autores: 1
2
Instituciones: 1Instituto Politécnico Nacional, Centro de Investigación en Computación, México, Distrito Federal. México
2Instituto Nacional de Astrofísica, Optica y Electrónica, Tonantzintla, Puebla. México
Año:
Periodo: Jul-Sep
Volumen: 9
Número: 1
Paginación: 63-81
País: México
Idioma: Español
Tipo de documento: Artículo
Enfoque: Aplicado
Resumen en español El tesoro más valioso de la raza humana es el conocimiento. Gran parte de este conocimiento existe en forma de lenguaje natural: libros, periódicos, artículos, etcétera. La posesión real de todo este conocimiento depende de nuestra habilidad para realizar ciertas operaciones con la información, por ejemplo: buscarla, compararla, y resumirla. La minería de texto, una nueva área de investigación definida como descubrimiento de conocimiento en colecciones de textos, se enfoca en el análisis de grandes conjuntos de documentos. En particular, considera el descubrimiento de patrones interesantes, tales como grupos, asociaciones y desviaciones, en colecciones de textos. Los métodos actuales de minería de texto se caracterizan por usar representaciones sencillas del contenido de los documentos, por ejemplo, bolsas o vectores de palabras. Por una parte estas representaciones son fáciles de obtener y analizar, pero por otra parte restringen los patrones descubiertos a un nivel temático. Con el propósito de obtener resultados más útiles y significativos deben usarse representaciones más completas de la información. Basándonos en esta suposición se propuso un nuevo método para realizar minería de texto a nivel detalle. Este método usa los grafos conceptuales como representación del contenido de los textos, y obtiene algunos patrones descriptivos de los documentos aplicando varios tipos de operaciones sobre estos grafos
Resumen en inglés Knowledge is the most valuable treasure of humankind. Most of this knowledge exists in natural language format, for instance, in books, journals, reports, etc. The real possession of all this knowledge depends on our capabilities to perform different tasks with texts, such as: searching for interesting texts, comparing different documents, and summarizing them. Text mining, an emerging research area that can be roughly characterized as knowledge discovery in large text collections, is focused on automatically analyzing a set of texts. Mainly, it is concerned with the discovery of interesting patterns such as clusters, associations, and deviations from large text collections. Current methods of text mining tend to use simplistic and shallow representations of texts, e.g., keyword sets or keyword frequency vectors. On one hand, such representations are easy to obtain from texts and easy to analyze, but on the other hand, however, they restrict the knowledge discovery results to the topic level. To obtain more useful and meaningful results, richer text representations are necessary. On the basis of this assumption, we propose a new method for doing text mining at detail level. This method uses conceptual graphs for representing text content and relies on performing some tasks on these graphs, allowing the discovery of more descriptive patterns
Disciplinas: Ciencias de la computación
Palabras clave: Bases de datos,
Minería de texto,
Grafos
Keyword: Computer science,
Databases,
Text mining,
Graphs
Texto completo: Texto completo (Ver HTML)