Learning System of Web Navigation Patterns through Hypertext Probabilistic Grammars



Document title: Learning System of Web Navigation Patterns through Hypertext Probabilistic Grammars
Journal: INGE CUC
Database: PERIÓDICA
System number: 000385307
ISSN: 2382-4700
Authors: 1
Institutions: 1Universidad Nacional Mayor de San Marcos, Lima. Perú
Year:
Season: Ene-Jun
Volumen: 11
Number: 1
Pages: 72-78
Country: Colombia
Language: Inglés
Document type: Artículo
Approach: Analítico, descriptivo
Spanish abstract Uno de los problemas que reviste real interés en el área de minería de uso de la web es capturar las actividades de los usuarios durante su conexión y extraer patrones de comportamiento que permitan definir sus preferencias con el fin de mejorar el diseño de futuras páginas adaptando las interfaces de los sitios web a los usuarios individuales., En esta investigación se pretende ofrecer en primer lugar una presentación de los fundamentos metodológicos del uso de lenguajes probabilísticos para identificar sitios web más relevantes o visitados. En segundo lugar se representa las sesiones web mediante grafos y gramáticas libres de contexto probabilísticas de tal forma que las sesiones que tengan mayor probabilidad son consideradas las más visitadas o más preferidas, por tanto las más relevantes en relación a un tópico determinado. Se pretende desarrollar una herramienta para procesamiento de sesiones web obtenidas a partir de log de servidor representado mediante gramáticas probabilísticas libres de contexto
English abstract One issue of real interest in the area of web data mining is to capture users’ activities during connection and extract behavior patterns that help define their preferences in order to improve the design of future pages adapting websites interfaces to individual users. This research is intended to provide, first of all, a presentation of the methodological foundations of the use of probabilistic languages to identify relevant or most visited websites. Secondly, the web sessions are represented by graphs and probabilistic context-free grammars so that the sessions that have the highest probabilities are considered the most visited and most preferred, therefore, the most important in relation to a particular topic. It aims to develop a tool for processing web sessions obtained from a log server represented by probabilistic context-free grammars
Disciplines: Ciencias de la computación
Keyword: Procesamiento de datos,
Tecnología de la información,
Hipertexto,
Gramáticas probabilísticas,
Patrones de navegación,
Aprendizaje de máquinas,
Recuperación de información,
Minería de datos
Keyword: Computer science,
Data processing,
Information technology,
Hypertext,
Probabilistic grammars,
Navigation patterns,
Machine learning,
Information retrieval,
Data mining
Full text: Texto completo (Ver HTML)