Learning System of Web Navigation Patterns through Hypertext Probabilistic Grammars



Título del documento: Learning System of Web Navigation Patterns through Hypertext Probabilistic Grammars
Revista: INGE CUC
Base de datos: PERIÓDICA
Número de sistema: 000385307
ISSN: 2382-4700
Autors: 1
Institucions: 1Universidad Nacional Mayor de San Marcos, Lima. Perú
Any:
Període: Ene-Jun
Volum: 11
Número: 1
Paginació: 72-78
País: Colombia
Idioma: Inglés
Tipo de documento: Artículo
Enfoque: Analítico, descriptivo
Resumen en español Uno de los problemas que reviste real interés en el área de minería de uso de la web es capturar las actividades de los usuarios durante su conexión y extraer patrones de comportamiento que permitan definir sus preferencias con el fin de mejorar el diseño de futuras páginas adaptando las interfaces de los sitios web a los usuarios individuales., En esta investigación se pretende ofrecer en primer lugar una presentación de los fundamentos metodológicos del uso de lenguajes probabilísticos para identificar sitios web más relevantes o visitados. En segundo lugar se representa las sesiones web mediante grafos y gramáticas libres de contexto probabilísticas de tal forma que las sesiones que tengan mayor probabilidad son consideradas las más visitadas o más preferidas, por tanto las más relevantes en relación a un tópico determinado. Se pretende desarrollar una herramienta para procesamiento de sesiones web obtenidas a partir de log de servidor representado mediante gramáticas probabilísticas libres de contexto
Resumen en inglés One issue of real interest in the area of web data mining is to capture users’ activities during connection and extract behavior patterns that help define their preferences in order to improve the design of future pages adapting websites interfaces to individual users. This research is intended to provide, first of all, a presentation of the methodological foundations of the use of probabilistic languages to identify relevant or most visited websites. Secondly, the web sessions are represented by graphs and probabilistic context-free grammars so that the sessions that have the highest probabilities are considered the most visited and most preferred, therefore, the most important in relation to a particular topic. It aims to develop a tool for processing web sessions obtained from a log server represented by probabilistic context-free grammars
Disciplines Ciencias de la computación
Paraules clau: Procesamiento de datos,
Tecnología de la información,
Hipertexto,
Gramáticas probabilísticas,
Patrones de navegación,
Aprendizaje de máquinas,
Recuperación de información,
Minería de datos
Keyword: Computer science,
Data processing,
Information technology,
Hypertext,
Probabilistic grammars,
Navigation patterns,
Machine learning,
Information retrieval,
Data mining
Text complet: Texto completo (Ver HTML)