Minería de uso Web aplicada a registros de navegación por Internet



Título del documento: Minería de uso Web aplicada a registros de navegación por Internet
Revista: Revista cubana de ingeniería
Base de datos: PERIÓDICA
Número de sistema: 000362548
ISSN: 2223-1781
Autores: 1
2
3
3
Instituciones: 1Universidad de las Ciencias Informáticas, Departamento de Programación e Ingeniería de Software, La Habana. Cuba
2Instituto Superior Politécnico "José Antonio Echeverría", Facultad de Ingeniería Informática, La Habana. Cuba
3Instituto de Cibernética Matemática y Física, Departamento de Matemática, La Habana. Cuba
Año:
Periodo: Sep-Dic
Volumen: 3
Número: 3
Paginación: 57-64
País: Cuba
Idioma: Español
Tipo de documento: Artículo
Enfoque: Aplicado, descriptivo
Resumen en español En el trabajo se describe un proceso de Descubrimiento de Conocimiento en Bases de Datos (KDD en sus siglas en inglés) realizado en el entorno de los registros de navegación por Internet en la Universidad de las Ciencias Informáticas. En este contexto, se detalla un proceso de Minería de Uso Web utilizando como fuentes de datos los registros de navegación por Internet archivados en el servidor proxy, así como información descriptiva de los usuarios del servicio de navegación alojada en los sistemas de gestión del personal de la institución. Se combinan técnicas estadísticas, numéricas y de agrupamiento con vistas a identificar grupos similares de usuarios en el uso de las cuotas de navegación por Internet y de esta forma apoyar en la toma de decisiones a la Dirección de Redes y Seguridad Informática u otras direcciones de la universidad. Se describen los métodos y técnicas utilizadas, así como el procedimiento definido para llevar a cabo la tarea descriptiva de agrupamiento. En el mismo se propone un nuevo uso de la descomposición matricial CUR para identificar el número posible de grupos a identificar por el algoritmo de agrupamiento k-medoides. Por último, se muestran los experimentos realizados, la evaluación de los grupos obtenidos, además de ejemplos de algunos de los patrones obtenidos, y de esta forma apoyar actividades orientadas a la gestión y seguridad del servicio de navegación por Internet
Resumen en inglés This paper presents a Knowledge Discovery on Databases (KDD) process applied on the internet surfing logs at the University of Informatics Sciences. In this context, it describes a Web-Usage Mining process using as data sources; the internet surfing logs stored by the proxy server, and also descriptive information regarding the users of such surfing service, which was provided by the institution’s personnel management systems. Statistical, numerical and clustering techniques were combined seeking to identify user groups with similar internet surfing account usage, in hopes of providing important information for decision making processes carried out by the Network Management and Security Office or other areas of the institution. This paper describes the methods and techniques used, and the procedure utilized for performing the descriptive clustering task. This procedure proposes the use of the CUR matricial decomposition to identify the possible number of groups to identify by the k-medoides clustering algorithm. Lastly, the experiments carried out and the evaluations of the groups obtained are described and examples of some of the patterns obtained are presented
Disciplinas: Ciencias de la computación,
Bibliotecología y ciencia de la información
Palabras clave: Análisis y sistematización de la información,
Registros de navegación,
Internet,
Minería de datos
Keyword: Computer science,
Library and information science,
Information analysis,
Navigation records,
Internet,
Data mining
Texto completo: Texto completo (Ver PDF)