Minería de uso Web aplicada a registros de navegación por Internet



Document title: Minería de uso Web aplicada a registros de navegación por Internet
Journal: Revista cubana de ingeniería
Database: PERIÓDICA
System number: 000362548
ISSN: 2223-1781
Authors: 1
2
3
3
Institutions: 1Universidad de las Ciencias Informáticas, Departamento de Programación e Ingeniería de Software, La Habana. Cuba
2Instituto Superior Politécnico "José Antonio Echeverría", Facultad de Ingeniería Informática, La Habana. Cuba
3Instituto de Cibernética Matemática y Física, Departamento de Matemática, La Habana. Cuba
Year:
Season: Sep-Dic
Volumen: 3
Number: 3
Pages: 57-64
Country: Cuba
Language: Español
Document type: Artículo
Approach: Aplicado, descriptivo
Spanish abstract En el trabajo se describe un proceso de Descubrimiento de Conocimiento en Bases de Datos (KDD en sus siglas en inglés) realizado en el entorno de los registros de navegación por Internet en la Universidad de las Ciencias Informáticas. En este contexto, se detalla un proceso de Minería de Uso Web utilizando como fuentes de datos los registros de navegación por Internet archivados en el servidor proxy, así como información descriptiva de los usuarios del servicio de navegación alojada en los sistemas de gestión del personal de la institución. Se combinan técnicas estadísticas, numéricas y de agrupamiento con vistas a identificar grupos similares de usuarios en el uso de las cuotas de navegación por Internet y de esta forma apoyar en la toma de decisiones a la Dirección de Redes y Seguridad Informática u otras direcciones de la universidad. Se describen los métodos y técnicas utilizadas, así como el procedimiento definido para llevar a cabo la tarea descriptiva de agrupamiento. En el mismo se propone un nuevo uso de la descomposición matricial CUR para identificar el número posible de grupos a identificar por el algoritmo de agrupamiento k-medoides. Por último, se muestran los experimentos realizados, la evaluación de los grupos obtenidos, además de ejemplos de algunos de los patrones obtenidos, y de esta forma apoyar actividades orientadas a la gestión y seguridad del servicio de navegación por Internet
English abstract This paper presents a Knowledge Discovery on Databases (KDD) process applied on the internet surfing logs at the University of Informatics Sciences. In this context, it describes a Web-Usage Mining process using as data sources; the internet surfing logs stored by the proxy server, and also descriptive information regarding the users of such surfing service, which was provided by the institution’s personnel management systems. Statistical, numerical and clustering techniques were combined seeking to identify user groups with similar internet surfing account usage, in hopes of providing important information for decision making processes carried out by the Network Management and Security Office or other areas of the institution. This paper describes the methods and techniques used, and the procedure utilized for performing the descriptive clustering task. This procedure proposes the use of the CUR matricial decomposition to identify the possible number of groups to identify by the k-medoides clustering algorithm. Lastly, the experiments carried out and the evaluations of the groups obtained are described and examples of some of the patterns obtained are presented
Disciplines: Ciencias de la computación,
Bibliotecología y ciencia de la información
Keyword: Análisis y sistematización de la información,
Registros de navegación,
Internet,
Minería de datos
Keyword: Computer science,
Library and information science,
Information analysis,
Navigation records,
Internet,
Data mining
Full text: Texto completo (Ver PDF)