Three-Step method to tightly integrate data mining tasks into a relational database system



Título del documento: Three-Step method to tightly integrate data mining tasks into a relational database system
Revista: Ingeniería y competitividad
Base de datos: PERIÓDICA
Número de sistema: 000421023
ISSN: 0123-3033
Autores: 1
Instituciones: 1Universidad de Nariño, Facultad de Ingeniería, San Juan de Pasto, Nariño. Colombia
Año:
Volumen: 15
Número: 2
Paginación: 125-136
País: Colombia
Idioma: Inglés
Tipo de documento: Artículo
Enfoque: Aplicado, descriptivo
Resumen en español En este artículo se presenta uno de los resultados del proyecto de investigación cuyo objetivo fue definir nuevos operadores algebraicos y nuevas primitivas SQL para el Descubrimiento de Conocimiento en una arquitectura fuertemente acoplada con un Sistema Gestor de Bases de Datos Relacional (SGBDR). Se propone el método trespasos con el fin de facilitar el acoplamiento fuerte y soportar tareas de minería de datos al interior del motor de un SGBDR. En el primer paso, se extiende el álgebra relacional con nuevos operadores algebraicos que faciliten los procesos computacionales más costosos de las tareas de minería de datos. En el siguiente paso y con el fin de que el lenguaje SQL sea relacionalmente completo, estos operadores son definidos como nuevas primitivas SQL en la cláusula SELECT. En el último paso, estas primitivas son unificadas en un nuevo operador SQL que ejecuta una tarea específica de minería de datos. Aplicando este método, se definieron nuevos operadores algebraicos, nuevas primitivas y operadores SQL para las tareas de Asociación y Clasificación y fueron implementados al interior del motor del SGBD PostgreSQL, dotándolo de la capacidad para descubrir reglas de asociación y clasificación eficientemente
Resumen en inglés In this paper, a result of the research project that aimed to define new algebraic operators and new SQL primitives for knowledge discovery in a tightly coupled architecture with a Relational Database Management System (RDBMS) is presented. In order to facilitate the tight coupling and to support the data mining tasks into the RDBMS engine, the three-step approach is proposed. In the first step, the relational algebra is extended with new algebraic operators to facilitate more expensive computationally processes of data mining tasks. In the next step and with the aim that the SQL language is relationally complete, these operators are defined as new primitives in the SELECT clause. In the last step, these primitives are unified into new SQL operator that runs a specific data mining task. Applying this method, new algebraic operators, new SQL primitives and new SQL operators for association and classification tasks were defined and were implemented into the PostgreSQL DBMS engine, giving it the capacity to discover association and classification rules efficiently
Disciplinas: Ciencias de la computación
Palabras clave: Bases de datos,
Tecnología de la información,
Minería de datos,
Acoplamiento fuerte,
Bases de datos relacionales
Keyword: Databases,
Information technology,
Data mining,
Tight coupling,
Relational data bases
Texto completo: Texto completo (Ver PDF)