Uso de Técnicas de Mineração de Dados para a Identificação Automática de Beneficiários Propensos ao Diabetes Mellitus Tipo 2



Document title: Uso de Técnicas de Mineração de Dados para a Identificação Automática de Beneficiários Propensos ao Diabetes Mellitus Tipo 2
Journal: Informacao & informacao
Database: CLASE
System number: 000438231
ISSN: 1981-8920
Authors: 1
1
1
Institutions: 1Pontificia Universidade Catolica do Parana, Curitiba, Parana. Brasil
Year:
Season: Sep-Dic
Volumen: 20
Number: 3
Pages: 274-296
Country: Brasil
Language: Portugués
Document type: Artículo
Approach: Analítico, descriptivo
Spanish abstract Introducción: Las empresas de salud almacenan una gran cantidad de datos objetivando fundamentalmente el control administrativo, pagos de las facturas médicas, etc., no habiendo obligatoriedad de completar datos clínicos epidemiológicos, entre ellos el CID – Código Internacional de Enfermedades. Este tipo de práctica dificulta la identificación de posibles enfermedades de sus beneficiarios, a partir de la utilización de técnicas de extracción de informaciones tradicionales, y consecuentemente, la implantación de programas de prevención de enfermedades y de promoción de la salud. Objetivo: Por lo tanto, este artículo propone un modelo basado en la utilización de técnicas de minería de datos para la identificación automática de beneficiarios con propensión a enfermedades crónicas. Metodología: Metodológicamente ese modelo comprende las siguientes etapas: identificación inicial de las variables y respectivos análisis; selección de las variables a ser utilizadas y preparadas; minería de datos y validación de las reglas descubiertas por especialistas. Objetivando probar el método propuesto fue realizado un experimento dirigido al reconocimiento de individuos con propensión a la diabetes mellitus tipo 2. Resultados: Para el proceso de minería de datos fueron seleccionadas 12 variables, considerando un conjunto de 43.375 beneficiarios, y descubiertas 843 reglas, con una tasa de acierto de 88,9%. Conclusión: De entre ellas 843 reglas fueron seleccionadas nueve para ser evaluadas por cuatro especialistas. Esa evaluación concluyó por la eficacia del modelo, con un grado de concordancia del orden de 89,6%
English abstract Introduction: The Health Industry companies store a vast amount of data in order to support administrative tasks like payment of medical bills, but filling out epidemiological data (International Classification of Diseases - ICD) is not mandatory. This makes it difficult to identify the persons’ illness using standard data extraction techniques as well as implementing preventive programs. Objective: This paper proposes a data mining model that identifies automatically the patients with chronic illnesses. Method: The proposed method is comprised of the following steps: initial identification of the variables and their analysis; variable selection; data mining and rule validation by experts. An experiment, for identifying the patients with propensity for diabetes type 2, was designed to validate the methodology. Results: For the data mining process, 12 variables were selected, targeting 43.375 patients: 843 rules were discovered, with a 88,9% success rate.Conclusion: From the 843 rules, six were selected to be evaluated by four experts: they considered the model efficient, with an 89.6% rate of positive results
Portuguese abstract Introdução: As empresas de saúde armazenam uma grande quantidade de dados visando fundamentalmente o controle administrativo, pagamentos das contas médicas, etc., não havendo obrigatoriedade do preenchimento de dados clínicos epidemiológicos, entre os quais o CID – Código Internacional de Doenças. Este tipo de prática dificulta a identificação de possíveis enfermidades de seus beneficiários, a partir da utilização de técnicas de extração de informação tradicionais, e consequentemente, a implantação de programas de prevenção de doenças e de promoção da saúde. Objetivo: Portanto, esse artigo propõe um modelo baseado em técnicas de mineração de dados para a identificação automática de beneficiários com propensão a doenças crônicas. Metodologia: Metodologicamente esse modelo compreende as seguintes etapas: identificação inicial das variáveis e respectivas análises; seleção das variáveis a serem utilizadas e preparadas; mineração de dados e validação das regras descobertas por especialistas. Objetivando testar o modelo proposto foi realizado um experimento voltado ao reconhecimento de indivíduos com propensão ao diabetes mellitus tipo 2. Resultados: Para o processo de mineração de dados foram selecionadas 12 variáveis, considerando um conjunto de 43.375 beneficiários, sendo descobertas 843 regras, com uma taxa de acerto de 88,9%. Dentre essas 843 regras foram selecionadas seis para serem avaliadas por quatro especialistas. Conclusões: Essa avaliação concluiu pela eficácia do modelo, com um grau de concordância da ordem de 89,6%
Disciplines: Bibliotecología y ciencia de la información,
Medicina
Keyword: Sistemas de información,
Salud pública,
Endocrinología,
Diabetes mellitus,
Minería de datos,
Beneficiarios
Full text: Texto completo (Ver HTML)