Integración de fuentes heterogéneas de datos textuales



Título del documento: Integración de fuentes heterogéneas de datos textuales
Revista: Polibits
Base de datos: PERIÓDICA
Número de sistema: 000383471
ISSN: 1870-9044
Autores: 1
2
1
1
2
Instituciones: 1Instituto Politécnico Nacional, Escuela Superior de Ingeniería Mecánica y Eléctrica, México, Distrito Federal. México
2Instituto Politécnico Nacional, Centro de Investigación en Computación, México, Distrito Federal. México
Año:
Periodo: Ene-Jun
Número: 51
Paginación: 19-25
País: México
Idioma: Español
Tipo de documento: Artículo
Enfoque: Aplicado, descriptivo
Resumen en español Se ha detectado que en algunas aplicaciones de integración de información de fuentes de datos, en algunos casos pueden ocurrir inconsistencias y en otros, se carece de una entidad para almacenar los datos. Algunas inconsistencias se deben a que los datos se expresan en diferente idioma al utilizado en el repositorio o por el uso de diferentes unidades de medida. En este artículo, la propuesta utiliza reglas en la integración de datos tratando de preservar la consistencia y en otros casos implican modificaciones al esquema. Se seleccionó el modelo orientado a objetos por sus características que facilitan la reutilización de clases. La base de datos de ejemplo utiliza datos obtenidos de fuentes heterogéneas de la Web pertenecientes al dominio de equipos de computación. En la integración, intervienen entidades, atributos, valores y unidades de medida. Esta propuesta se enfoca en el contenido que es una alternativa a la integración de esquemas de datos
Resumen en inglés This paper proposes an alternative to data integration from heterogeneous sources or databases. In some cases, inconsistencies may occur, and in others, the schema lacks of any attribute or entity to store the data. Some inconsistencies are consequence of using a language different with the one employed in the schema definition; others are due to the use of distinct units of measure. The object-oriented model provides characteristics that facilitate the class reuse and extension. The samples are obtained from heterogeneous Web sources belonging to the domain of computer equipment. Integration involves entities, attributes, values, and units of measurement
Disciplinas: Ciencias de la computación,
Bibliotecología y ciencia de la información
Palabras clave: Tecnología de la información,
Bases de datos,
Integración de datos,
Información compartida,
Intercambio de información,
Bases de datos orientadas a objetos
Keyword: Computer science,
Library and information science,
Information technology,
Data bases,
Data integration,
Information sharing,
Information exchange,
Object oriented databases
Texto completo: Texto completo (Ver HTML)