Integración de fuentes heterogéneas de datos textuales



Document title: Integración de fuentes heterogéneas de datos textuales
Journal: Polibits
Database: PERIÓDICA
System number: 000383471
ISSN: 1870-9044
Authors: 1
2
1
1
2
Institutions: 1Instituto Politécnico Nacional, Escuela Superior de Ingeniería Mecánica y Eléctrica, México, Distrito Federal. México
2Instituto Politécnico Nacional, Centro de Investigación en Computación, México, Distrito Federal. México
Year:
Season: Ene-Jun
Number: 51
Pages: 19-25
Country: México
Language: Español
Document type: Artículo
Approach: Aplicado, descriptivo
Spanish abstract Se ha detectado que en algunas aplicaciones de integración de información de fuentes de datos, en algunos casos pueden ocurrir inconsistencias y en otros, se carece de una entidad para almacenar los datos. Algunas inconsistencias se deben a que los datos se expresan en diferente idioma al utilizado en el repositorio o por el uso de diferentes unidades de medida. En este artículo, la propuesta utiliza reglas en la integración de datos tratando de preservar la consistencia y en otros casos implican modificaciones al esquema. Se seleccionó el modelo orientado a objetos por sus características que facilitan la reutilización de clases. La base de datos de ejemplo utiliza datos obtenidos de fuentes heterogéneas de la Web pertenecientes al dominio de equipos de computación. En la integración, intervienen entidades, atributos, valores y unidades de medida. Esta propuesta se enfoca en el contenido que es una alternativa a la integración de esquemas de datos
English abstract This paper proposes an alternative to data integration from heterogeneous sources or databases. In some cases, inconsistencies may occur, and in others, the schema lacks of any attribute or entity to store the data. Some inconsistencies are consequence of using a language different with the one employed in the schema definition; others are due to the use of distinct units of measure. The object-oriented model provides characteristics that facilitate the class reuse and extension. The samples are obtained from heterogeneous Web sources belonging to the domain of computer equipment. Integration involves entities, attributes, values, and units of measurement
Disciplines: Ciencias de la computación,
Bibliotecología y ciencia de la información
Keyword: Tecnología de la información,
Bases de datos,
Integración de datos,
Información compartida,
Intercambio de información,
Bases de datos orientadas a objetos
Keyword: Computer science,
Library and information science,
Information technology,
Data bases,
Data integration,
Information sharing,
Information exchange,
Object oriented databases
Full text: Texto completo (Ver HTML)