ZoomBooks Smart: Sistema Digital para la Recuperación de Información relevante a escuelas de nivel medio superior



Título del documento: ZoomBooks Smart: Sistema Digital para la Recuperación de Información relevante a escuelas de nivel medio superior
Revista: Programación matemática y software
Base de datos:
Número de sistema: 000573232
ISSN: 2007-3283
Autores: 1
2
1
1
3
3
Instituciones: 1Universidad Tecnológica de Izúcar de Matamoros, Departamento de Tecnologías de la Información,
2Benemérita Universidad Autónoma de Puebla, Facultad en Ciencias de la Computación,
3Universidad Autónoma de Tlaxcala, Facultad de Ciencias Básicas, Ingeniería y Tecnología,
Año:
Volumen: 12
Número: 2
Paginación: 1-13
País: México
Idioma: Español
Resumen en inglés This article presents a proposal for the construction of the ZoomBooks-Smart framework prototype, based on an offline-oriented Information Recovery System (SRI-offline) for the storage and retrieval of documents relevant to the curricular load of students upper level, especially for high school graduates of the three Mixtecas in the state of PueblaMexico that lack digital information resources. The methodology proposed for its implementation is based on the Extended Boolean (BE) model for recovery, in addition to applying machine learning to recommend readings to users based on their profiles, and Natural Language Processing (PLN) techniques for the treaty Automatic specific tasks such as n-gram phrase suggestions and query expansion. As a result, the system has the functionality to store semi-automatically, documents in PDF format (portable document format) that are relevant to the different subjects of the curriculum load of students or other users in the academic environment, and of this from can be retrieved in order of relevance query-document, through free text queries.
Resumen en español En este artículo se presenta una propuesta para la construcción del prototipo de software ZoomBooks Smart, basado en un Sistema de Recuperación de Información orientado a sinconexión (SRI- off line) para el almacenamiento y recuperación de documentos relevantes a la carga curricular de los estudiantes de nivel medio superior, especialmente para los bachilleratos apartados de las tres Mixtecas de la República Mexicana que carecen de recursos de información digitales. La metodología planteada para su implementación tiene como base el modelo Booleano Extendido (BE) para la recuperación, además de aplicar aprendizaje automático para recomendar lecturas a los usuarios con base en sus perfiles, y técnicas del Procesamiento del Lenguaje Natural (PLN) para el tratado automático de tareas específicas como las sugerencias de frases mediante n-gramas y la expansión de consultas. Se presenta un primer prototipo de software que tiene la funcionalidad de almacenar, de manera semiautomática los documentos en formato PDF (formato de documento portátil) que son relevantes a las diferentes asignaturas de la carga curricular de los estudiantes u otros usuarios en el ambiente académico. Los documentos pueden ser recuperados en orden de relevancia consulta-documento, mediante consultas de texto libre.
Palabras clave: Modelo booleano extendido,
recuperación de información,
aprendizaje automático,
máquina de búsqueda
Keyword: Extended boolean model,
information retrieval,
machine learning,
search engine
Texto completo: Texto completo (Ver PDF)