Procesamiento digital de imágenes en la creación de prototipo de sistema inteligente para detección y reconocimiento de texto en etiquetas de conductores eléctricos recubiertos



Título del documento: Procesamiento digital de imágenes en la creación de prototipo de sistema inteligente para detección y reconocimiento de texto en etiquetas de conductores eléctricos recubiertos
Revista: Latin-American Journal of Computing (LAJC)
Base de datos: PERIÓDICA
Número de sistema: 000456834
ISSN: 1390-9134
Autores: 1
2
Instituciones: 1Centro de Tecnología Avanzada A.C., Departamento de proyectos de automatización, San Luis Potosí. México
2Centro de Tecnología Avanzada A.C., Departamento de Informática, Control y Electrónica, Hidalgo. México
Año:
Periodo: Jul-Dic
Volumen: 7
Número: 2
Paginación: 92-107
País: Ecuador
Idioma: Español
Tipo de documento: Artículo
Enfoque: Aplicado, descriptivo
Resumen en español El etiquetado del cable permite identificar distintas configuraciones y lotes de cables, así como conocer sus características. En el proceso de etiquetado del cable se pueden presentar distintos tipos de errores o defectos en el texto impreso, por ejemplo: ausencia de la etiqueta, corrimiento de la tinta, partes del texto faltante, texto ilegible y gotas de tinta. En este trabajo se presenta un prototipo de sistema para la validación del texto en cables eléctricos mediante técnicas de procesamiento de imágenes. El sistema propuesto integra dos etapas. En la primera etapa se propuso un método basado en clusterización por K-means que permite realizar el preprocesado de las imágenes para acondicionarlas. En la segunda etapa se realiza el reconocimiento óptico de caracteres utilizando el motor Tesseract OCR, el cual permite convertir el texto contenido en las imágenes en cadenas de caracteres. La experimentación se realizó utilizando una colección de 909 imágenes de cables eléctricos que contiene ocho tipos diferentes de cables, donde las imágenes están etiquetadas individualmente con la ground truth. La experimentación realizada permitió obtener una tasa de error promedio del 6.54%, 3.97% y 2.53% al validar el texto empleando tres, cinco y siete secuencias de etiquetas, respectivamente
Resumen en inglés Cable labeling allows identifying different configurations and batches of cables, as well as their characteristics. In the cable labeling process, different types of errors or defects can occur in the printed text, such as the absence of the label, ink bleeding, text parts missing, illegible text, and ink drops. In this paper, a prototype of a system for text validation in electrical cables using image processing techniques is presented. The proposed system consists of two stages. In the first stage, a method based on K-means clustering was proposed, allowing preprocessing images to condition them. In the second stage, optical character recognition using the Tesseract OCR engine is performed, allowing the text in the images to be converted into character strings. The experimentation was carried out using a collection of 909 images of electrical cables containing eight different types of cables, where the images are individually labeled with the ground truth. The evaluation obtained an average error rate of 6.54%, 3.97%, and 2.53% when validating the text using three, five, and seven label sequences, respectively
Disciplinas: Ciencias de la computación
Palabras clave: Inteligencia artificial,
Procesamiento de datos,
Programación,
Detección de texto,
Sistemas inteligentes,
Procesamiento digital de imágenes,
K-means,
Reconocimiento óptico de caracteres,
Conductores eléctricos
Keyword: Artificial intelligence,
Data processing,
Programming,
Text detection,
Intelligent systems,
Digital image processing,
K-means,
Optical character recognition,
Electric conductors
Texto completo: Texto completo (Ver PDF)