Image Annotation as Text-Image Matching: Challenge Design and Results



Título del documento: Image Annotation as Text-Image Matching: Challenge Design and Results
Revista: Computación y Sistemas
Base de datos: PERIÓDICA
Número de sistema: 000456982
ISSN: 1405-5546
Autores: 1
2
3
4
4
5
5
5
5
6
6
6
6
6
Instituciones: 1Universidad Autónoma de Baja California, Facultad de Ciencias, Ensenada, Baja California. México
2Instituto Tecnológico y de Estudios Superiores de Monterrey, Escuela de Ingeniería y Ciencias, Puebla. México
3Universidad Michoacana de San Nicolás de Hidalgo, Morelia, Michoacán. México
4Instituto Tecnológico y de Estudios Superiores de Monterrey, Escuela de Ingeniería y Ciencias, Ciudad López Mateos. México
5Consejo Nacional de Ciencia y Tecnología, Ciudad de México. México
6Instituto Nacional de Astrofísica, Optica y Electrónica, Departamento de Informática, Tonantzintla, Puebla. México
Año:
Periodo: Oct-Dic
Volumen: 23
Número: 4
Paginación: 1305-1321
País: México
Idioma: Inglés
Tipo de documento: Artículo
Enfoque: Descriptivo, crítico
Resumen en inglés This paper describes the design of the 2017 RedICA: Text-Image Matching (RICATIM) challenge, including the dataset generation, a complete analysis of results, and the descriptions of the top-ranked developed methods. The academic challenge explores the feasibility of a novel binary image classification scenario, where each instance corresponds to the concatenation of learned representations of an image and a word. Instances are labeled as positive if the word is relevant for describing the visual content of the image, and negative otherwise. This novel approach of the image classification problem poses an alternative scenario where any text-image pair can be represented in such space, so any word could be considered for describing an image. The proposed methods are diverse and competitive, showing considerable improvements over the proposed baselines
Disciplinas: Ciencias de la computación
Palabras clave: Inteligencia artificial,
Procesamiento de datos,
Programación,
Coincidencia texto-imagen,
Anotaciones,
Procesamiento de información,
Multimodalidad,
Desafíos académicos
Keyword: Artificial intelligence,
Data processing,
Programming,
Text-image matching,
Annotations,
Information processing,
Multimodality,
Academic challenges
Texto completo: Texto completo (Ver HTML) Texto completo (Ver PDF)