Revista: | Innovación y software |
Base de datos: | |
Número de sistema: | 000545499 |
ISSN: | 2708-0935 |
Autores: | Machado Medina, Bradlhy Luis1 Santillana Quirita, César Alonso1 Bautista Luque, Sharmelyn Violeta1 |
Instituciones: | 1Universidad La Salle, Arequipa. Perú |
Año: | 2023 |
Volumen: | 4 |
Número: | 2 |
Paginación: | 36-51 |
País: | Perú |
Idioma: | Español |
Tipo de documento: | Artículo |
Resumen en inglés | The present project consists of developing a Natural Language Processing model to classify news using a set of data or DataSets already evaluated. The main objective is to create a system that can automatically identify and assign news to one of the predefined categories: business, entertainment, politics, sports or technology. This involves data preprocessing, feature extraction, training a machinelearning model and then evaluating its performance using metrics such as "accuracy", "recall 2" F1 - score". This will allow to determine how well the model can predict the correct category for a new or unlabeled news item. If the performance of the model is satisfactory, it can be used to classify unlabeled news in real time. In summary, it seeks to provide an efficient and accurate solution for organizing and labeling the informative content of a news item with the help of Artificial Intelligence. |
Resumen en español | El presente proyecto consiste en desarrollar un modelo de Procesamiento del Lenguaje Natural para clasificar noticias utilizando un conjunto de datos o DataSets ya evaluados. El objetivo principal es crear un sistema que pueda identificar y asignar automáticamente las noticias a una de las categorías predefinidas: negocios, entretenimiento, política, deportes o tecnología. Esto implica el preprocesamiento de datos, extracción de características, entrenamiento de un modelo de machine learning y posteriormente su evaluación de rendimiento utilizando métricas como" precisión"," recall 2" F1 − score". Esto permitir "a determinar que tan bien el modelo puede predecir la categoría correcta para una noticia nueva o no etiquetada. Si el rendimiento del modelo es satisfactorio, se puede utilizar para clasificar noticias no etiquetadas en tiempo real. En resumen, se busca proporcionar una solución eficiente y precisa para organizar y etiquetar el contenido informativo de una noticia con ayuda de la Inteligencia Artificial. |
Disciplinas: | Ciencias de la computación |
Palabras clave: | clasificacion de noticias, procesamiento de lenguaje natural, BERT, machine learning, inteligencia artificial, Inteligencia artificial |
Keyword: | News classification, natural language processing, BERT, machine learning, artificial intelligence |
Texto completo: | Texto completo (Ver PDF) Texto completo (Ver HTML) |