Clasificación de categorías de noticias usando BERT



Título del documento: Clasificación de categorías de noticias usando BERT
Revista: Innovación y software
Base de datos:
Número de sistema: 000545499
ISSN: 2708-0935
Autores: 1
1
1
Instituciones: 1Universidad La Salle, Arequipa. Perú
Año:
Volumen: 4
Número: 2
Paginación: 36-51
País: Perú
Idioma: Español
Tipo de documento: Artículo
Resumen en inglés The present project consists of developing a Natural Language Processing model to classify news using a set of data or DataSets already evaluated. The main objective is to create a system that can automatically identify and assign news to one of the predefined categories: business, entertainment, politics, sports or technology. This involves data preprocessing, feature extraction, training a machinelearning model and then evaluating its performance using metrics such as "accuracy", "recall 2" F1 - score". This will allow to determine how well the model can predict the correct category for a new or unlabeled news item. If the performance of the model is satisfactory, it can be used to classify unlabeled news in real time. In summary, it seeks to provide an efficient and accurate solution for organizing and labeling the informative content of a news item with the help of Artificial Intelligence.
Resumen en español El presente proyecto consiste en desarrollar un modelo de Procesamiento del Lenguaje Natural para clasificar noticias utilizando un conjunto de datos o DataSets ya evaluados. El objetivo principal es crear un sistema que pueda identificar y asignar automáticamente las noticias a una de las categorías predefinidas: negocios, entretenimiento, política, deportes o tecnología. Esto implica el preprocesamiento de datos, extracción de características, entrenamiento de un modelo de machine learning y posteriormente su evaluación de rendimiento utilizando métricas como" precisión"," recall 2" F1 − score". Esto permitir "a determinar que tan bien el modelo puede predecir la categoría correcta para una noticia nueva o no etiquetada. Si el rendimiento del modelo es satisfactorio, se puede utilizar para clasificar noticias no etiquetadas en tiempo real. En resumen, se busca proporcionar una solución eficiente y precisa para organizar y etiquetar el contenido informativo de una noticia con ayuda de la Inteligencia Artificial.
Disciplinas: Ciencias de la computación
Palabras clave: clasificacion de noticias,
procesamiento de lenguaje natural,
BERT,
machine learning,
inteligencia artificial,
Inteligencia artificial
Keyword: News classification,
natural language processing,
BERT,
machine learning,
artificial intelligence
Texto completo: Texto completo (Ver PDF) Texto completo (Ver HTML)