Análise de sentimentos em comentários de vídeos do YouTube utilizando aprendizagem de máquinas supervisionada



Document title: Análise de sentimentos em comentários de vídeos do YouTube utilizando aprendizagem de máquinas supervisionada
Journal: Ciencia da informacao
Database: CLASE
System number: 000509268
ISSN: 0100-1965
Authors:
1
Institutions: 1Universidade de Brasilia, Brasilia, Distrito Federal. Brasil
Year:
Season: Sep-Dic
Volumen: 48
Number: 3
Pages: 21-33
Country: Brasil
Language: Portugués
Document type: Artículo
Approach: Analítico, descriptivo
Spanish abstract En este documento se describe un conjunto de tres experimentos en el análisis de opiniones, específicamente para comentarios de texto en portugués brasileño, por un vídeo de YouTube. El paquete de minería de datos Weka se utiliza para el filtrado y un clasificador basado en el aprendizaje de máquinas supervisado (SMO). Los experimentos son diferenciados por el corpus a ser clasificado: el primero utiliza tres tipos de polaridad (positiva, negativa y neutra), el segundo y el tercer experimentos trabajan con dos clases (negativa y no negativa). En el tercer experimento, sólo se seleccionan los mensajes que comentan sobre una entidad específica (referente). Los resultados de Accuracy y F-Measure Average son considerablemente mejores para los experimentos que contienen dos clases. El tercer experimento alcanza valores alrededor del 81% para las dos medidas citadas, y sugiere que cuanto más entidades son comentadas en los discursos del corpus, más difícil sería la clasificación de polaridades
English abstract This paper describes a set of three experiments on sentiment analysis, specifically for texts in Brazilian Portuguese. The dataset is collected from comments about a video in YouTube. We use the data mining package Weka for filtering and a classifier based on supervised machine learning (SMO). Experiments are differentiated according to the corpus to be classified: the first experiment classified the texts into three categories of polarity (positive, negative and neutral), the second and third experiments classified in two classes (negative and non-negative). The input texts of the third experiment are about a unique entity (referent). The results of Accuracy and F-Measure Average are considerably better for experiments containing two classes. The third experiment reaches values around 81% for the two measures cited,and suggests that the more entities are commented on in the discourses of the corpus, the more difficult would be the classification of polarities
Portuguese abstract O artigo descreve um conjunto de três experimentos em análise de sentimentos, especificamente, para comentários textuais em português brasileiro e para um vídeo do YouTube. Utiliza-se o pacote de mineração de dados Weka para filtragem e um classificador baseado em aprendizagem de máquinas supervisionada (SMO). Os experimentos diferenciam-se pelo corpus a classificar: o primeiro utiliza três classes de polaridade (positiva, negativa e neutra), o segundo e o terceiro experimentos trabalham com duas classes (negativa e não negativa). No terceiro experimento são selecionadas somente postagens que comentam uma entidade (referente) específica. Os resultados de Acurácia e Medida-F Média são consideravelmente melhores para os experimentos contendo duas classes. O terceiro experimento atinge valores em volta de 81% para as duas medidas citadas, e sugere que quanto mais entidades são comentadas nos discursos do corpus, mais difícil seria a classificação de polaridades
Disciplines: Bibliotecología y ciencia de la información
Keyword: Información y sociedad,
Tecnología de la información,
YouTube,
Análisis de sentimientos,
Portugués brasileño,
Aprendizaje de máquina,
Videos
Full text: http://revista.ibict.br/ciinf/article/view/4315/4287