Detección de sarcasmo en Twitter a través de algoritmos de minería de datos para conocer la percepción sobre el COVID-19
Date
2021-06
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
“El sarcasmo verbal es un fenómeno lingüístico muy difícil de detectar en el idioma español en México por la gran variedad de palabras que existen. Este trabajo tiene como objetivo detectar sarcasmo en textos cortos sobre un conjunto de tuits en español extraídos de Twitter para identificar la percepción de los usuarios con respecto a la COVID-19 pandemia que actualmente se afronta. Para la recolección de tuits que forman el corpus se usan dos APIs de la plataforma Twitter Developer: Search Tweets y Stream Tweets in real-time, así como el lenguaje Python en conjunto se realiza la extracción de los datos. Se aplican técnicas de minería de datos, en particular algoritmos de clasificación automática, para determinar si un texto es o no sarcástico. Se realizan dos experimentos con distintos corpus y cada uno se prueba con cuatro algoritmos de clasificación: Random forest, Naive Bayes, J48 y LibSV. Finalmente, se calcula la medida F- measure para determinar el algoritmo y el corpus que presenta mejores resultados. Se determinó que los algoritmos con mejores resultados para detectar sarcasmo a partir de hashtags de tuits tienen una precisión de la métrica F-measure Random forest con 0.864 y J48 con 0.864”.
Description
Keywords
Citation
Collections
Document Viewer
Select a file to preview:
Can't see the file? Try reloading