Detección de sarcasmo en Twitter a través de algoritmos de minería de datos para conocer la percepción sobre el COVID-19

Hernández Guerrero, Adriana

Detección de sarcasmo en Twitter a través de algoritmos de minería de datos para conocer la percepción sobre el COVID-19

Files

20210726143205-0387-TL.pdf (2.05 MB)

Date

2021-06

Authors

Hernández Guerrero, Adriana

Abstract

“El sarcasmo verbal es un fenómeno lingüístico muy difícil de detectar en el idioma español en México por la gran variedad de palabras que existen. Este trabajo tiene como objetivo detectar sarcasmo en textos cortos sobre un conjunto de tuits en español extraídos de Twitter para identificar la percepción de los usuarios con respecto a la COVID-19 pandemia que actualmente se afronta. Para la recolección de tuits que forman el corpus se usan dos APIs de la plataforma Twitter Developer: Search Tweets y Stream Tweets in real-time, así como el lenguaje Python en conjunto se realiza la extracción de los datos. Se aplican técnicas de minería de datos, en particular algoritmos de clasificación automática, para determinar si un texto es o no sarcástico. Se realizan dos experimentos con distintos corpus y cada uno se prueba con cuatro algoritmos de clasificación: Random forest, Naive Bayes, J48 y LibSV. Finalmente, se calcula la medida F- measure para determinar el algoritmo y el corpus que presenta mejores resultados. Se determinó que los algoritmos con mejores resultados para detectar sarcasmo a partir de hashtags de tuits tienen una precisión de la métrica F-measure Random forest con 0.864 y J48 con 0.864”.

URI

https://hdl.handle.net/20.500.12371/14657

Collections

Tesis de Licenciatura

Full item page

Document Viewer

Select a file to preview:

Can't see the file? Try reloading