Detección de sarcasmo en Twitter a través de algoritmos de minería de datos para conocer la percepción sobre el COVID-19
dc.audience | generalPublic | es_MX |
dc.contributor | Denicia Carral, María Claudia | |
dc.contributor | Ballinas Hernández, Ana Luisa | |
dc.contributor.advisor | BALLINAS HERNANDEZ, ANA LUISA; 266291 | |
dc.contributor.author | Hernández Guerrero, Adriana | |
dc.date.accessioned | 2021-10-09T05:36:32Z | |
dc.date.available | 2021-10-09T05:36:32Z | |
dc.date.issued | 2021-06 | |
dc.description.abstract | “El sarcasmo verbal es un fenómeno lingüístico muy difícil de detectar en el idioma español en México por la gran variedad de palabras que existen. Este trabajo tiene como objetivo detectar sarcasmo en textos cortos sobre un conjunto de tuits en español extraídos de Twitter para identificar la percepción de los usuarios con respecto a la COVID-19 pandemia que actualmente se afronta. Para la recolección de tuits que forman el corpus se usan dos APIs de la plataforma Twitter Developer: Search Tweets y Stream Tweets in real-time, así como el lenguaje Python en conjunto se realiza la extracción de los datos. Se aplican técnicas de minería de datos, en particular algoritmos de clasificación automática, para determinar si un texto es o no sarcástico. Se realizan dos experimentos con distintos corpus y cada uno se prueba con cuatro algoritmos de clasificación: Random forest, Naive Bayes, J48 y LibSV. Finalmente, se calcula la medida F- measure para determinar el algoritmo y el corpus que presenta mejores resultados. Se determinó que los algoritmos con mejores resultados para detectar sarcasmo a partir de hashtags de tuits tienen una precisión de la métrica F-measure Random forest con 0.864 y J48 con 0.864”. | es_MX |
dc.folio | 20210726143205-0387-TL | es_MX |
dc.format | es_MX | |
dc.identificator | 7 | es_MX |
dc.identifier.uri | https://hdl.handle.net/20.500.12371/14657 | |
dc.language.iso | spa | es_MX |
dc.matricula.creator | 201665974 | es_MX |
dc.rights.acces | openAccess | es_MX |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0 | es_MX |
dc.subject.classification | INGENIERÍA Y TECNOLOGÍA | es_MX |
dc.subject.lcc | Sociolingüística | es_MX |
dc.subject.lcc | Lingüística computacional | es_MX |
dc.subject.lcc | Análisis del discurso | es_MX |
dc.subject.lcc | Algoritmos computacionales | es_MX |
dc.subject.lcc | Opinión pública | es_MX |
dc.thesis.career | Licenciatura en Ingeniería en Sistemas y Tecnologías de la Información Industrial | es_MX |
dc.thesis.degreediscipline | Área de Ingeniería y Ciencias Exactas | es_MX |
dc.thesis.degreegrantor | Complejo Regional Centro | es_MX |
dc.thesis.degreegrantor | Complejo Regional Centro | es_MX |
dc.thesis.degreetoobtain | Licenciado (a) Ingeniero (a) en Sistemas y Tecnologías de Información Industrial | es_MX |
dc.title | Detección de sarcasmo en Twitter a través de algoritmos de minería de datos para conocer la percepción sobre el COVID-19 | es_MX |
dc.type | Tesis de licenciatura | es_MX |
dc.type.conacyt | bachelorThesis | es_MX |
dc.type.degree | Licenciatura | es_MX |
Files
Original bundle
1 - 2 of 2
Loading...
- Name:
- 20210726143205-0387-TL.pdf
- Size:
- 2.05 MB
- Format:
- Adobe Portable Document Format
- Description:
- Name:
- 20210726143205-0387-CARTA.pdf
- Size:
- 773.97 KB
- Format:
- Adobe Portable Document Format
- Description:
License bundle
1 - 1 of 1
- Name:
- license.txt
- Size:
- 1.71 KB
- Format:
- Item-specific license agreed upon to submission
- Description: