Herramientas de usuario

Herramientas del sitio


materias:pln:2019:practico2_draft

Diferencias

Muestra las diferencias entre dos versiones de la página.

Enlace a la vista de comparación

Ambos lados, revisión anteriorRevisión previa
Próxima revisión
Revisión previa
materias:pln:2019:practico2_draft [2019/04/01 13:37] francolqmaterias:pln:2019:practico2_draft [2019/04/01 19:00] (actual) francolq
Línea 28: Línea 28:
 ===== Ejercicio 1: Corpus de Tweets: Estadísticas Básicas ===== ===== Ejercicio 1: Corpus de Tweets: Estadísticas Básicas =====
  
-El corpus InterTASS se compone de un conjunto de tweets en español, cada uno anotado con su polaridad general. Los valores posibles para la polaridad son los siguientes:+Los corpus InterTASS 2018 se componen de conjuntos de tweets en español, cada uno anotado con su polaridad general. Los valores posibles para la polaridad son los siguientes:
  
   * ''P'': Polaridad positiva.   * ''P'': Polaridad positiva.
Línea 37: Línea 37:
 Puede encontrar una descripción más detallada del significado de cada etiqueta en [[https://cs.famaf.unc.edu.ar/~francolq/criterios_polaridad.pdf|este documento]]. Puede encontrar una descripción más detallada del significado de cada etiqueta en [[https://cs.famaf.unc.edu.ar/~francolq/criterios_polaridad.pdf|este documento]].
  
-Programar un script ''stats.py'' que muestre las siguientes estadísticas básicas de la sección de entrenamiento del corpus InterTASS, y **por separado** para la sección de entrenamiento del corpus GeneralTASS:+En InterTASS 2018 se proveen corpus de entrenamiento, desarrollo y evaluación para tweets de tres países: España, Costa Rica y Perú. 
 + 
 +Programar un script ''stats.py'' que muestre las siguientes estadísticas básicas de la sección de entrenamiento del corpus InterTASS:
  
   * Cantidad total de tweets.   * Cantidad total de tweets.
   * Cantidad de tweets por cada valor de polaridad (''P'', ''N'', ''NEG'' y ''NONE'').   * Cantidad de tweets por cada valor de polaridad (''P'', ''N'', ''NEG'' y ''NONE'').
 +
 +Imprimir estas estadísticas para los tres corpus de InterTASS 2018.
  
 Documentación: Documentación:
  
-  * [[http://www.sepln.org/workshops/tass/2017/|TASS Workshop 2017]]+  * TASS: 
 +    * [[http://www.sepln.org/workshops/tass/2018/task-1|TASS 2018 Task 1]] 
 +      * [[http://www.sepln.org/workshops/tass/2018/task-1/private/evaluation/evaluate.php|Resultados]] 
 +    * [[https://competitions.codalab.org/competitions/21957|TASS 2019]]
   * [[https://cs.famaf.unc.edu.ar/~francolq/criterios_polaridad.pdf|Etiquetado de polaridad]]   * [[https://cs.famaf.unc.edu.ar/~francolq/criterios_polaridad.pdf|Etiquetado de polaridad]]
-  * [[http://nbviewer.ipython.org/url/cs.famaf.unc.edu.ar/~francolq/An%C3%A1lisis%20de%20Sentimiento.ipynb|Jupyter notebook: Análisis de Sentimiento]]+  * [[https://github.com/PLN-FaMAF/PLN-2019/blob/master/notebooks/04%20An%C3%A1lisis%20de%20Sentimiento.ipynb|Jupyter notebook: Análisis de Sentimiento (ejemplo visto en clase)]] 
 +  * [[https://github.com/DiploDatos/AprendizajeSupervisado/tree/master/sentiment|Caso de Estudio: Sentiment Analysis (Diplomatura Ciencias de Datos)]]
  
  
materias/pln/2019/practico2_draft.1554125821.txt.gz · Última modificación: 2019/04/01 13:37 por francolq