Diferencias

Muestra las diferencias entre dos versiones de la página.

--- materias:pln:uba2018:practico2_draft [2018/02/14 01:42] – francolq
+++ materias:pln:uba2018:practico2_draft [2018/08/10 03:03] (actual) – editor externo 127.0.0.1
@@ Línea 39: / Línea 39: @@
     * Cantidad de veces que aparece (frecuencia), y porcentaje del total.
     * Cinco palabras más frecuentes con esa etiqueta.
-    * En el README, agregar a mano una breve descripción del significado de la etiqueta.
+    * **En el README, agregar a mano una breve descripción del significado de la etiqueta.**
   * Niveles de ambigüedad de las palabras: Una figura similar a la Figura 5.10 de Jurafsky & Martin (2008). Para cada nivel de ambigüedad (de 1 a 9) mostrar:
     * Cantidad de palabras y porcentaje del total.
@@ Línea 59: / Línea 59: @@
   * Programar un etiquetador baseline, que elija para cada palabra su etiqueta más frecuente observada en entrenamiento.
-  * Para las palabras desconocidas, devolver la etiqueta 'nc0s000'.
+  * Para las palabras desconocidas, devolver la etiqueta 'nc0s000' (nombre común singular).
+  * Entrenar y evaluar el modelo baseline del ejercicio anterior. Reportar los resultados en el README.
+  * **Bonus**: Graficar la matriz de confusión como un mapa de calor (ver documentación abajo).
 Interfaz de ''BaselineTagger'' en  ''baseline.py'':
@@ Línea 93: / Línea 95: @@
   $ nosetests tagging/tests/test_baseline.py
-===== Ejercicio 3: Entrenamiento y Evaluación de Taggers =====
-  * Programar un script ''train.py'' que permita entrenar un etiquetador baseline.
-  * Programar un script ''eval.py'' que permita evaluar un modelo de tagging. Calcular:
-    * //Accuracy//, esto es, el porcentaje de etiquetas correctas.
-    * //Accuracy// sobre las palabras conocidas y sobre las palabras desconocidas.
-    * Matriz de confusión, como se explica en la sección 5.7.1 (//Error Analysis//) de Jurafsky & Martin.
-  * Entrenar y evaluar el modelo baseline del ejercicio anterior. Reportar los resultados en el README.
-  * **Bonus**: Graficar la matriz de confusión como un mapa de calor (ver documentación abajo).
 Ejemplo de uso de los scripts:
@@ Línea 115: / Línea 106: @@
-===== Ejercicio 4: Features para Etiquetado de Secuencias =====
+===== Ejercicio 3: Features para Etiquetado de Secuencias =====
   * Implementar en ''features.py'' los siguientes features básicos:
@@ Línea 168: / Línea 159: @@
-===== Ejercicio 5: Maximum Entropy Markov Models =====
+===== Ejercicio 4: Maximum Entropy Markov Models =====
   * Implementar un MEMM con el siguiente //pipeline// de scikit-learn:
@@ Línea 254: / Línea 245: @@
-===== Ejercicio 6 (punto bonus): Algoritmo de Viterbi para MEMMs (con Beam)  =====
+===== Ejercicio 5 (punto bonus): Algoritmo de Viterbi para MEMMs (con Beam)  =====
 Implementar el algoritmo de Viterbi para obtener la secuencia de tags de máxima probabilidad de acuerdo a un MEMM: