materias:pln:uba2018:practico2_draft
Diferencias
Muestra las diferencias entre dos versiones de la página.
Ambos lados, revisión anteriorRevisión previaPróxima revisión | Revisión previa | ||
materias:pln:uba2018:practico2_draft [2018/02/14 01:42] – francolq | materias:pln:uba2018:practico2_draft [2018/08/10 03:03] (actual) – editor externo 127.0.0.1 | ||
---|---|---|---|
Línea 39: | Línea 39: | ||
* Cantidad de veces que aparece (frecuencia), | * Cantidad de veces que aparece (frecuencia), | ||
* Cinco palabras más frecuentes con esa etiqueta. | * Cinco palabras más frecuentes con esa etiqueta. | ||
- | * En el README, agregar a mano una breve descripción del significado de la etiqueta. | + | |
* Niveles de ambigüedad de las palabras: Una figura similar a la Figura 5.10 de Jurafsky & Martin (2008). Para cada nivel de ambigüedad (de 1 a 9) mostrar: | * Niveles de ambigüedad de las palabras: Una figura similar a la Figura 5.10 de Jurafsky & Martin (2008). Para cada nivel de ambigüedad (de 1 a 9) mostrar: | ||
* Cantidad de palabras y porcentaje del total. | * Cantidad de palabras y porcentaje del total. | ||
Línea 59: | Línea 59: | ||
* Programar un etiquetador baseline, que elija para cada palabra su etiqueta más frecuente observada en entrenamiento. | * Programar un etiquetador baseline, que elija para cada palabra su etiqueta más frecuente observada en entrenamiento. | ||
- | * Para las palabras desconocidas, | + | * Para las palabras desconocidas, |
+ | * Entrenar y evaluar el modelo baseline del ejercicio anterior. Reportar los resultados en el README. | ||
+ | * **Bonus**: Graficar la matriz de confusión como un mapa de calor (ver documentación abajo). | ||
Interfaz de '' | Interfaz de '' | ||
Línea 93: | Línea 95: | ||
$ nosetests tagging/ | $ nosetests tagging/ | ||
- | |||
- | |||
- | ===== Ejercicio 3: Entrenamiento y Evaluación de Taggers ===== | ||
- | |||
- | * Programar un script '' | ||
- | * Programar un script '' | ||
- | * // | ||
- | * // | ||
- | * Matriz de confusión, como se explica en la sección 5.7.1 (//Error Analysis//) de Jurafsky & Martin. | ||
- | * Entrenar y evaluar el modelo baseline del ejercicio anterior. Reportar los resultados en el README. | ||
- | * **Bonus**: Graficar la matriz de confusión como un mapa de calor (ver documentación abajo). | ||
Ejemplo de uso de los scripts: | Ejemplo de uso de los scripts: | ||
Línea 115: | Línea 106: | ||
- | ===== Ejercicio | + | ===== Ejercicio |
* Implementar en '' | * Implementar en '' | ||
Línea 168: | Línea 159: | ||
- | ===== Ejercicio | + | ===== Ejercicio |
* Implementar un MEMM con el siguiente // | * Implementar un MEMM con el siguiente // | ||
Línea 254: | Línea 245: | ||
- | ===== Ejercicio | + | ===== Ejercicio |
Implementar el algoritmo de Viterbi para obtener la secuencia de tags de máxima probabilidad de acuerdo a un MEMM: | Implementar el algoritmo de Viterbi para obtener la secuencia de tags de máxima probabilidad de acuerdo a un MEMM: |
materias/pln/uba2018/practico2_draft.1518572564.txt.gz · Última modificación: 2018/08/10 03:03 (editor externo)