materias:pln:uba2018:practico1
Diferencias
Muestra las diferencias entre dos versiones de la página.
Ambos lados, revisión anteriorRevisión previaPróxima revisión | Revisión previa | ||
materias:pln:uba2018:practico1 [2018/02/07 21:54] – francolq | materias:pln:uba2018:practico1 [2018/08/10 03:03] (actual) – editor externo 127.0.0.1 | ||
---|---|---|---|
Línea 7: | Línea 7: | ||
* Repositorio: | * Repositorio: | ||
- | * Fecha de entrega: 15/2/2018 | + | * Fecha de entrega: |
Línea 36: | Línea 36: | ||
Documentación: | Documentación: | ||
- | | + | |
- | * http:// | + | |
- | * [[http:// | + | * [[http:// |
+ | * [[http:// | ||
* [[https:// | * [[https:// | ||
Línea 87: | Línea 88: | ||
$ nosetests languagemodeling/ | $ nosetests languagemodeling/ | ||
+ | |||
+ | |||
+ | Documentación: | ||
+ | |||
+ | * [[http:// | ||
+ | * [[http:// | ||
+ | (Course notes for NLP by Michael Collins, Columbia University)]] | ||
===== Ejercicio 3: Generación de Texto ===== | ===== Ejercicio 3: Generación de Texto ===== | ||
- | * Implementar en '' | + | * Implementar en '' |
- | * Programar un script '' | + | * Usar el script '' |
- | * Generar oraciones usando n-gramas con n en {1, 2, 3, 4}. Armar una figura similar a la Figura 4.3 de Jurafsky & Martin (2008). Incluirla en el README. | + | * Generar oraciones usando n-gramas con n en {1, 2, 3, 4}. Armar una figura similar a la [[https:// |
- | Funciones a implementar en '' | + | Funciones a implementar en '' |
<code python> | <code python> | ||
Línea 136: | Línea 144: | ||
Documentación: | Documentación: | ||
- | + | * [[http:// | |
- | * https:// | + | * [[https:// |
+ | * [[https:// | ||
Línea 145: | Línea 154: | ||
* La clase debe tener **la misma interfaz que '' | * La clase debe tener **la misma interfaz que '' | ||
* Calcular V como el tamaño del alfabeto incluyendo el marcador ''</ | * Calcular V como el tamaño del alfabeto incluyendo el marcador ''</ | ||
- | * Agregar al script de entrenamiento (train.py) una opción de línea de comandos que permita utilizar add-one en lugar de n-gramas clásicos. | + | * Agregar al script de entrenamiento ('' |
- | * Entrenar sobre nuestro corpus y guardar los modelos resultantes para varios valores de n (1, 2, 3 y 4). | + | |
Interfaz de la clase '' | Interfaz de la clase '' | ||
Línea 161: | Línea 169: | ||
""" | """ | ||
</ | </ | ||
+ | |||
+ | Tests: | ||
+ | |||
+ | $ nosetests languagemodeling/ | ||
+ | |||
+ | Documentación: | ||
+ | * [[http:// | ||
+ | |||
+ | |||
+ | ===== Ejercicio 5: Evaluación de Modelos de Lenguaje ===== | ||
+ | |||
+ | * Separar el corpus en entrenamiento y test (90% y 10% resp.). | ||
+ | * Usar el script '' | ||
+ | * Usar el script '' | ||
Nueva interfaz de '' | Nueva interfaz de '' | ||
Línea 181: | Línea 203: | ||
</ | </ | ||
- | Tests: | ||
- | | + | Interfaz de '' |
+ | |||
+ | < | ||
+ | $ python | ||
+ | Evaulate a language model using the test set. | ||
+ | |||
+ | Usage: | ||
+ | eval.py -i < | ||
+ | eval.py -h | --help | ||
+ | |||
+ | Options: | ||
+ | -i < | ||
+ | -h --help | ||
+ | </ | ||
- | ===== Ejercicio | + | ===== Ejercicio |
* Implementar el suavizado por interpolación en '' | * Implementar el suavizado por interpolación en '' | ||
* Calcular lambdas en términos de un único parámetro gamma (ver documentación abajo). | * Calcular lambdas en términos de un único parámetro gamma (ver documentación abajo). | ||
- | * Usar add-one para el nivel más bajo (unigramas). | + | |
* Usar datos held-out (un 10% de train) y barrido para elegir valor para gamma. | * Usar datos held-out (un 10% de train) y barrido para elegir valor para gamma. | ||
- | * Agregar al script de entrenamiento (train.py) una opción de línea de comandos que permita utilizar este modelo. | + | * Agregar al script de entrenamiento ('' |
* Calcular y reportar perplejidad para varios valores de '' | * Calcular y reportar perplejidad para varios valores de '' | ||
Línea 222: | Línea 256: | ||
* [[http:// | * [[http:// | ||
(Course notes for NLP by Michael Collins, Columbia University)]] | (Course notes for NLP by Michael Collins, Columbia University)]] | ||
+ | * **Especialmente** [[https:// | ||
* [[https:// | * [[https:// | ||
* [[https:// | * [[https:// | ||
+ | * [[http:// | ||
+ | * Mails: | ||
+ | * [[https:// | ||
+ | * [[https:// | ||
+ | * [[https:// | ||
- | ===== Ejercicio | + | ===== Ejercicio |
* Elegir y resolver uno de los dos ejercicios siguientes de Jurafsky & Martin (2008): | * Elegir y resolver uno de los dos ejercicios siguientes de Jurafsky & Martin (2008): |
materias/pln/uba2018/practico1.1518040463.txt.gz · Última modificación: 2018/08/10 03:03 (editor externo)